Skip to content

tharikf/PySpark_KingCounty

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 

Repository files navigation

Projeto - PySpark

Neste projeto, optei por utilizar a ferramenta PySpark para processamento de dados em paralelo. Apliquei técnicas de análise descritiva, engenharia de atributos e treinamento de modelos de machine learning. O projeto teve como inspiração outro trabalho realizado com pandas, numpy e scikit-learn, que pode ser acessado em https://github.com/tharikf/Projeto_King_County.