Objectius generals:
Descripció general de data science i el machine learning a escala.
Descripció general de l’ecosistema Hadoop.
Treballar amb dades HDFS i taules de Hive mitjançant Hue.
Introducció a Cloudera Data Science Workbench.
Descripció general d’Apache Spark 2.
Llegir i escriure dades.
Inspeccionar la qualitat de les dades.
Neteja i transformació de dades.
Resumir i agrupar dades.
Combinar, dividir i remodelar dades.
Exploració de dades.
Configuració, monitoratge i solució de problemes d’aplicacions Spark.
Descripció general del machine learning en Spark MLlib.
Extracció, transformació i selecció de característiques.
Construcció i avaluació de models de regressió.
Construcció i avaluació de models de classificació.
Construcció i avaluació de models d’agrupació.
Models de validació creuada i hiperparámetros d’ajust.
Construcció de pipelines de machine learning.
Desplegament de models de machine learning.
CARACTERÍSTIQUES DEL CURS
Modalitat: Presencial i Online
Tipus: Formació especialitzada
Durada: 28h
Sector: Transversal
Course Features
- Lectures 0
- Quizzes 0
- Duration Lifetime access
- Skill level All levels
- Students 0
- Assessments Yes