Back

Aprèn a analitzar les dades a escala amb Spark i Hadoop

61. Apren a analitzar les dades a escala amb Spark i Hadoop
Free

Objectius generals:

Descripció general de data science i el machine learning a escala.
Descripció general de l’ecosistema Hadoop.
Treballar amb dades HDFS i taules de Hive mitjançant Hue.
Introducció a Cloudera Data Science Workbench.
Descripció general d’Apache Spark 2.
Llegir i escriure dades.
Inspeccionar la qualitat de les dades.
Neteja i transformació de dades.
Resumir i agrupar dades.
Combinar, dividir i remodelar dades.
Exploració de dades.
Configuració, monitoratge i solució de problemes d’aplicacions Spark.
Descripció general del machine learning en Spark MLlib.
Extracció, transformació i selecció de característiques.
Construcció i avaluació de models de regressió.
Construcció i avaluació de models de classificació.
Construcció i avaluació de models d’agrupació.
Models de validació creuada i hiperparámetros d’ajust.
Construcció de pipelines de machine learning.
Desplegament de models de machine learning.

CARACTERÍSTIQUES DEL CURS

Modalitat: Presencial i Online
Tipus: Formació especialitzada
Durada: 28h
Sector: Transversal

Course Features

  • Lectures 0
  • Quizzes 0
  • Duration Lifetime access
  • Skill level All levels
  • Students 0
  • Assessments Yes
CIDAI Cursos