Objectius generals:
Conèixer com l’ecosistema de codi obert d’eines Big Data aborda reptes que no poden abastar els
RDBMSs tradicionals.
Saber utilitzar d’Apache Hive i Apache Impala per proporcionar accés mitjançant l’ús de SQL a les dades.
Saber la sintaxi i els formats de dades que utilitzen Hive i Impala, incloent les funcions i les subconsultes.
Crear, modificar i esborrar taules, vistes i bases de dades, carregar dades i guardar els resultats en
consultes.
Crear i utilitzar particions i diferents tipus d’arxius.
Combinar dos o més datasets amb l’ús de JOIN o UNION segons sigui convenient.
Comprendre les funcions analítiques, les funcions de finestra i ús d’ambdues.
Emmagatzemar i consultar estructures de dades complexes o niades.
Processar i analitzar dades semi-estructurats o no estructurades.
Conèixer tècniques per a l’optimització de les consultes en Hive i Impala.
Estendre les capacitats de Hive i Impala amb la utilització de paràmetres, formats personalitzats
d’arxius, SerDes i scripts externs.
Determinar si Hive, Impala, 1 RDBMS o una combinació de tots ells és el millor per a una tasca
determinada.
CARACTERÍSTIQUES DEL CURS
Modalitat: Presencial
Tipus: Formació especialitzada
Durada: 60h
Sector: Transversal
Localització: Barcelona
Course Features
- Lectures 0
- Quizzes 0
- Duration Lifetime access
- Skill level All levels
- Students 0
- Assessments Yes