- Level Professional
- Course by Universitat Autònoma de Barcelona
-
Offered by
About
¿Estás interesado en tener un conocimiento más detallado sobre las herramientas y aplicaciones Big Data? En este curso aprenderás los principios para comprender la terminología, conceptos básicos y herramientas más importantes para resolver problemas de análisis de datos enfocándonos en los problemas y las aplicaciones. El objetivo es proporcionar una visión de sistema para entender los retos más importantes que nos encontramos cuando trabajamos en entornos con grandes volúmenes de datos. En el curso se plantea una introducción a diversas herramientas utilizadas de forma común en la comunidad como Hadoop, Spark o Hive y tendrás que resolver diferentes retos de análisis de datos mediante su uso. Al terminar el curso habrás adquirido conocimientos sobre el ecosistema de herramientas Big Data incluyendo ejemplos de uso con problemas industriales y científicos. Tendrás una serie de recursos sobre cómo un análisis a realizar se traduce en una serie de operaciones de recolección de datos, monitorización, almacenamiento, análisis y creación de informes sobre los resultados obtenidos. También adquirirás un criterio para elegir cuál es la herramienta más adecuada para resolver un cierto problema de análisis de datos a partir de los requerimientos de uso de las herramientas. El curso está orientado tanto a estudiantes universitarios de primeros cursos de estudios universitarios relacionados con la informática, la ingeniería o las matemáticas, como a otros estudiantes con conocimientos de programación, interesados en aprender cómo utilizar de análisis de datos con herramientas de código abierto. Para realizar los ejercicios es necesario utilizar una máquina virtual que deberá ser instalada en tu ordenador.Modules
LA ESPECIALIZACIÓN BIG DATA - USO PRÁCTICO DE DATOS MASIVOS
1
Videos
- Presentación de la especialización
ANTES DE COMENZAR EL CURSO
8
Readings
- BIENVENIDA
- Contenidos del curso (Temario)
- Organización del curso y evaluación
- Resolver dudas e incidencias
- Preguntas frecuentes: generales
- Preguntas frecuentes: certificado
- Preguntas frecuentes: cuestionarios
- Links relacionados
Vídeos
4
Videos
- Introducción
- Instalación de la máquina virtual - Import start
- Instalación de la máquina virtual - Tips
- Instalación de la máquina virtual - Pyspark setup
4
Readings
- Link para la descarga de la MV_Cloudera
- Instalación de la MV - Import start
- Instalación de la MV - Tips
- Instalación de la MV - Pyspark set up
Sección de vídeos
6
Videos
- Introducción
- El ecosistema Hadoop
- Modelo Map Reduce
- HDFS: Hadoop Distributed File System
- Arquitectura HDFS
- YARN: Yet Another Resource Negotiator
Sección de ejercicios/cuestionarios
2
Assignment
- Cuestionario ecosistema Hadoop
- Ejercicio práctico Hadoop y HDFS
1
Videos
- HADOOP
1
Readings
- LEEME
Sección de vídeos
7
Videos
- Introducción
- Tipos de datos
- Tecnologías SQL y NoSQL
- Consistencia, fiabilidad y escalabilidad
- Tecnologías de BBDD NoSQL I
- Tecnologías de BBDD NoSQL II
- Introducción a BBDD analíticas y orientadas a grafos
Sección de ejercicios/cuestionarios
1
Assignment
- Bases de datos NoSQL
Sección de vídeos
5
Videos
- Introducción
- Adquisición de datos
- Apache Flume
- Apache Sqoop
- Apache Kafka
Sección de ejercicios/cuestionarios
2
Assignment
- Adquisición de datos
- Ejercicio práctico Apache Sqoop
1
Videos
- SQOOP
1
Readings
- LEEME
Sección de vídeos
8
Videos
- Introducción
- Bases de datos analíticas
- Business Intelligence
- Apache Impala
- Apache Hive
- Apache Spark
- Graph processing (I)
- Graph processing (II)
Sección de ejercicios/cuestionarios
3
Assignment
- Bases de datos analíticas
- Ejercicio Apache Hive
- Ejercicio sesión básica con Apache Spark
2
Videos
- HIVE
- SPARK
1
Readings
- LEEME
Auto Summary
"Big Data: adquisición y almacenamiento de datos" is an essential course for those keen on mastering Big Data tools and applications. Led by Coursera, the course delves into Hadoop, Spark, and Hive, equipping you with the skills to tackle data analysis challenges. Ideal for university students and programming enthusiasts, it offers insights into data collection, storage, and analysis. Subscription options include Starter and Professional levels.

Antonio Espinosa

Tomás Margalef

Andrés Cencerrado