UP

Big Data Management, Technologies and Analytics

Máster Presencial.

Contenidos

2ª EDICIÓN
UPC School

Materias

Data Management
12 ECTS. 72 horas lectivas.
1. Motivación.
- Contexto. La sociedad de los datos y el paradigma data-driven.
- Casos de uso.
- Cloud computing e Ingeniería de Servicios (XaaS).
- La necesidad de un cambio de paradigma: NOSQL.

2. Principios básicos de las bases de datos no relacionales (NOSQL).
- Fundamentos arquitectónicos.
- Nuevos modelos de datos.

3. Fundamentos: nuevas arquitecturas.
- Conceptos básicos.
- One size does not fit all.
- Gestión y procesamiento distribuido de los datos.
- Gestión y procesamiento de los datos en memoria.
- Principales arquitecturas de referencia.

4. Fundamentos: nuevos modelos de datos.
- Conceptos básicos.
- Modelos de datos no estructurados o semi-estructurados.
- Principales modelos de datos en el mundo NOSQL: Key-Value, Document-oriented, Graphs, Graphs Semantics i Streams.
- Modelización de datos avanzada (para sistemas no relacionales).

5. Principales Families de Gestores NOSQL.
- Gestores Key-Value.
* Concepto y principios.
* El ecosistema Hadoop: HDFS, HBase, MapReduce y Spark.
* Consideraciones específicas de modelización.

- Gestores Document-oriented.
* Concepto y principios.
* Ejemplo: MongoDB y Aggregation Framework.
* Consideraciones específicas de modelización.

- Gestores Column-oriented.
* Concepto y Principios. 
* Ejemplo: Kudu (base de datos) y Parquet (ficheros).
* Consideraciones específicas de modelización.

- Gestores de Grafos.
* Conceptos y principios.
* Tipos de grafos y operaciones.
* Ejemplo: Neo4J y Cypher.
* Consideraciones específicas de modelización.

- Gestores de Grafos Semánticos.
* Concepto y Principios: el paradigma Open/Linked Data.
* Como abrir los datos.
* Arquitecturas basadas en grafos vs tecnología relacional.
* RDF y SPARQL.
* Consideraciones específicas de modelización.

6. Integración de datos.
- Procesos intensivos de datos y ETLs.
- Polystores y sistemas políglotas.
- Orquestadores: Muskeeter.

7. Visualización.
- Procesos de visualización.
- Técnicas de visualización.
Data Analytics
12 ECTS. 72 horas lectivas.
1. Introducción.
- ¿Qué es el knowledge discovery?
- Estadística básica.
- Introducción a R.

2. Pre-procesamiento de datos.
- Limpieza y adecuación de los datos.
- Transformaciones.

3. Técniques básicas de análisis.
- Regresión múltiple.
- Profiling.

4. Análisis Multivariante.
- Análisis de componentes principales.
- Clustering.
- Árboles de decisión.

5. Aprendizaje Automático.
- Concepto.
- Fundamentos matemáticos.

6. Principales técnicas de aprendizaje automático.
- Reglas de asociación.
- Métodos lineales supervisados.
- Redes neuronales.
- Máquinas de vector soporte.
- Bosques aleatorios.

7. Procesamiento de texto.
- Pre-procesamiento y preparación de los datos.
- Principales técnicas de texto analíticas.
- Information retrieval.

8. Análisis de series temporales.
- Pre-procesamiento y preparación de les datos.
- Forecasting.
- Detección de outliers.

9. Análisis de los datos avanzados.
- Paquetes de R para el procesamiento paralelo.
- R sobre bases de datos relacionales.
- Análisis de los datos en entornos distribuidos utilizando HDFS y Spark.
* Spark R.
Hands-on Experience: Data Maganement and Analytics
16 ECTS. 96 horas lectivas.
1. Infraestructura.
- Introducción a los entornos Cloud.
- Virtualización.
- Servicios Oracle.

2. Almacenamiento distribuido.
- El Ecosistema Hadoop.
- Sistemas Key-Value: HBase.

3. Procesamiento distribuido.
- MapReduce.
- Spark.
* SparkSQL.
* Spark Streaming.
* Spark Graphs.

- Análisis de datos en entornos distribuidos.
* MLlib.
* SparkR.

4. Document Stores.
- MongoDB.
- ElasticSearch.

5. Bases de datos en grafo.
- Neo4J.
- Grafos semánticos: GraphDB y SPARQL.

6. Arquitectura de sistemas Big Data.
Negocio y Emprendimiento en Big Data
5 ECTS. 33 horas lectivas.
1. Introducción: El entorno competitivo de la empresa y Big Data.
- Big Data Landscape.

2. Casos de éxito.

3. Técnicas de ideación de negocio.
- Clientes y usuarios.
- Definición de productos y servicios.

4. Herramientas de modelización de negocio: Business Model Canvas.
- Elementos que lo conforman.
- Casos prácticos.
- Resolución casos: Twitter, Facebook, etc.

5. Proceso de financiación.
- Finanzas.
- Financiación privada.
* Business Angels.
* Capital Risk.

- Financiación pública.

6. Márqueting.

7. Creación de una empresa.
- Aspectos legales.
* Regulación de los datos.

- Aspectos económicos.

8. Consideraciones éticas del Big Data: Negocio y Privacidad.

9. Presentaciones y pitch.
Proyecto
15 ECTS. 45 horas lectivas.
1. Gestión de proyectos.
- Metodologías ágiles.
- Consideraciones específicas para Big Data.

2. Presentación del proyecto.

3. Sesiones de seguimiento del proyecto.
La UPC School se reserva el derecho de modificar el contenido del programa, que puede variar para una mayor adaptación a los objetivos del curso.
Inicia la preinscripción
Solicita información
Enviar
(34) 93 114 68 05

Créditos:
60 ECTS
(318 horas lectivas)

Fechas de realización:
Inicio clases:08/10/2018 Fin clases:12/07/2019Fin programa: 08/11/2019
Horario:
Lunes  18:00 a 21:00Miércoles  18:00 a 21:00Viernes  18:00 a 21:00
Lugar de realización:
Facultat d'Informàtica de Barcelona (FIB)
C/ Jordi Girona, 1-3
Barcelona

Importe de la matrícula:
8.500 €

Idioma de impartición:
Español

Inscripción abierta hasta el inicio del curso o hasta el agotamiento de plazas.

Descargar en PDF | 866,30 kB
Imprime todo el curso