UP

Big Data Management, Technologies and Analytics

Máster Presencial.

Contenidos

2ª EDICIÓN
UPC School

Asignaturas

Data Management
12 ECTS. 72 horas lectivas.
1. Motivación.
- Contexto. La sociedad de los datos y el paradigma data-driven.
- Casos de uso.
- Cloud computing e Ingeniería de Servicios (XaaS).
- La necesidad de un cambio de paradigma: NOSQL.

2. Principios básicos de las bases de datos no relacionales (NOSQL).
- Fundamentos arquitectónicos.
- Nuevos modelos de datos.

3. Fundamentos: nuevas arquitecturas.
- Conceptos básicos.
- One size does not fit all.
- Gestión y procesamiento distribuido de los datos.
- Gestión y procesamiento de los datos en memoria.
- Principales arquitecturas de referencia.

4. Fundamentos: nuevos modelos de datos.
- Conceptos básicos.
- Modelos de datos no estructurados o semi-estructurados.
- Principales modelos de datos en el mundo NOSQL: Key-Value, Document-oriented, Graphs, Graphs Semantics i Streams.
- Modelización de datos avanzada (para sistemas no relacionales).

5. Principales Families de Gestores NOSQL.
- Gestores Key-Value.
* Concepto y principios.
* El ecosistema Hadoop: HDFS, HBase, MapReduce y Spark.
* Consideraciones específicas de modelización.

- Gestores Document-oriented.
* Concepto y principios.
* Ejemplo: MongoDB y Aggregation Framework.
* Consideraciones específicas de modelización.

- Gestores Column-oriented.
* Concepto y Principios. 
* Ejemplo: Kudu (base de datos) y Parquet (ficheros).
* Consideraciones específicas de modelización.

- Gestores de Grafos.
* Conceptos y principios.
* Tipos de grafos y operaciones.
* Ejemplo: Neo4J y Cypher.
* Consideraciones específicas de modelización.

- Gestores de Grafos Semánticos.
* Concepto y Principios: el paradigma Open/Linked Data.
* Como abrir los datos.
* Arquitecturas basadas en grafos vs tecnología relacional.
* RDF y SPARQL.
* Consideraciones específicas de modelización.

6. Integración de datos.
- Procesos intensivos de datos y ETLs.
- Polystores y sistemas políglotas.
- Orquestadores: Muskeeter.

7. Visualización.
- Procesos de visualización.
- Técnicas de visualización.
Data Analytics
12 ECTS. 72 horas lectivas.
1. Introducción.
- ¿Qué es el knowledge discovery?
- Estadística básica.
- Introducción a R.

2. Pre-procesamiento de datos.
- Limpieza y adecuación de los datos.
- Transformaciones.

3. Técniques básicas de análisis.
- Regresión múltiple.
- Profiling.

4. Análisis Multivariante.
- Análisis de componentes principales.
- Clustering.
- Árboles de decisión.

5. Aprendizaje Automático.
- Concepto.
- Fundamentos matemáticos.

6. Principales técnicas de aprendizaje automático.
- Reglas de asociación.
- Métodos lineales supervisados.
- Redes neuronales.
- Máquinas de vector soporte.
- Bosques aleatorios.

7. Procesamiento de texto.
- Pre-procesamiento y preparación de los datos.
- Principales técnicas de texto analíticas.
- Information retrieval.

8. Análisis de series temporales.
- Pre-procesamiento y preparación de les datos.
- Forecasting.
- Detección de outliers.

9. Análisis de los datos avanzados.
- Paquetes de R para el procesamiento paralelo.
- R sobre bases de datos relacionales.
- Análisis de los datos en entornos distribuidos utilizando HDFS y Spark.
* Spark R.
Hands-on Experience: Data Maganement and Analytics
16 ECTS. 96 horas lectivas.
1. Infraestructura.
- Introducción a los entornos Cloud.
- Virtualización.
- Servicios Oracle.

2. Almacenamiento distribuido.
- El Ecosistema Hadoop.
- Sistemas Key-Value: HBase.

3. Procesamiento distribuido.
- MapReduce.
- Spark.
* SparkSQL.
* Spark Streaming.
* Spark Graphs.

- Análisis de datos en entornos distribuidos.
* MLlib.
* SparkR.

4. Document Stores.
- MongoDB.
- ElasticSearch.

5. Bases de datos en grafo.
- Neo4J.
- Grafos semánticos: GraphDB y SPARQL.

6. Arquitectura de sistemas Big Data.
Negocio y Emprendimiento en Big Data
5 ECTS. 33 horas lectivas.
1. Introducción: El entorno competitivo de la empresa y Big Data.
- Big Data Landscape.

2. Casos de éxito.

3. Técnicas de ideación de negocio.
- Clientes y usuarios.
- Definición de productos y servicios.

4. Herramientas de modelización de negocio: Business Model Canvas.
- Elementos que lo conforman.
- Casos prácticos.
- Resolución casos: Twitter, Facebook, etc.

5. Proceso de financiación.
- Finanzas.
- Financiación privada.
* Business Angels.
* Capital Risk.

- Financiación pública.

6. Márqueting.

7. Creación de una empresa.
- Aspectos legales.
* Regulación de los datos.

- Aspectos económicos.

8. Consideraciones éticas del Big Data: Negocio y Privacidad.

9. Presentaciones y pitch.
Proyecto
15 ECTS. 45 horas lectivas.
1. Gestión de proyectos.
- Metodologías ágiles.
- Consideraciones específicas para Big Data.

2. Presentación del proyecto.

3. Sesiones de seguimiento del proyecto.
Solicita información
Enviar
(34) 93 114 68 05

INFORMACIÓN EDICIÓN 2018-19

Próxima edición:
Octubre de 2019

Créditos:
60 ECTS
(318 horas lectivas)

Horario:
Lunes  18:00 a 21:00Miércoles  18:00 a 21:00Viernes  18:00 a 21:00
Lugar de realización:
Facultat d'Informàtica de Barcelona (FIB)
C/ Jordi Girona, 1-3
Barcelona

Importe de la matrícula:
8.500 €

Idioma de impartición:
Español

Descargar en PDF | 866,30 kB
Imprime todo el curso