UP

Big Data Management, Technologies and Analytics

Màster Presencial.

Continguts

2a EDICIÓ
UPC School

Matèries

Data Management
12 ECTS. 72 hores lectives.

1. Motivació.
- Context. La societat de les dades i el paradigma data-driven.
- Casos d'ús.
- Cloud computing i l'Enginyeria de Serveis (XaaS).
- La necessitat d'un canvi de paradigma: NOSQL.

2. Principis bàsics de les bases de dades no relacionals (NOSQL).
- Fonaments arquitectònics.
- Nous models de dades.

3. Fonaments: noves arquitectures.
- Conceptes bàsics.
- One size does not fit all.
- Gestió i processament distribuït de les dades.
- Gestió i processament de les dades a memòria.
- Principals arquitectures de referència.

4. Fonaments: nous models de dades.
- Conceptes bàsics.
- Models de dades no estructurats o semi-estructurats.
- Principals models de dades al món NOSQL: Key-Value, Document-oriented, Graphs, Graphs Semantics i Streams.
- Modelització de dades avançada (per sistemes no relacionals).

5. Principals Famílies de Gestors NOSQL.
- Gestors Key-Value.
* Concepte i principis.
* L'ecosistema Hadoop: HDFS, HBase, MapReduce i Spark.
* Consideracions específiques de modelització.

- Gestors Document-oriented.
* Concepte i principis.
* Exemple: MongoDB i l'Aggregation Framework.
* Consideracions específiques de modelització.

- Gestors Column-oriented.
* Concepte i Principis.
* Example: Kudu (base de dades) i Parquet (fitxers).
* Consideracions específiques de modelització

- Gestors de Grafs.
* Conceptes i principis.
* Tipus de grafs i operacions.
* Exemple: Neo4J i Cypher.
* Consideracions específiques de modelització.

- Gestors de Grafs Semàntics.
* Concepte i Principis: el paradigma Open/Linked Data.
* Com obrir dades.
* Arquitectures basades en grafs vs tecnología relacional.
* RDF i SPARQL.
* Consideracions específiques de modelització.

6. Integració de dades.
- Processos intensius de dades i ETLs.
- Polystores i sistemes políglots.
- Orquestradors: Muskeeter.

7. Visualització.
- Processos de visualització.
- Tècniques de visutalització.

Data Analytics
12 ECTS. 72 hores lectives.
1. Introducció.
- Què és el knowledge discovery?
- Estadística bàsica.
- Introducció a R.

2. Pre-processament de dades.
- Neteja i adequació de les dades.
- Transformacions.

3. Tècniques bàsiques d'anàlisi.
- Regressió múltiple.
- Profiling.

4. Anàlisi Multivariant.
- Anàlisi de components principals.
- Clustering.
- Arbres de decisió.

5. Aprenentatge Automàtic.
- Concepte.
- Fonaments matemàtics.

6. Principals tècniques d'aprenentatge automàtic.
- Regles d'associació.
- Mètodes lineals supervisats.
- Xarxes neuronals.
- Màquines de vector suport.
- Boscos aleatoritzats.

7. Processament del text.
- Pre-processament i preparació de les dades.
- Principals tècniques de text analítics.
- Information retrieval.

8. Anàlisi de sèries temporals.
- Pre-processament i preparació de les dades.
- Forecasting.
- Detecció d'outliers.

9. Anàlisi de les dades avançats.
- Paquets d'R per al processament paral·lel.
- R sobre bases de dades relacionals.
- Anàlisi de les dades en entorns distribuïts emprant HDFS i Spark.
* Spark R.
Hands-on Experience: Data Maganement and Analytics
16 ECTS. 96 hores lectives.
1. Infraestructura.
- Introducció als entorns Cloud.
- Virtualització.
- Serveis Oracle.

2. Emmagatzemament distribuït.
- L'Ecosistema Hadoop.
- Sistemes Key-Value: HBase.

3. Processament distribuït.
- MapReduce.
- Spark.
* SparkSQL.
* Spark Streaming .
* Spark Graphs.

- Anàlisi de dades en entorns distribuïts.
* MLlib.
* SparkR.

4. Document Stores.
- MongoDB.
- ElasticSearch.

5. Bases de dades en graf.
- Neo4J.
- Grafs semàntics: GraphDB i SPARQL.

6. Arquitectura de sistemes Big Data.
Negoci i Emprenedoria en Big Data
5 ECTS. 33 hores lectives.
1. Introducció: L'entorn competitiu de l'empresa i Big Data.
- Big Data Landscape.

2. Casos d'èxit.

3. Tècniques d'ideació de negoci.
- Clients i usuaris.
- Definició de productes i serveis.

4. Eines de modelització de negoci: Business Model Canvas.
- Elements que el conformen.
- Casos pràctics.
- Resolució casos: Twitter, Facebook, etc.

5. Procés de finançament.
- Finances.
- Finançament privat.
* Business Angels.
* Capital Risk.

- Finançament públic.

6. Màrqueting.

7. Creació d'una empresa.
- Aspectes legals.
* Regulació de les dades.

- Aspectes econòmics.

8. Consideracions ètiques del Big Data: Negoci i Privacitat.

9. Presentacions i pitch.
Projecte
15 ECTS. 45 hores lectives.
1. Gestió de projectes.
- Metodologies àgils
- Consideracions específiques per a Big Data

2. Presentació del projecte.

3. Sessions de seguiment del projecte.
La UPC School es reserva el dret de modificar el contingut del programa, que pot variar per a una major adaptació als objectius del curs.
Inicia la preinscripció
Sol·licita informació
Enviar
(34) 93 114 68 05

Crèdits:
60 ECTS
(318 hores lectives)

Dates de realització:
Inici classes:08/10/2018 Fi classes:12/07/2019Fi programa: 08/11/2019
Horari:
Dilluns  18:00 a 21:00Dimecres  18:00 a 21:00Divendres  18:00 a 21:00
Lloc de realització:
Facultat d'Informàtica de Barcelona (FIB)
C/ Jordi Girona, 1-3
Barcelona

Import de la matrícula:
8.500 €

Idioma d'impartició:
Espanyol

Inscripció oberta fins l'inici del curs o fins l'exhauriment de places.

Descarregar en PDF | 866,30 kB
Imprimeix tot el curs