|
Docente
|
CARDELLINI VALERIA
(programma)
Introduzione ai Big Data: motivazioni, problemi e sfide. Storage di Big Data: file system distribuiti, database NoSQL e database NewSQL; casi di studio: HDFS, Dynamo, Bigtable, HBase, Cassandra, and Neo4j. Laboratorio: HDFS, Redis, MongoDB, HBase, Neo4j. Sistemi per l’acquisizione ed il caricamento di Big data; sistemi pub/sub, code di messaggi, sistemi di raccolta; casi di studio: Kafka, Flume, Nifi, e Sqoop. Laboratorio: Kafka. Sistemi per il processamento batch. Casi di studio: Hadoop, Pig, Hive, Spark. Laboratorio: Hadoop, Spark, Spark SQL. Sistemi per il processamento di flussi di dati. Casi di studio: Spark Streaming, Storm, Flink, Heron, Samza. Architetture avanzate per il processamento congiunto. Laboratorio: Storm, Spark Streaming, Kafka Streaming. Applicazioni di Big Data: design pattern, analisi di applicazioni esistenti. Servizi Cloud per Big data (piattaforme AWS e GCP). Framework per la gestione delle risorse di un cluster per Big Data; casi di studio: Mesos e YARN. Architettura futura di riferimento: Fog computing.
 A. Bahga, V. Madisetti, Big Data Science and Analytics: A Hands-On Approach, VPT, 2016.
R. Buyya, R. Calheiros, A. V. Dastjerdi (eds.), Big Data: Principles and Paradigms, 1st Edition, Morgan Kaufmann, 2016.
|