| INFORMATION THEORY AND DATA SCIENCE
(obiettivi)
OBIETTIVI FORMATIVI La teoria dell'informazione classica, introdotta da Claude Shannon nel 1948, è la scienza che consente di quantificare matematicamente il contenuto informativo di un messaggio e il suo trasferimento attraverso un sistema. In particolare, la teoria dell'informazione fornisce gli strumenti matematici per fornire una visione quantitativa del contenuto informativo e una visione qualitativa del trasferimento di informazioni. Il principale contributo di Shannon è stato quello di stabilire i limiti dei sistemi di comunicazione. Una definizione generale di informazione è: nuova conoscenza derivata da studio, esperienza, messaggi, ecc. Pertanto, l'informazione è legata alla conoscenza. Le aziende oggi sono ricche di dati, ma povere di informazioni. Le tecniche di data science possono aiutare le aziende ad acquisire conoscenze dalle enormi quantità di dati a loro disposizione. Questo corso ha l’obiettivo di fornire una visione unificata di informazione, conoscenza e analisi dei dati, estendendo le applicazioni della teoria dell'informazione oltre la teoria classica delle comunicazioni. In particolare, il corso si concentra su metodi statistici per il data science. Verranno presentate applicazioni di teoria dell'informazione e data science in diverse aree, tra cui comunicazioni digitali, economia, marketing, biologia, medicina, meteorologia.
CONOSCENZA E CAPACITÀ DI COMPRENSIONE: Al termine del corso lo studente sarà in grado di: guadagnare una conoscenza approfondita della teoria dell’informazione e delle sue applicazioni nelle tecniche di apprendimento statistico; comprendere le sfide che si presentano nei problemi di analisi dei dati.
CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE: Al termine del corso lo studente sarà in grado di: comprendere come applicare metodi di data science statistico a problemi selezionati; dimostrare competenza nella ricerca indipendente.
AUTONOMIA DI GIUDIZIO: Durante il corso lo studente verrà incoraggiato a ragionare sull’analisi del problema da risolvere e sui vari compromessi che si devono affrontare nell’analisi dei dati.
ABILITÀ COMUNICATIVE: Lo studente deve realizzare un progetto accuratamente documentato. In questo modo lo studente migliora le capacità di produrre documentazione tecnica in modo chiaro ed efficace. Inoltre i risultati del progetto vengono presentati al docente, migliorando così la capacità di esposizione orale.
CAPACITÀ DI APPRENDIMENTO: Durante il corso verranno forniti dei dataset reali su cui applicare esempi di tecniche di data science. Lo studente apprenderà come elaborare dataset reali usando un PC.
|
|
Codice
|
80300130 |
|
Lingua
|
ENG |
|
Tipo di attestato
|
Attestato di profitto |
|
Crediti
|
9
|
|
Settore scientifico disciplinare
|
ING-INF/03
|
|
Ore Aula
|
90
|
|
Ore Studio
|
-
|
|
Attività formativa
|
Attività formative affini ed integrative
|
Canale Unico
|
Mutua da
|
80300130 INFORMATION THEORY AND DATA SCIENCE in ICT and Internet Engineering - Ingegneria di Internet e delle Tecnologie per l'Informazione e la Comunicazione LM-27 DE SANCTIS MAURO
(programma)
Elementi di teoria della probabilità: variabili e processi aleatori di tipo continuo e discreto, densità di probabilità, massa di probabilità, valore atteso. Teoria dell'informazione: concetto di informazione, autoinformazione, entropia di Shannon, misure alternative di entropia, entropia relativa, divergenza di Kullback-Leibler, divergenza di Jensen-Shannon, entropia condizionale, entropia congiunta, informazione reciproca, correlazione totale, entropia differenziale, misure di informazione normalizzate. Applicazioni al data science: concetto base di data science, definizione di dataset e attributi/feature, train set e test set, tipi di dati, analisi multivariata, descrizione statistica dei dataset, case study, metriche teoriche delle informazioni in attività di data science, preparazione dei dati, pulizia dei dati, discretizzazione degli attributi, riduzione della dimensionalità (Singular Value Decomposition), regole di associazione (unidimensionale e multidimensionale), algoritmi di classificazione (ad es. ID3, C4.5, Bayes, K-NN), alberi di classificazione, rilevamento di anomalie, clustering, addestramento e test di algoritmi, visualizzazione dei dati. Analisi e predizione di serie temporali. Metodi di valutazione degli algoritmi di data science. Esperimenti informatici: introduzione a Python, progetti in Python con applicazioni della teoria dell'informazione all’analisi dei dati, progetti in Python con applicazioni di algoritmi di data science in diverse aree.
 Slides fornite dal docente.
|
|
Date di inizio e termine delle attività didattiche
|
- |
|
Modalità di erogazione
|
Tradizionale
|
|
Modalità di frequenza
|
Non obbligatoria
|
|
|