|
Mutua da
|
8066133 INFORMATION RETRIEVAL in Informatica LM-18 NESSUNA CANALIZZAZIONE AMATI GIAMBATTISTA
(programma)
L’informazione in IR. Entropia, Codifiche e codifiche ottimali, Codifica di Shannon-Fano, Codifica di Huffman. Le distribuzioni in Information Retrieval. Legge di Zipf & Power Law, Poisson, Multinomiale, Bernoulli, Dirichlet, Bose-Einstein. • Architettura di un sistema di IR. Parser, algoritmi di stemming. Indice inverso e indice diretto. Metodi di compressione degli indici: Gamma code, Varint code di Google, Stima della Dimensione degli indici mediante la Legge di Zipf. • Programmazione Map Reduce, Indicizzazione mediante MapReduce • Il problema dell'induzione in IR. Modelli di IR. Modello Two-Poisson, Modello dello Spazio vettoriale, Modello del linguaggio, Modelli Divergence From Randomness (DFR) • Modelli per la rappresentazione dell'interrogazione. Teoria del relevance feedback e tecniche di apprendimento automatico per l'IR. Espansione automatica delle interrogazioni. • Misure di valutazione dell'efficacia dei modelli di IR. • Misure di similarità per l’IR. Correlazione di Pearson, Mutual Information Measure, Misura di Jaccard • Clustering massivo, Locality Sensitive Hashing, Near Duplicate Detection. Implementazione MapReduce di LSH • Modelli di recupero mediante links e anchor text. Link Analysis & Pagerank, Calcolo efficiente di Pagerank, Applicazioni in Twitter, Spammer identification • Information Retrieval Temporale, Modelli temporali di IR • Crawling. Web Crawling, Pseudo crawling in Twitter
 1. J. Leskovec, A. Rajaraman, J. D. Ullman, Mining of Massive Datasets, http://infolab.stanford.edu/~ullman/mmds/book.pdf 2. G. Amati, Note di Information Retrieval, (manuscript) 3. Chakrabarti, Mining the web, http://www.facweb.iitkgp.ernet.in/~shamik/autumn2012/dwdm/papers/dmining.pdf 4. C.J. van Rijsbergen, Information Retrieval, London: Butterworths, 1979. http://www.dcs.gla.ac.uk/Keith/Preface.html 5. Moffat, Timothy Bell, Managing Gigabytes, Morgan Kaufmann Publishers, 1999. 6. C. D. Manning, P.Raghavan, H. Schütze, An Introduction to Information Retrieval, 2009, http://nlp.stanford.edu/IRbook/pdf/irbookonlinereading.pdf
|