SITE TITLE

LOGO DIETI

Machine learning e applicazioni

Modulo A

 

Insegnamento: Machine learning e applicazioni

Anno di corso: I

CFU: 6

SSD: INF/01

Ore di lezione: 48

Semestre: 1/2

Modulo: A

Codice:

Obiettivi formativi:

Il corso si prefigge di fornire allo studente le competenze riguardanti tutta quella serie di approcci basati sull'apprendimento automatico (meglio conosciuto come machine learning) che vengono applicati in moltissimi campi per l'analisi di dati di natura molto diversa. Infatti, per ottenere buone prestazioni strumenti di analisi dei dati e di business intelligence occorre scegliere lo strumento più opportuno e adattarne l'applicazione al caso specifico. Pur salvaguardando la generalità degli approcci nella scelta dei contenuti del corso, essi saranno presentati nel contesto dell'information retrieval.

Contenuti:

ML applicato all'Information retrieval. Verranno introdotti i sistemi di information retrieval e i problemi che pongono. Partendo dal modello booleano, verranno considerate le diverse componenti, quali l'indice invertito, il dizionario e i diversi tipi di query, comprese quelle contenenti wildcard. Si passerà poi allo schema tf-idf, al modello a spazio vettoriale e al relevance feedback. Per quel che riguarda la classificazione, con particolare attenzione alla categorizzazione di testi, si considereranno kNN, Rocchio, Naive Bayes con modello di Bernoulli e multinomiale e Support Vector Machine (SVM). Per quel che riguarda gli approcci senza supervisione e in particolare la funzione degli algoritmi di clustering in un sistema di information retrieval, verranno discussi l'algoritmo K-means, quello gerarchico e il problema del cluster labeling. Cenni di feature selection.

Prerequisiti: concetti elementari di teoria della probabilità e statistica, di algebra e di geometria.

Modalità didattiche:

Lezioni frontali.

Materiale didattico:

  • Chris Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2007.

  • materiale fornito dal docente

Modalità di esame: 

L'esame si articola in prova

Scritta e orale

 

 

 

 

   

 

 

 

 

 

 

 

 

 

 

In caso di prova scritta i quesiti sono 

 

 

 

A risposta libera

 

 

Esercizi numerici

 

Altro 

 

 

Docente modulo : Corazza Anna

 

Modulo B 

Insegnamento: Machine learning e applicazioni

Anno di corso: I

CFU: 6

SSD: INF/01

Ore di lezione: 48

Semestre: 2

Modulo: A

Codice:

Obiettivi formativi:

Il corso si prefigge di fornire allo studente le competenze riguardanti tutta quella serie di approcci basati sull'apprendimento automatico, meglio conosciuto come Machine Learning (ML), che vengono applicati in moltissimi campi per l'analisi di dati di natura molto diversa. Infatti, per ottenere buone prestazioni strumenti di analisi dei dati e di business intelligence occorre scegliere lo strumento più opportuno e adattarne l'applicazione al caso specifico. Pur salvaguardando la generalità degli approcci nella scelta dei contenuti del corso, essi saranno presentati in contesti applicativi estremamente attuali e importanti: information retrieval, analisi delle immagini e data mining.

Contenuti:

ML applicato all'analisi di immagini e al data mining. Il secondo modulo partirà da modelli lineari applicati sia alla classificazione che alla regressione, per passare poi alle reti neurali feed-forward per la classificazione. Si passerà poi alle problematiche introdotte negli approcci di machine learning dalla grande dimensione dei dati coinvolti (Big Data). Un aspetto cruciale per un uso accurato e proficuo delle tecniche di machine learning riguarda la rappresentazione dell'ingresso e quindi il progetto delle caratteristiche (feature design) che comprende selezione, riduzione, trasformazione e fusione. A seguire, verrà approfondito il problema del clustering, considerando le self-organizing maps e il clustering gerarchico e spettrale. Infine, si farà cenno a metodi ensemble e di boosting per la classificazione. In tutto questo secondo modulo, i diversi approcci verranno esemplificati con significativi problemi tratti dai campi dell'analisi delle immagini e del data mining.

Prerequisiti: concetti elementari di teoria della probabilità e statistica, di algebra e di geometria.

Modalità didattiche:

Lezioni frontali,esercitazioni.

Materiale didattico:

  • C.M. Bishop, Neural Networks for pattern recognition, 1995., OXFORD University Press 

Modalità di esame: 

L'esame si articola in prova

Scritta e orale

 

 

 

     

 

 

 

 

 

 

 

 

 

 

In caso di prova scritta i quesiti sono 

 

 

 

A risposta libera

 

 

Esercizi numerici

 

Altro 

 

 

Docente modulo : Prevete Roberto