Università degli studi dell'Insubria

DATA MINING

A.A. di erogazione 2018/2019
Insegnamento opzionale

Laurea Magistrale in INFORMATICA
 (A.A. 2018/2019)
Docenti
L'insegnamento è condiviso, tecnicamente "mutuato" con altri corsi di laurea, consultare il dettaglio nella sezione Mutuazioni
Anno di corso: 
1
Tipologia di insegnamento: 
Caratterizzante
Settore disciplinare: 
INFORMATICA (INF/01)
Lingua: 
Inglese
Crediti: 
6
Ciclo: 
Secondo Semestre
Ore di attivita' frontale: 
48
Dettaglio ore: 
Lezione (48 ore)

Con il termine Data Mining si intende un insieme di tecniche e strumenti usati per esplorare grandi quantità di dati, con lo scopo di individuare/estrarre informazioni/conoscenze significative, in modo da renderle disponibili ai processi decisionali.
Questo corso vuole fornire i fondamenti della disciplina, focalizzando lo studio sulle più importanti tecniche di Data Mining di attuale interesse applicativo/industriale.
Il corso associa alla conoscenza teorica del Data Mining l'utilizzo del software open source Python.
I partecipanti saranno guidati nella ricerca di pattern all’interno di grandi dataset, e attraverso gli strumenti forniti da Python impareranno a preprocessare i dati, eseguire operazioni di Clustering, Classificazione e Previsione.
In sintesi, gli obiettivi dell'insegnamento ed i risultati attesi di apprendimento sono i seguenti:
- Acquisire conoscenze di base dei metodi di Data Mining su dati di grandi dimensioni e delle problematiche relative.
- Acquisire capacità nell'applicare tali conoscenze a problemi reali, attraverso l'utilizzo del linguaggio Python e di alcune sue librerie.
- Capacità di apprendimento di nuove metodologie e di svolgere analisi comparative con quanto è già noto allo studente.

Prerequisiti: 

Contenuti di base del corso di Sistemi Intelligenti erogato al primo anno del corso di laurea magistrale.
Il corso è consigliato per chi ha la conoscenza di almeno un linguaggio di programmazione o scripting.
Si consiglia di procurarsi un computer portatile (Windows, Mac o Linux) in grado di eseguire l'interprete Python.

- Introduzione al Data Mining
- Introduzione al linguaggio Python e ad alcune sue librerie come strumento per poter sperimentare direttamente quanto visto a lezione.
- Mining di regole di associazione, alberi di decisione, regressione, classificazione. Metodi di aggregazione (bagging e boosting).
- Problemi e metodi di apprendimento ad informazioni strutturata (ranking; collaborative filtering).
- Problematiche di data mining con dati di grandi dimensioni risolvibili con algoritmi di deep learning.
I vari argomenti affrontati saranno accompagnati da esempi pratici e dal codice python necessario per la loro soluzione.

Le ore di lezione frontale vengono svolte in aula, alternernando momenti teorici ad esercizi pratici.
Il software analitico utilizzato sarà Python, piattaforma open-source liberamente scaricabile dal web.
Come strumento di editing si adopererà IPython, uno strumento open source, basato su browser che consente agli studenti di creare/modificare documenti che contengono il codice, le visualizzazioni e il testo.
Durante il corso verranno inoltre scaricati e installati pacchetti analitici aggiuntivi necessari per i diversi argomenti in studio.
In aula viene fornita assistenza continua da parte del docente.

Modalita' di verifica dell'apprendimento: 

L'esame consta di un progetto e di un colloquio orale.
Il progetto viene proposto dallo studente in base ai suoi interessi.
In assenza di specifiche proposte, il progetto è proposto dal docente.
Nel progetto gli studenti sono tipicamente chiamati ad implementare semplici metodi di indagine sperimentale su dati messi loro a disposizione da siti di web e/o da dati di banchmarking di altra natura disponibili su repository online.
Tali indagini sono volte ad accertare la capacità degli studenti di adattare i metodi studiati ai casi reali, comprendendone eventualmente le specificità.
Il progetto deve essere accompagnato da una breve relazione che descriva i contenuti e le risultanze ottenute.
L'esito del progetto, in trentesimi, è positivo (e consente l'accesso al successivo esame orale) se riporta una votazione almeno pari a 18/30.
La prova orale consta di un colloquio la cui prima domanda è sempre la discussione dei risultati del progetto.
Durante l'esame orale lo studente deve mostrare comprensione dei metodi trattati a lezione, dei loro vantaggi e dei loro svantaggi.
La prova complessiva è superata con una votazione finale di almeno 18/30.
Il voto del progetto concorre in modo significativo alla determinazione del voto finale.

Da individuare.
Dispense e materiale didattico forniti dal docente, disponibili sul sito di e-learning.

-

Cerchi il programma? Potrebbe non essere ancora stato caricato o riferirsi ad insegnamenti che verranno erogati in futuro.
Seleziona l‘anno in cui ti sei immatricolato e troverai le informazioni relative all'insegnamento del tuo piano di studio.

A.A. 2019/2020

Anno di corso: 2
Curriculum: GENERICO