BIG DATA E DATA MINING
cod. 1009070

Anno accademico 2023/24
1° anno di corso - Secondo semestre
Docente
- Flavio BERTINI
Settore scientifico disciplinare
Informatica (INF/01)
Field
Discipline informatiche
Tipologia attività formativa
Caratterizzante
48 ore
di attività frontali
6 crediti
sede:
insegnamento
in ITALIANO

Obiettivi formativi


Al termine del corso lo studente conosce i modelli dei dati semi-strutturati e non strutturati in relazione a quelli strutturati ed i principali costrutti dei linguaggi SQL/XML ed XQuery; conosce le principali tecniche di information retrieval e di analisi dei dati; è in grado di progettare e realizzare un datawarehouse; è capace di elaborare un progetto utilizzando le principali tecniche di data mining.

Con riferimento agli Indicatori di Dublino:

Conoscenza e capacità di comprensione
Il corso introduce i primi concetti relativi ai sistemi operativi. Particolare enfasi è data alla comprensione delle dei modelli di gestione e ottimizzazione delle risorse. Il testo di riferimento è in italiano, ma viene altresì utilizzata durante le lezioni la terminologia in lingua inglese come avviamento alla consultazione di letteratura scientifica internazionale.

Capacità di applicare conoscenza e comprensione
Le conoscenze teoriche presentate vengono sempre applicate alla risoluzione di problemi specifici. Le esercitazioni che affiancano il corso sono incentrate sulla risoluzione di esercizi e problemi, con particolare riferimento all’utilizzo del sistema operativo. Spesso i metodi risolutivi vengono presentati sotto forma algoritmica, sviluppando negli studenti la capacità di strutturare procedure utili in numerose parti dell'informatica e non solo nello studio dei sistemi operativi

Autonomia di giudizio
Gli esercizi, che vengono proposti relativamente alla parte teorica svolta a lezione, possono venire risolti individualmente o in gruppo. Il confronto con i compagni di corso, nel lavoro a casa o durante gli svolgimenti in aula, favorisce lo sviluppo di capacità specifiche per poter a chiarire ai compagni o ai docenti le proprie argomentazioni. Spesso gli esercizi proposti possono venire risolti in modi molto diversi e l'ascolto delle soluzioni proposte da altri permette di sviluppare la capacità di individuare strutture comuni, al di là delle apparenti differenze superficiali.

Abilità comunicative
Le numerose discussioni sui diversi metodi per risolvere i problemi proposti consentono di migliorare le capacità di comunicazione. Vengono inoltre abitualmente utilizzate durante le spiegazioni (ed esplicitamente evidenziate in classe) alcune modalità di comunicazione specifiche della tecnologia informatica.

Capacità di apprendimento
Lo studio delle origini delle soluzioni tecnologiche e la loro introduzione motivata da considerazioni quantitative contribuisce a realizzare negli studenti la capacità di apprendere in modo profondo e non soltanto superficiale e ripetitivo. Le conoscenze così acquisite non sono mai rigide e definitive, ma sono perfettamente adattabili ad ogni evoluzione e cambiamento di prospettiva e di contesto.

Prerequisiti


Fortemente consigliata la conoscenza del modello dei dati relazionale. Buona conoscenza dei linguaggi di programmazione imperativi.

Contenuti dell'insegnamento


■ Modelli dei dati semi-strutturati e non strutturati
■ Limiti di SQL e introduzione a SQL/XML ed XQuery
■ I modelli di information retrieval e web information retrieval
■ Introduzione al datawarehousing e al data mining

Programma esteso


■ Parte I
■ Introduzione
■ Modelli dati semi-strutturati e non strutturati
■ Parte II
■ Introduzione XML
■ Linguaggio SQL/XML
■ Linguaggio XQuery
■ XQuery in database management system
■ NoSQL database
■ Parte III
■ Introduzione Information Retrieval
■ Ranking
■ Web Information Retrieval
■ Information Retrieval valutazione
■ Metodi avanzati
■ Parte IV
■ Data analytics
■ Data warehouse
■ Data mining: regole associative, classificazione e clustering

Bibliografia


■ A. Moller, M. Schwartzbach - Introduzione a XML - Pearson, 2007, ISBN: 9788871923734
■ P.-N. Tan, M. Steinbach, V. Kumar - Introduction to data mining - Addison Wesley, 2005, ISBN: 0321420527
■ C.D. Manning, P. Raghavan, H. Schütze - Introduction to Information Retrieval - Cambridge University Press, 2008, ISBN: 0521865719
■ M. Golfarelli, S. Rizzi - Datawarehouse. Teoria e pratica della progettazione - McGraw-Hill Education, 2006, ISBN: 9788838662911

Metodi didattici


Didattica frontale parte in aula

Modalità verifica apprendimento


La verifica avviene con la discussione di un articolo. Lo studente approfondisce un argomento avanzato partendo da un articolo scientifico tra quelli proposti e prepara una presentazione da utilizzare il giorno dell'esame. La discussione avverrà principalmente sugli argomenti della pubblicazione scelta. In alternativa e previa approvazione del docente, la verifica potrà avvenire con la realizzazione di un progetto da discutersi durante l'esame. Per partecipare a un appello d'esame occorre iscriversi entro 7 giorni dalla data dell'esame. L'esame sarà in presenza a meno di ulteriori indicazioni/restrizioni sanitarie.

Altre informazioni

- - -