BIG DATA E BUSINESS INTELLIGENCE
cod. 1007077

Anno accademico 2020/21
3° anno di corso - Primo semestre
Docente
Settore scientifico disciplinare
Sistemi di elaborazione delle informazioni (ING-INF/05)
Field
Ingegneria informatica
Tipologia attività formativa
Caratterizzante
48 ore
di attività frontali
6 crediti
sede: PARMA
insegnamento
in ITALIANO

Obiettivi formativi

La conoscenza degli strumenti utili per l’analisi, il processo, lo storage di dati eterogenei e più in generale per lo sviluppo di un processo di big data analytics.

I Big Data sono considerati spesso come il nuovo petrolio
Big Data Analytics è il processo di raccolta e analisi di grandi volumi di dati (big data) per estrarre informazioni nascoste utili per delineare una strategia efficace nei processi decisionali delle aziende e della società in generale.

Prerequisiti

Nessuna propedeucità.
Comunque, gli studenti dovrebbero avere conoscenze di programmazione (in particolare python) e Basi di Dati.

Contenuti dell'insegnamento

1 Introduzione (2 ore)
2 Business Intelligence e analisi descrittiva (2 ore)
3 Data science (10 ore)
4 Python e l’analisi dei dati (10 ore)
5 Tecnologie per Big Data (4 ore)
6 Storage e Processo dei Dati in una azienda (8 ore)
7 Elaborazione comuni nei Big Data (6 ore)
8 Casi di studio (6 ore)

Programma esteso

1 Introduzione (2 ore)
1.1 Definizioni di Big Data
2 Business Intelligence e analisi descrittiva (2 ore)
3 Data science (10 ore)
3.1 Metodologia
3.2 Esplorazione dei dati (statistica di base)
3.3 Algoritmi predittivi (Machine Learning)
3.4 Comunicazione dei risultati
4 Python e l’analisi dei dati (10 ore)
4.1 NumPy
4.2 Pandas
4.3 PyPlot
4.4 Scikit-Learn
5 Tecnologie per Big Data (4 ore)
5.1 Hadoop e Spark
6 Storage e Processo dei Dati in una azienda (8 ore)
6.1 Basi di dati relazionali e NoSQL
6.2 Django, Flask, scaffolding
7 Elaborazione comuni nei Big Data (6 ore9
7.1 Preprocessing del testo (stemming, Bag of words, vettorizzazione)
7.2 Grafi e geolocalizzazione (Gephi, Qgis, GMaps ecc.)
8 Casi di studio (6 ore)

Bibliografia

A. Rezzani (2017). Big Data Analytics. Il manuale del data scientist. Maggioli Editore (Aopogeo Education).
S. Ozdemir. Data Science: guida ai principi e alle tecniche base della scienza dei dati. Apogeo

Metodi didattici

Lezioni frontali ed esercitazioni in laboratorio.
Le lezioni frontali copriranno gli aspetti teorici delle materie del corso.
Le esercitazioni pratiche legate a problemi reali saranno svolte in laboratorio

Modalità verifica apprendimento

Non ci sono prove intermedie.
L'esame si compone di due parti:
i) una prova scritta composta da quattro domande aperte sugli argomenti teorici del corso trattati in classe con l'obiettivo di valutare la
conoscenza acquisita su questi argomenti.
ii) una relazione scritta (e la sua presentazione orale) su un lavoro di progetto che
esplora uno degli argomenti trattati in classe o nei laboratori, in modo da valutare la capacità di applicare le conoscenze acquisite durante il corso.
In ogni caso, il il valore della sua valutazione dipenderà anche dalla qualità dello sviluppo
sistema e la documentazione allegata.

L'esame viene superato se, in ciascuna delle due parti, lo studente raggiunge almeno la sufficienza.
Il voto finale è una media ponderata delle due parti: prova scritta test (40%) e progetto (60%).
La lode viene data in caso di raggiungimento del punteggio più alto su tutti i parziali.

Altre informazioni

Note sul corso e materiale didattico saranno distribuiti durante il corso in forma elettronica.