DATA MINING
cod. 1001891

Anno accademico 2021/22
2° anno di corso - Secondo semestre
Docente
- Piero GANUGI
Settore scientifico disciplinare
Statistica economica (SECS-S/03)
Field
A scelta dello studente
Tipologia attività formativa
A scelta dello studente
48 ore
di attività frontali
6 crediti
sede:
insegnamento
in ITALIANO

Obiettivi formativi

Il corso è finalizzato a un notevole approfondimento di alcuni modelli statistici di particolare rilievo per l'ingegneria gestionale: il disegno degli esperimenti, i modelli discriminanti, i Tree con il machine learning.
Nel corso si effettua anche un confronto tra alcuni modelli statistici e Machine learning.

Prerequisiti

- - -

Contenuti dell'insegnamento

1.Analisi della varianza e disegno degli esperimenti.

Il problema della curvatura nella superficie di risposta.
Il metodo della discesa/salita più rapida.
Il modello a due fattori variabili anzichè fissi.
Il modello misto a due fattori.

Analisi della covarianza.



Parte 2. Valutazione della solidità economica finanziaria dell'impresa mediante modelli discriminanti.
La discriminante di Fisher.
La discriminate quadratica.
La discriminate logistica.
La discriminate di massima verosimiglianza.


Parte 3. Machine learning e la valutazione dell'impresa mediante il machine learning.

Il metodo del Vicino più Vicino.
Alberi di classificazione e alberi di regressione.
Foreste casuali.
Macchine a vettori di supporto.
Reti neurali.

Programma esteso

1.Analisi della varianza e disegno degli esperimenti.
Ripresa dei modelli a uno, due, tre fattori.
Principali disegni degli esperimenti.
Superfici di risposta di primo e secondo ordine.
Il problema della curvatura della superficie di risposta con dati mancanti.
Metodo della discesa/salita più rapida.
Analisi della varianza con fattori stocastici.
Il modello misto: un fattore variabile e un fattore fisso.

Analisi della covarianza.

Parte 2. Valutazione della solidità economica finanziaria dell'impresa.

Le statistiche dell'ISTAT sulle imprese.
Alcuni schemi di riclassificazione del bilancio.
Il flusso dei fondi.
Il sistema dei conti SEC Eurostat e la riclassificazione del bilancio.
La discriminante di Fisher.
La discriminante logistica.
La discriminate quadratica.
La discriminate di massima verosimiglianza.

Parte 3. Machine learning

Il metodo de Il vicino più vicino.
Alberi di classificazione.
Alberi di regressione.
Foreste casuali.

Reti neurali.

Bibliografia

Montgomery, D. C.(2006)
Progettazione e analisi degli esperimenti
2006 Mc Graw-Hill. (Alcuni capitoli segnalati durante il corso).

Flury, B. (1997) A First course in Multivariate Statistics, Springer, New York. (Alcuni capitoli segnalati durante il corso).


Lantz B. (2015) Machine learning with R. Packt Publishing, Birminghan. (Capitoli segnalati durante il corso).

James G.,Witten D., Hastie T.,Tibshirami R. (2013) An Introduction to Statistical Learning with Applications in R, Springer,, New York.

Metodi didattici

Lezioni frontali e laboratorio con R.

Modalità verifica apprendimento

Esame orale.
Nell'esame lo studente deve dimostrare la conoscenza dei diversi modelli teorici indicati nel programma e sviluppati nel corso.

Altre informazioni

- - -