METODI STATISTICI A SUPPORTO DELLE DECISIONI
cod. 18283

Anno accademico 2008/09
1° anno di corso - Secondo semestre
Docente
Settore scientifico disciplinare
Probabilità e statistica matematica (MAT/06)
Field
Cultura scientifica, umanistica, giuridica, economica, socio-politica
Tipologia attività formativa
Affine/Integrativa
81 ore
di attività frontali
9 crediti
sede:
insegnamento
in - - -

Obiettivi formativi

La prima parte costituisce un solido approfondimento delle conoscenze introdotte nel corso di Statistica. Vengono introdotti nuovi tipi di test e affrontate problematiche più complesse e realistiche. Lo studio della regressione occupa un ruolo centrale e metà delle ore sono in laboratorio informatico.<br />
<br />
La seconda parte è una panoramica necessariamente veloce delle tecniche gestionali e di analisi moderne che possono essere ricondotte alla statistica.

Prerequisiti

Statistica, Analisi matematica C

Contenuti dell'insegnamento

PRIMA PARTE: STRUMENTI MULTIVARIATI DI BASE.<br />
Richiami sulle variabili aleatorie e sull'inferenza statistica.<br />
Classici test Z, T e F per il confronto dei parametri di due popolazioni normali.<br />
Test di adattamento e di indipendenza (Fisher-Irwin, chi-quadro, tabelle di contingenza).<br />
Regressione: determinazione dei coefficienti (modelli lineari, multilineari, linearizzabili; coefficiente di determinazione, analisidei residui, minimi quadrati pesati); inferenza sui coefficienti (test T e F).<br />
Analisi della varianza (a una via, a due vie e con interazioni).<br />
<br />
SECONDA PARTE: TECNICHE DI EXPLORATIVE DATA ANALYSIS.<br />
Rappresentazione di dati con elevata numerosità e dimensionalità (distribuzioni normali multivariate, matrice di correlazione, autovalori e autovettori).<br />
Verifica del modello (funzioni kernel, test chi-quadro e di Kolmogorov-Smirnov).<br />
Cluster analysis (distanze; hierarchical tree clustering, linkage; algoritmi k-means; algoritmi EM, misture, classificazioni bayesiane).<br />
Factor analysis (principal component analysis, common factor analysis, riduzione delle variabili, interpretazione dei fattori, rotazioni dei fattori).<br />
Discriminant function analysis (metodo lineare di Fisher, riduzione delle variabili).<br />
Neural networks (multilayer perceptron).<br />
Overfitting e overlearning: quando il modello interpreta il campione e non la popolazione.<br />
Design of Experiments (cenni).

Programma esteso

- - -

Bibliografia

<ol>
<li>S. Ross - Probabilità e statistica per l'ingegneria e le scienze - Apogeo 2003</li>
<li>M. Middleton - Analisi statistica con Excel - Apogeo 2004</li>
<li>A. Afifi, V. Clark, S. May - Computer-aided Multivariate Analysis - Chapman & Hall 2004</li>
<li>J. Hand, H. Mannila, P. Smyth - Principles of Data Mining - MIT Press 2001 </li>
</ol>

Metodi didattici

Le lezioni teoriche sono affiancate da esercitazioni sull'utilizzo di un foglio di calcolo per risolvere problemi di statistica.<br />
<br />
L'esame è in due parti. <br />
La prima, in laboratorio di informatica prevede dei quesiti a risposta multipla sui concetti fondamentali della statistica e alcuni problemi sulla prima parte del corso da risolvere su Microsoft Excel.<br />
<br />
La seconda è un esame scritto, nella forma di tema, sulle tecniche avanzate (compresa la seconda parte del corso) da usare di fronte a dei dataset assegnati.

Modalità verifica apprendimento

- - -

Altre informazioni

- - -