Obiettivi formativi
Questo corso vi insegnerà le basi dell'inferenza guidata dai dati nelle scienze fisiche. Acquisirete abilità di base di calcolo, conoscenze di analisi statistica, analisi degli errori, buone pratiche per la gestione, l'elaborazione e l'analisi dei dati e (inclusi i grandi dati) programmatiche, e abilità di comunicazione e visualizzazione.
Prerequisiti
Coding experience, preferably in python. Basic statistical knowledge (descriptive statistics). Basic linear algebra knowledge (matrix, vectors, matrix multiplications and transformations
Contenuti dell'insegnamento
Il corso sarà organizzato in modo modulare, con alcune lezioni con guest lecturers. Ogni metodo di machine learning sarà studiato così come viene applicato ad un problema fisico, sulla base di dati aperti ed esempi di letteratura
Programma esteso
Il corso coprirà: Traditional Null Hypothesis Testing statistics concepts and modern applied statistics and machine learning methods including: Bayesian Statistics, MonteCarlo Markov Chains, Principal Component Analysis, Support Vector Machines, Tree methods, Clustering, and Neural Network (including Autoencodes, Convolutional, and Recurrent Neural Networks). Imparerete esempi di metodi di machine learning applicati ai problemi attuali della fisica e delle scienze naturali. Alcuni degli algoritmi più semplici saranno esplorati in dettaglio e implementati da zero, altri saranno implementati attraverso l'uso di librerie dedicate al pitone. Alcuni degli algoritmi più semplici saranno esplorati in dettaglio e implementati da zero, altri saranno implementati attraverso l'uso di librerie dedicate Pyton.
Bibliografia
No textbook is required but several textbooks may be helpful throughout the class, including :
• Elements of Statistical Learning, Hastie, Tibshirani, Friedman, Springer 2001
• Statistics, Data Mining, and Machine Learning in Astronomy, Ivezic, Connoly, VanderPlas, Gray, Princeton Press 2nd edition
• ML in python: Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow probably the book that is closer to the syllabus in terms of techniques, but doesn’t buy it, because the second edition is due to come out imminently and the deep learning chapters of the previous edition are out of date now
Additional textbooks, particularly helpful for students with less experience in coding or python, include:
• Python Data Science Handbook, Jake VanderPlas, O'Reilly Media [https://www.oreilly.com/library/view/python-data-science/9781491912126/]
• computing and coding: Beginning Python Visualization, 2009
• data analysis: Statistics in a nutshell, S. Boslaugh, O'Reilly Media
• Visualizations: Visualizations Analysis and Design, T. Munzer, 2014
Most of the content of the listed books that will be referred to in lectures can be found online.
Metodi didattici
Per la classe verrà utilizzato Google Collaboratory. I compiti a casa possono essere sviluppati su qualsiasi piattaforma purché l'impostazione computazionale sia coerente con l'intera classe: gli assistenti di classe ed io dobbiamo essere in grado di riprodurre il vostro lavoro e ottenere gli stessi risultati. I moduli e la biblioteca utilizzati nel vostro lavoro devono essere accessibili a me, agli alunni e ai vostri compagni di classe. Potremmo realizzare un'immagine docker e anche un ambiente virtuale e istruzioni su come impostare il vostro ambiente per consentirvi di lavorare offline
Modalità verifica apprendimento
Compiti a casa (riproduzione dell'analisi della letteratura) svolti in gruppo, esame di metà trimestre in tempo reale, progetto finale di gruppo, quiz per valutare la comprensione in corso. La partecipazione è inclusa anche nella valutazione
Altre informazioni
original syllabus from last year's course that i will base this on https://docs.google.com/document/d/16Rh9lnr4cMicDvpxehaZGEGMRW_PVB1FATyJcKRdEGI/edit
syllabus tradotto https://docs.google.com/document/d/1HJNnSd3ghgVBQj4ugB-jp5YlYU2J1x-4mUUCtyS38lM/edit?usp=sharing(automaticamente da https://www.deepl.com/translator.