Insegnamento STATISTICAL METHODS FOR ECONOMY AND FINANCE

Nome del corso di laurea Finanza e metodi quantitativi per l'economia
Codice insegnamento A000201
Sede PERUGIA
Curriculum Statistics for finance and economics
Docente responsabile Luca Scrucca
CFU 12
Regolamento Coorte 2019
Erogato Erogato nel 2019/20
Anno 1
Periodo Annuale
Tipo insegnamento Obbligatorio (Required)
Tipo attività Attività formativa integrata
Suddivisione

STATISTICAL LEARNING AND DATA MINING ( MOD.II)

Codice A000203
Sede PERUGIA
CFU 6
Docente responsabile Luca Scrucca
Docenti
  • Luca Scrucca
Ore
  • 42 Ore - Luca Scrucca
Attività Caratterizzante
Ambito Matematico, statistico, informatico
Settore SECS-S/01
Tipo insegnamento Obbligatorio (Required)
Lingua insegnamento INGLESE
Contenuti Metodi statistici avanzati per il Data Mining, sia nel caso di supervised learning (classificazione e regressione) che di unsupervised learning (analisi dei cluster, riduzione della dimensionalità). Casi di studio reali introdotti e analizzati con il software R.
Testi di riferimento James G., Witten D., Hastie T. and Tibshirani R. (2013) An Introduction to Statistical Learning with Applications in R. Springer-Verlag.

Materiale supplementare fornito dal docente nel corso delle lezioni.
Obiettivi formativi Al termine del corso lo studente dovrà essere in grado di applicare in maniera autonoma gli opportuni metodi statistici a problemi reali di regressione, classificazione e clustering, tramite il software R.
Prerequisiti Conoscenza di base della statistica, sia descrittiva che inferenziale, e il modello di regressione lineare.
Metodi didattici Lezioni frontali ed esercitazioni pratiche nel laboratorio informatico.
Altre informazioni Frequenza facoltativa ma fortemente consigliata.
Modalità di verifica dell'apprendimento Valutazioni in itinere ed esame orale finale. Le attività di laboratorio sono finalizzate ad accertare la capacità dello studente di mettere in pratica le metodologie introdotte in classe. L'esame orale finale intende invece valutare il livello di conoscenza e comprensione raggiunto dallo studente per quanto riguarda gli aspetti computazionali e metodologici trattati durante il corso.
Programma esteso Il corso prevede lo studio di metodi statistici avanzati per il Data Mining, sia nel caso di supervised learning (classificazione e regressione) che di unsupervised learning (analisi dei cluster, riduzione della dimensionalità). Tali metodi sono stati applicati con successo in molti ambiti, dalla finanza all'economia, dal business analytics alle scienze sociali e naturali. I metodi trattati saranno introdotti a partire da casi di studio reali e analizzati tramite il software R.
In dettaglio, verranno trattati i seguenti argomenti:
- Statistical learning e data mining: introduzione.
- Obiettivi di un modello statistico: previsione e interpretabilità.
- Supervised vs unsupervised learning.
- Classificazione vs regressione.
- Valutazione dell'accuratezza di un modello statistico.
- Supervised learning: introduzione.
- Estensioni al modello di regressione lineare: selezione del modello e regolarizzazione. Regressione polinomiale, splines, modelli generalizzati additivi.
- Metodi di ricampionamento: cross-validation e bootstrap.
- Classificazione: introduzione.
- Modello logistico e multinomiale.
- Analisi discriminante lineare e quadratica.
- Gaussian naive Bayes
- Modelli mistura Gaussiani
- Algoritmo k-nearest neighbour (cenni).
- Metodi avanzati per la regression e la classificazione: Artificial neural networks, Decision trees, Bagging, Random forests, Boosting.
- Unsupervised learning: introduzione.
- Analisi delle componenti principali
- Misure di similarità e di distanza. Matrice delle distanze.
- Metodi gerarchici per la cluster analysis.
- Metodi non gerarchici (metodo k-means).
- Model-based clustering.

STATISTICAL METHODS FOR FINANCE (MOD.I)

Codice A000202
Sede PERUGIA
CFU 6
Docente responsabile Silvia Pandolfi
Docenti
  • Luca Scrucca (Codocenza)
  • Silvia Pandolfi
  • Francesca Pierri
Ore
  • 21 Ore (Codocenza) - Luca Scrucca
  • 21 Ore - Silvia Pandolfi
  • 10 Ore - Francesca Pierri
Attività Caratterizzante
Ambito Matematico, statistico, informatico
Settore SECS-S/01
Tipo insegnamento Obbligatorio (Required)
Lingua insegnamento INGLESE
Contenuti Inferenza statistica: stime basate sul metodo della massima verosimiglianza. Regressione: il modello di regressione lineare semplice e multiplo; il modello di regressione logistico. Casi di studio reali introdotti e analizzati con il software statistico R.
Testi di riferimento Weisberg, S. (2014) Applied Linear Regression, 4th edition, Wiley

Ruppert, D. and Matteson, D.S. (2015) Statistics and Data Analysis for Financial Engineering, 2nd ed., Springer

Materiale supplementare fornito dal docente nel corso delle lezioni.
Obiettivi formativi Al termine del corso lo studente sarà in grado di applicare i metodi di inferenza statistica e di regressione lineare studiati a dati reali, tramite l'utilizzo del software R.
Prerequisiti Conoscenze di statistica di base (statistica descrittiva e inferenza statistica).
Metodi didattici Lezioni frontali e utilizzo del software statistico R.
Altre informazioni Frequenza facoltativa ma fortemente consigliata.
Modalità di verifica dell'apprendimento L'esame consiste in una prova scritta con domande aperte di carattere teorico e interpretazione dell’output del software R per l’analisi di dati.


Programma esteso Metodo della massima verosimiglianza: verosimiglianza e funzione di log-verosimiglianza, stime di massima verosimiglianza (MLE), funzione Score e informazione di Fisher, proprietà statistiche degli stimatori MLE, calcolo numerico delle stime MLE, test del rapporto di verosimiglianza e intervalli di confidenza basati sulla verosimiglianza. Stime di massima verosimiglianza per distribuzioni applicate ai log-return.
Modelli di regressione: regressione lineare semplice e multipla, stima dei parametri, metodo dei minimi quadrati e massima verosimiglianza, test di ipotesi, intervalli di confidenza, predittori categorici, analisi della varianza, bontà di adattamento, trasformazioni, metodi di selezione del modello, analisi diagnostica e dei residui, multicollinearità. Regressione logistica: specifica del modello, interpretazione dei parametri e stima dei parametri.
Condividi su