Esame Febbraio 2019


Esercizio 1

Si consideri il dataset contenente i dati relativi ad alcune informazioni (come peso e alle ore di sonno) di alcuni animali (descrizione).

  1. (2 punti) Si importi il dataset e considerino solo le variabili BodyWt, BrainWt e TotSleep. Si verifichi se ci sono errori nei dati. Se ci sono, li si sostituisca con la media dei dati relativi alla stessa variabile. Nel fare ciò, si escludano i dati errati.

  2. (2 punti) Si calcolino quartili, media e mediana dei dati. Inolte, si visualizzino le variabili usando degli istogrammi ed i boxplot. Si commentino i grafici e la presenza di potenziali outliers.

  3. (2 punti) Si crei un modello di regressione lineare tra li variabili BodyWt e BrainWt. Si visualizzino i dati, la retta di regressione, la distribuzione dei residui e si confrontino i quantili dei residui con i quantili della normale. Si commentino i risultati grafici e il valore di R quadro.


Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere gli esercizi. I plot devono riportare le opportune label lungo gli assi.