Esame Luglio 2018


Esercizio 1

Si consideri il dataset contenente i dati relativi ad alcune informazioni (come peso e alle ore di sonno) di alcuni animali (descrizione).

  1. Usando le informazioni contenute nel file di descrizione, si determini se il dataset contiene errori nei dati. In caso si sostituiscano tali dati con NA.

  2. Per ogni variabile, si sostituiscano gli NA con la mediana della stessa variabile.

  3. Si calcolino media, deviazione standard e decili delle variabili BodyWt, BrainWt, TotSleep, GestTime.

  4. Si visualizzi la distribuzione delle variabili BodyWt e TotSleep usando gli istogrammi ed i boxplot. Dopo aver visualizzato la variabile BodyWt, si applichi una trasformazione dei dati che possa migliorarne la visualizzazione. Si salvino i dati trasformati nella colonna BodyWtTRANS e si giustifichi la scelta della traformazione.

  5. Si crei un modello di regressione lineare tra li variabili TotSleep e BodyWtTRANS. Si visualizzino i dati, la retta di regressione, la distribuzione dei residui e si confrontino i quantili dei residui con i quantili della normale. Si commentino i risultati grafici e il valore di R quadro.


Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere gli esercizi. I plot devono riportare le opportune label lungo gli assi.