Esercizio 1

Si consideri il dataset al link che contiene i dati relativi all’immagazzinamento (retention) del ferro a seguito del uso di due medicinali (treatment). I pazienti sono divisi in 3 categorie in base alla severità dei sintomi (level).

(2 punti) Si importi il dataset e si verifichi se ci sono errori nei dati. Se ci sono, li si sostituisca con la media dei dati relativi allo stesso gruppo e stesso trattamento. Si calcolino media, mediana e quantili dei dati divisi per trattamento.
(2 punti) Si visualizzi usando degli istogrammi la distribuzione della variabile retention al variare del trattamento. Queste informazioni insieme a quelle del punto precedente, ci dicono qualcosa sull’efficacia dei farmaci? Ricordiamo che più alto è retention, maggiore è l’efficacia del farmaco.
(2 punti) Considerando la soglia di confidenza del 95% si verifichi se le medie di retention per la severità 1, differiscono in modo statisticamente significativo rispetto al trattamento. Inoltre si visualizzino gli stessi dati usando dei boxplot. Si commentino i risultati.

Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere gli esercizi. I plot devono riportare le opportune label lungo gli assi.