Esercizio 1
Si consideri il dataset al link che contiene i dati relativi all’immagazzinamento (retention
) del ferro a seguito del uso di due medicinali (treatment
). I pazienti sono divisi in 3 categorie in base alla severità dei sintomi (level
).
(2 punti) Si importi il dataset e si verifichi se ci sono errori nei dati. Se ci sono, li si sostituisca con la media dei dati relativi allo stesso gruppo e stesso trattamento. Si calcolino media, mediana e quantili dei dati divisi per trattamento.
(2 punti) Si visualizzi usando degli istogrammi la distribuzione della variabile
retention
al variare del trattamento. Queste informazioni insieme a quelle del punto precedente, ci dicono qualcosa sull’efficacia dei farmaci? Ricordiamo che più alto èretention
, maggiore è l’efficacia del farmaco.(2 punti) Considerando la soglia di confidenza del 95% si verifichi se le medie di
retention
per la severità 1, differiscono in modo statisticamente significativo rispetto al trattamento. Inoltre si visualizzino gli stessi dati usando dei boxplot. Si commentino i risultati.
Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere gli esercizi. I plot devono riportare le opportune label lungo gli assi.