Esercizio 1
Si consideri il dataset (descrizione) che riporta 14 parametri di 303 pazienti con problemi di cuore.
- (1 punto) Si importi il dataset in R e si verifichi la correttezza del contenuto.
- (2 punti) Si dividano i dati un due dataset in base ai valori della variabile
Target
. SeTarget
è uguale a 0, il paziente non ha avuto malattie cardiache. SeTarget
è uguale a 1 ne ha avute. Le seguenti analisi si intendono su entrambi i dataset. - (3 punti) Per entrambi i dataset, si visualizzino potenziali outliers della variabile
chol
usando i boxplot e si rimuovano le righe relative agli outliers. Dopo si verifichi la corretta rimozione di tutti gli outliers. Quante righe abbiamo rimosso? Si commentino i risultati. Le seguenti analisi si intendono sui dataset dove sono state rimosse queste righe. - (2 punti) Si calcolino media, mediana, quartili e deviazione standard per le variabili
chol
ethalach
. - (2 punti) Si calcolino gli intervalli di confidenza bilateri (95%) per la variabile
thalach
dei dataset sani e malati. Si commentino i risultati. (suggerimento: si usit.test
) - (1 punto) Si determini se la differenza delle medie è statisticamente significativa (p-value) e si commenti il risultato.
Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere l’esercizio.