Esame Giugno 2019

Esercizio 1

Si consideri il dataset (descrizione) che riporta 14 parametri di 303 pazienti con problemi di cuore.

  • (1 punto) Si importi il dataset in R e si verifichi la correttezza del contenuto.
  • (2 punti) Si dividano i dati un due dataset in base ai valori della variabile Target. Se Target è uguale a 0, il paziente non ha avuto malattie cardiache. Se Target è uguale a 1 ne ha avute. Le seguenti analisi si intendono su entrambi i dataset.
  • (3 punti) Per entrambi i dataset, si visualizzino potenziali outliers della variabile chol usando i boxplot e si rimuovano le righe relative agli outliers. Dopo si verifichi la corretta rimozione di tutti gli outliers. Quante righe abbiamo rimosso? Si commentino i risultati. Le seguenti analisi si intendono sui dataset dove sono state rimosse queste righe.
  • (2 punti) Si calcolino media, mediana, quartili e deviazione standard per le variabili chol e thalach.
  • (2 punti) Si calcolino gli intervalli di confidenza bilateri (95%) per la variabile thalach dei dataset sani e malati. Si commentino i risultati. (suggerimento: si usi t.test)
  • (1 punto) Si determini se la differenza delle medie è statisticamente significativa (p-value) e si commenti il risultato.

Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere l’esercizio.

Soluzione