II Prova Intermedia 2019

Esercizio 1

Si importi il dataset (reperibile qui nella sua interezza) che contiene la descrizione di 611 supereroi, le cui variabili sono Name (nome), Alignment (se buoni, cattivi o neutri), Intelligence (intelligenza), Strength (forza), Speed (velocità), Durability (resistenza), Power (super-poteri), Combat (combattimento), Total (la somma di tutti i precedenti).

  • (1 punto) Se il proprio numero di matricola è pari, si crei un nuovo dataset contenente solo i supereroi buoni (Alignment good). Se il numero di matricola è dispari, si crei un nuovo dataset contenente solo i cattivi (Alignment bad). Dopo aver fatto ciò, si rimuova la variabile. Le seguenti analisi si intendono su questo dataset.
  • (3 punti) Si verifichi la correttezza del contenuto e si analizzino i dati. Si rimuovano tutte le righe contenenti valori 0 o 1 nelle variabili Intelligence e Combat. Quante righe abbiamo rimosso? Le seguenti analisi si intendono sul dataset dove sono state rimosse queste righe.
  • (2 punti) Si calcolino mediana e range per tutte le variabili numeriche.
  • (1 punto) Si visualizzi la distribuzione delle variabili Intelligence e Combat usando degli istogrammi.
  • (3 punti) Si consideri un modello di regressione lineare per analizzare l’andamento di Combat al variare di Intelligence. Si visualizzino i dati, la retta di regressione, i residui e si confrontino i quantili dei residui con quelli della normale. Si commenti il valore di R^2, i grafici ed i risultati.

Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere gli esercizi. I plot devono riportare le opportune label lungo gli assi.

Soluzione

© 2017-2019 Federico Reali