Esercizio 1
Si importi il dataset (reperibile qui nella sua interezza) che contiene la descrizione di 611 supereroi, le cui variabili sono Name
(nome), Alignment
(se buoni, cattivi o neutri), Intelligence
(intelligenza), Strength
(forza), Speed
(velocità), Durability
(resistenza), Power
(super-poteri), Combat
(combattimento), Total
(la somma di tutti i precedenti).
- (1 punto) Se il proprio numero di matricola è pari, si crei un nuovo dataset contenente solo i supereroi buoni (
Alignment
good). Se il numero di matricola è dispari, si crei un nuovo dataset contenente solo i cattivi (Alignment
bad). Dopo aver fatto ciò, si rimuova la variabile. Le seguenti analisi si intendono su questo dataset. - (3 punti) Si verifichi la correttezza del contenuto e si analizzino i dati. Si rimuovano tutte le righe contenenti valori 0 o 1 nelle variabili
Intelligence
eCombat
. Quante righe abbiamo rimosso? Le seguenti analisi si intendono sul dataset dove sono state rimosse queste righe. - (2 punti) Si calcolino mediana e range per tutte le variabili numeriche.
- (1 punto) Si visualizzi la distribuzione delle variabili
Intelligence
eCombat
usando degli istogrammi. - (3 punti) Si consideri un modello di regressione lineare per analizzare l’andamento di
Combat
al variare diIntelligence
. Si visualizzino i dati, la retta di regressione, i residui e si confrontino i quantili dei residui con quelli della normale. Si commenti il valore di R^2, i grafici ed i risultati.
Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere gli esercizi. I plot devono riportare le opportune label lungo gli assi.
Soluzione
© 2017-2019 Federico Reali