
Esercizio 1
Si importi il dataset (reperibile qui nella sua interezza) che contiene la descrizione di 611 supereroi, le cui variabili sono Name (nome), Alignment (se buoni, cattivi o neutri), Intelligence (intelligenza), Strength (forza), Speed (velocità), Durability (resistenza), Power (super-poteri), Combat (combattimento), Total (la somma di tutti i precedenti).
- (1 punto) Se il proprio numero di matricola è pari, si crei un nuovo dataset contenente solo i supereroi buoni (
Alignmentgood). Se il numero di matricola è dispari, si crei un nuovo dataset contenente solo i cattivi (Alignmentbad). Dopo aver fatto ciò, si rimuova la variabile. Le seguenti analisi si intendono su questo dataset. - (3 punti) Si verifichi la correttezza del contenuto e si analizzino i dati. Si rimuovano tutte le righe contenenti valori 0 o 1 nelle variabili
IntelligenceeCombat. Quante righe abbiamo rimosso? Le seguenti analisi si intendono sul dataset dove sono state rimosse queste righe. - (2 punti) Si calcolino mediana e range per tutte le variabili numeriche.
- (1 punto) Si visualizzi la distribuzione delle variabili
IntelligenceeCombatusando degli istogrammi. - (3 punti) Si consideri un modello di regressione lineare per analizzare l’andamento di
Combatal variare diIntelligence. Si visualizzino i dati, la retta di regressione, i residui e si confrontino i quantili dei residui con quelli della normale. Si commenti il valore di R^2, i grafici ed i risultati.
Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere gli esercizi. I plot devono riportare le opportune label lungo gli assi.
Soluzione
© 2017-2019 Federico Reali