Esame Giugno 2018


Esercizio 1

Si consideri il dataset contenente alcuni dati economici e demografici di 154 nazioni: alfabetizzazione (literacy - %), prodotto interno lordo (gpd - mld $), salario medio (income - $) e spesa militare (military - $). Si importi anche il dataset contente 242 paesi ed il continente di appartenenza.

  1. Si uniscano i due dataset in modo da averne tutte le informazioni in uno solo.
  2. Si analizzi il dataset e si rimuovano i paesi per cui non si hanno informazioni sul continente. Inoltre, si individuino eventuali errori nei dati. Si sostituiscano gli NA con la mediana della stessa variabile nello stesso continente.
  3. Si calcoli media, varianza e quartili delle variabili numeriche. Si visualizzino le righe relative ai primi e ultimi 5 paesi rispetto al valore di gdp.
  4. Si visualizzi la distribuzione delle variabili income e gdp. Si visualizzino inoltre i boxplot per la variabili income e military per continente.
  5. Considerando la soglia di confidenza del 95%, si verifichi se la spesa militare (military) media tra i paesi dei continenti AS e EU differiscono in modo significativo. Cosa di può dire della medie della variabile income? Si commentino i risultati.

Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere gli esercizi. I plot devono riportare le opportune label lungo gli assi.