Esercizio 1
Si consideri il dataset contenente alcuni dati economici e demografici di 154 nazioni: alfabetizzazione (literacy - %), prodotto interno lordo (gpd - mld $), salario medio (income - $) e spesa militare (military - $). Si importi anche il dataset contente 242 paesi ed il continente di appartenenza.
- Si uniscano i due dataset in modo da averne tutte le informazioni in uno solo.
- Si analizzi il dataset e si rimuovano i paesi per cui non si hanno informazioni sul continente. Inoltre, si individuino eventuali errori nei dati. Si sostituiscano gli NA con la mediana della stessa variabile nello stesso continente.
- Si calcoli media, varianza e quartili delle variabili numeriche. Si visualizzino le righe relative ai primi e ultimi 5 paesi rispetto al valore di gdp.
- Si visualizzi la distribuzione delle variabili income e gdp. Si visualizzino inoltre i boxplot per la variabili income e military per continente.
- Considerando la soglia di confidenza del 95%, si verifichi se la spesa militare (military) media tra i paesi dei continenti AS e EU differiscono in modo significativo. Cosa di può dire della medie della variabile income? Si commentino i risultati.
Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere gli esercizi. I plot devono riportare le opportune label lungo gli assi.