Lezione5

Ipotesi statistiche

Originally posted here.

Ipotesi statistiche

Le note riportano una breve introduzione sui test statistici con R.

Breve esercizio

  1. Si leggano i dati regionali della protezione civile relativi a COVID-19 al link. Si salvino in un opportuno dataframe.
  2. Si verifichi se il valore medio di nuovi contagi tra tutte le regioni durante il mese di Aprile è statisticamente maggiore di 135 rispetto alla soglia di significatività del 99%.
  3. Si ripeta separatamente l’analisi per Piemonte e Toscana (nello stesso periodo). Si commentino i risultati.
  4. Se verifichi se il valore medio dei nuovi guariti (come definiti nella scorsa lezione) in Veneto ed Emilia Romagna sono statisticamente differenti.

Esercitazione 2

Si scarichi il dataset al link e si eseguano le operazioni:

  1. Si importi il dataset.
  2. Si crei un nuovo dataset contenente solo le righe corrispondenti alla variabile Idataset uguale all’ultimo numero del proprio numero di matricola. Dopo aver fatto ciò, si rimuova la variabile. Le seguenti analisi si intendono su questo dataset.
  3. Si analizzi la struttura del dataset, si verifichi il numero di righe e colonne contenute. Il dataset è stato letto bene? E’ tidy?
  4. Si verifichi la presenza di eventuali errori nei dati e si sostituiscano con la mediana.
  5. Si calcolino media, mediana, minimo, massimo e quartili e deviazione standard.
  6. Si visualizzi la distribuzione delle variabili x e y e i loro box plot.
  7. Si visualizzino i dati mediante uno scatterplot.

Soluzione

Il dataset completo e una discussione riguardo i dati usati per l’esercizio sono disponibili qui.

© 2017-2020 Federico Reali