Esercizio 1
Si consideri il dataset (descrizione) che riporta i dati orari relativi al volume di traffico sull’interstatale I-94.
- (2 punti) Si importi il dataset in R e si verifichi la correttezza del contenuto. Si sostituiscano eventuali errori con la media della stessa variabile.
- (3 punti) Dopo aver creato una nuova variabile riportante solo la data delle misurazioni, si crei un nuovo dataset che per ogni giorno riporti il traffico massimo e medio registrato dalla variabile
traffic_volume
. Il resto dell’esercizio si intende su questo nuovo dataset. - (2 punti) Si calcolino media e deviazione standard del traffico medio giornaliero negli anni dal 2013 al 2016 inclusi. Quante misurazioni ci sono per ogni anno? Si commentino i risultati.
- (2 punti) Si visualizzi l’andamento del traffico medio e massimo rispetto al tempo nel periodo dal 2016 al 2017 inclusi. Riusciamo a individuare qualche pattern?
- (1 punto) Si determini se la differenza delle medie del volume di traffico nel 2015 e nel 2016 è statisticamente significativa.
Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere l’esercizio.