Esame Settembre 2019

Esercizio 1

Si consideri il dataset (descrizione) che riporta i dati orari relativi al volume di traffico sull’interstatale I-94.

  • (2 punti) Si importi il dataset in R e si verifichi la correttezza del contenuto. Si sostituiscano eventuali errori con la media della stessa variabile.
  • (3 punti) Dopo aver creato una nuova variabile riportante solo la data delle misurazioni, si crei un nuovo dataset che per ogni giorno riporti il traffico massimo e medio registrato dalla variabile traffic_volume. Il resto dell’esercizio si intende su questo nuovo dataset.
  • (2 punti) Si calcolino media e deviazione standard del traffico medio giornaliero negli anni dal 2013 al 2016 inclusi. Quante misurazioni ci sono per ogni anno? Si commentino i risultati.
  • (2 punti) Si visualizzi l’andamento del traffico medio e massimo rispetto al tempo nel periodo dal 2016 al 2017 inclusi. Riusciamo a individuare qualche pattern?
  • (1 punto) Si determini se la differenza delle medie del volume di traffico nel 2015 e nel 2016 è statisticamente significativa.

Si produca uno script funzionante (o un notebook) che contiene tutto il codice per risolvere l’esercizio.