Skip to content

Formato richiesto per l'invio dei dati delle previsioni

Nicolò Gozzi edited this page Nov 5, 2024 · 8 revisions

en

Per ogni previsione settimanale e per ogni modello partecipante andrà inviato un file al repository (tramite un'operazione di pull request). Come anticipato in precedenza, i file delle previsioni avranno un percorso all'interno del repository della forma:

previsioni/Team_X-Modello_Y/2024_05.csv

I file delle previsioni dovranno essere dei file CSV (comma-separated values) con le seguenti colonne:

  • anno
  • settimana
  • luogo
  • tipo_valore
  • id_valore
  • orizzonte
  • valore
  • target

anno, settimana: l'anno e la settimana a cui si riferisce la previsione, indicati come numeri interi. Questi devono corrispondere all'anno e alla settimana del report di sorveglianza. Devono inoltre essere gli stessi utilizzati nel nome del file (a meno dello 0 iniziale per le prime 9 settimane dell'anno). Per facilitare il riferimento, nel file supporting-files/forecasting_weeks.csv sono elencati, per i diversi round di previsione, i valori di anno, settimana, e le date relative ai vari orizzonti previsionali. Inoltre, il file previsioni/settimane_<stagione>.csv riporta tutte le settimane possibili per la stagione, indicando per ciascuna settimana: anno, numero della settimana, data di inizio e data di fine.

luogo: un codice di due caratteri (una stringa) che indica il luogo a cui si riferisce la previsione. I valori ammessi sono i seguenti: IT, 01, 02, 03, 04, 05, 06 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21. Il codice IT indica la previsione a livello nazionale, mentre i codici da 01 a 21 si riferiscono alle regioni secondo la seguente mappatura:

  • 01 : Abruzzo
  • 02 : Basilicata
  • 03 : Calabria
  • 04 : Campania
  • 05 : Emilia Romagna
  • 06 : Friuli Venezia Giulia
  • 07 : Lazio
  • 08 : Liguria
  • 09 : Lombardia
  • 10 : Marche
  • 11 : Molise
  • 12 : Provincia autonoma di Bolzano
  • 13 : Provincia autonoma di Trento
  • 14 : Piemonte
  • 15 : Puglia
  • 16 : Sardegna
  • 17 : Sicilia
  • 18 : Toscana
  • 19 : Umbria
  • 20 : Valle d'Aosta
  • 21 : Veneto

Per agevolare la consultazione, nel file supporting-files/region_codes.csv sono fornite le associazioni tra regioni e i rispettivi codici.

tipo_valore: questo campo deve sempre contenere la stringa 'quantile'. (Il campo è ridondante in quanto attualmente tutte le previsioni saranno fornite sotto forma di quantili, ma è presente per garantire la compatibilità con infrastrutture simili a livello europeo).

id_valore: il quantile per il quale si indicano i valori delle previsioni nella colonna valore, nella forma di numero decimale compreso tra 0 e 1. Per ciascuna previsione è obbligatorio indicare i valori per i seguenti quantili: 0.01, 0.025, 0.05, 0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95, 0.975, 0.99. Ad esempio, i quantili di ordine 0.025 e 0.975 per una determinata settimana ed un determinato luogo devono rappresentare il 95% dei valori stimati, corrispondenti ad un intervallo di confidenza del 95%.

orizzonte: un numero intero che indica la settimana obiettivo della previsione, a partire dalla settimana di riferimento corrispondente al report di sorveglianza. I valori ammessi sono -1, 0, 1, 2, 3 e 4. I valori -1 e 0 corrispondono al nowcasting della ultima e della penultima settimana. I valori 1, 2, 3, 4 indicano, rispettivamente, la previsione ad una settimana, a due settimane, a tre settimane o a quattro settimane.

valore: un numero decimale che indica la previsione, ovvero il valore dell'incidenza settimanale stimato (casi settimanali per 1000 assistiti) al termine della settimana (la domenica) indicata nella colonna orizzonte, per il quantile e il luogo indicati nelle colonne id_valore e luogo.

target: una stringa che indica il target a cui la predizione fa riferimento. Può assumere i valori ILI, ILI+_FLU_A, e ILI+_FLU_B. Le previsioni per target diversi devono essere incluse nello stesso file.

Esempio

La seguente cella mostra alcune righe da un esempio di file CSV conforme al formato richiesto:

anno,settimana,luogo,tipo_valore,id_valore,orizzonte,valore,target
2023,45,IT,quantile,0.975,1,0.982,ILI
2023,45,IT,quantile,0.975,2,0.995,ILI
2023,45,IT,quantile,0.975,3,1.084,ILI
2023,45,IT,quantile,0.975,4,1.174,ILI
2023,45,IT,quantile,0.5,1,0.934,ILI+_FLU_A
2023,45,IT,quantile,0.5,2,0.956,ILI+_FLU_A