Principi della politica dei dati dell’INGV

Autori: G. Puglisi (coordinatore), R. Basili, A.G. Chiodetti, A. Cianchi, M. Drudi, C. Freda, M. Locati, M. Pignone, A. Sangianantoni
Data: 13 Febbraio 2016

1. Premessa

L’Istituto Nazionale di Geofisica e Vulcanologia (INGV) è un Ente pubblico di ricerca non strumentale, dotato di personalità giuridica di diritto pubblico e di ordinamento autonomo, che realizza attività di ricerca nel campo delle discipline geofisiche nel campo dei Terremoti, dei Vulcani e dell’Ambiente e che si prefigge di assicurare una ricerca e un’innovazione responsabile mettendo i risultati della ricerca a disposizione di tutti, secondo le norme ed i principi riportati nel presente documento, e favorendo la partecipazione della società.

L’INGV è responsabile del servizio di sorveglianza sismica, vulcanica e dei maremoti nel territorio nazionale e nell’area mediterranea; coordina l’attività delle reti sismiche regionali e locali; partecipa alle reti di studio e di sorveglianza europee e globali; svolge attività di divulgazione e promuove iniziative di comunicazione, informazione e formazione nella scuola e nella società ai fini della riduzione del rischio associato alle fenomenologie relative alle proprie aree di ricerca; è componente del Servizio Nazionale di Protezione Civile, nonché Centro di Competenza del Dipartimento della Protezione Civile per conto del quale mantiene operative attività di sorveglianza h24 ed effettua progetti di ricerca con obiettivi dedicati nell’ambito di specifiche convenzioni

L’INGV ha una struttura articolata con una forte connotazione territoriale presso le Sezioni.

In questo contesto, la necessità di stabilire una Politica dei Dati nasce dal bisogno di:

  • governare la molteplicità dei dati prodotti;
  • enunciare i principi ispiratori sui quali impostare una condivisa gestione istituzionale dei dati;
  • gestire l’accesso, l’uso, il riuso degli stessi.

L’Accesso Aperto è un principio fondamentale per l’INGV, che svolge un ruolo di rilievo nella società. In conformità a ciò, l’INGV, consapevole dei benefici dell’Accesso Aperto per la ricerca in termini di visibilità, promozione ed internazionalizzazione, ha sottoscritto il Position Statement sull’Accesso Aperto ai risultati della ricerca scientifica in Italia, nel maggio 2013, impegnandosi alla realizzazione effettiva dei principi dell’Open Access, attraverso l’adozione di una propria politica dei dati.

L’INGV adotta la Politica dei Dati al fine, di consentire un accesso libero, aperto, pieno e tempestivo dei propri dati, rispettando i principi dell’Accesso Aperto stabiliti nella normativa nazionale e comunitaria ed in accordo con le finalità istituzionali, la struttura e l’organizzazione dell’istituto.

La Politica dei dati fissa atti di indirizzo per:

  • Personale dell’INGV;
  • Strutture di Ricerca e Sezioni;
  • Enti Nazionali e Internazionali che accedono ai dati prodotti nell’ambito delle attività istituzionali;
  • Istituzioni ed enti destinatari di prodotti della ricerca per scopi di sorveglianza e gestione dei rischi naturali;
  • Studenti, ricercatori per finalità didattiche, scientifiche e di ricerca;
  • Imprese;
  • Qualunque altro soggetto, sia esso privato o pubblico, persona fisica o giuridica che abbia qualunque interesse sui dati dell’INGV, come di seguito definiti.

L’insieme delle figure sopra identificate può essere indicato complessivamente con il termine inglese stakeholder.

L’elaborazione dei principi di gestione dei dati, nel rispetto dei diritti di proprietà intellettuale e garantendo la massima valorizzazione e tutela dei ricercatori e dei risultati, risponde all’interesse pubblico della collettività-comunità di:

  • accedere e condividere pienamente la conoscenza prodotta dall’INGV;
  • di contribuire al progresso;
  • favorire la libera circolazione delle idee.

2. Definizioni

L’INGV adotta le seguenti definizioni al fine di attribuire significato univoco a termini usati e per rendere gli strumenti di applicazione della Politica dei Dati in accordo con le vigenti norme.

Dati (Data)

Per dati si intendono singoli oggetti o registrazioni di qualunque natura (fisica o digitale), a qualunque livello di elaborazione e comunque organizzati oltre ai prodotti della ricerca ancorché non pubblicati. Il termine di “dato” è così utilizzato in questa sede nella sua accezione più generale e si riferisce sia alle pubblicazioni, sia al dato grezzo acquisito dal sensore, sia al campione fisico di qualunque natura, sia ad un prodotto derivato ottenuto da una qualunque analisi sul dato a qualunque livello di elaborazione sia essa di tipo automatico o manuale. Ai fini di rendere congrue le definizioni utilizzate con la normativa vigente è utile ricordare che i dati possono essere classificati in:

  • dati statici: sono quelli che non vengono più aggiornati una volta generati e/o pubblicati;

  • dati dinamici: sono quelli che possono essere modificati o estesi successivamente alla loro pubblicazione. Questi possono essere ulteriormente suddivisi in base alla tipologia di variazione:

  • dati oggetto di revisione, quando possono essere modificati al fine di migliorarne la qualità/affidabilità;

  • dati prodotti in continuo, come nel caso di sensori che generano una serie temporale;

  • dati territoriali, qualunque informazione geograficamente localizzata [1];

  • dati personali, qualunque informazione relativa a persona fisica, persona giuridica, ente od associazione, identificati o identificabili, anche indirettamente, mediante riferimento a qualsiasi altra informazione, ivi compreso un numero di identificazione personale;

  • altre tipologie di dati, definite come “tutte le basi di dati gestite per il perseguimento dei fini istituzionali, comprese quelle connesse al funzionamento dell’amministrazione” [2];

  • dati aperti, cioè “usabili, riutilizzabili e ri-distribuibili liberamente da chiunque anche per finalità commerciali, soggetto al massimo alla richiesta di attribuzione e condivisione allo stesso modo” [3].

[1]
Seguendo la direttiva comunitaria INSPIRE sono “dati che attengono, direttamente o indirettamente, a una località o un’area geografica specifica” (EC Directive 2007/2/EC)
[2]
Sono quelle informazioni legate, ad esempio, al personale, bilancio, protocollo, gestione documentale, ecc.)” (Art. 24-quater, comma 2, D.L. n. 90/2014, convertito in Legge n. 114/2014)
[3]

Il Codice dell’Amministrazione Digitale (CAD; D.Lgs. 7 marzo 2005 n.82, Art. 68, comma 3) considera dati digitali di tipo aperto quelli che presentano le seguenti caratteristiche:

  • sono disponibili secondo i termini di una licenza che ne permetta l’utilizzo da parte di chiunque, anche per finalità commerciali, in formato disaggregato;
  • sono accessibili attraverso le tecnologie dell’informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, in formati aperti, sono adatti all’utilizzo automatico da parte di programmi per elaboratori e sono provvisti dei relativi metadati;
  • sono resi disponibili gratuitamente attraverso le tecnologie dell’informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, oppure sono resi disponibili ai costi marginali sostenuti per la loro riproduzione e divulgazione.

Metadato (Metadata)

Per metadato si intende un insieme strutturato di informazioni che descrivono un dato. Ad esempio le informazioni possono riferirsi al sensore che ha fornito il dato (p.e., posizione, tipologia, calibrazione del sensore, ecc.), alla tecnica di acquisizione del dato (p.e., frequenza di campionamento, ecc.), alle modalità di analisi del dato (p.e., laboratorio di analisi, tipo di modello utilizzato, ecc.), oppure al contesto in cui il dato è stato generato (p.e., progetto, attività ordinaria, ecc.).

Banca dati (Database)

Per banca dati si intende una raccolta di dati, come sopra definiti, sistematicamente o metodicamente disposti ed individualmente accessibili mediante mezzi elettronici o in altro modo. La tutela delle banche di dati non si estende al loro contenuto e lascia impregiudicati diritti esistenti su tale contenuto.

Accesso aperto (Open Access)

In generale per accesso aperto si intende la pratica di garantire l’accesso all’informazione scientifica senza costi aggiuntivi per l’utente finale, ad esclusione dei costi marginali sostenuti per la loro riproduzione e divulgazione, e che sia da questo riusabile.

Proprietà intellettuale (Intellectual Property)

La Proprietà Intellettuale indica un sistema di tutela giuridica dei beni immateriali, nel caso specifico i dati.

Produttore di dati / autore del prodotto (Data producer, Author)

Per produttore o autore dei dati o prodotti si intende il singolo ricercatore o gruppo di ricerca che produce il dato con mezzi e risorse fornite dall’istituto, incluso il costo del personale, sia con fondi interni (ordinari), sia esterni (p.e. da progetti, convenzioni, ecc.).

Utenti (Users)

Per Utenti si intendono sia persone fisiche, sia persone giuridiche, quali istituti di ricerca, enti pubblici o privati , associazioni, imprese, etc., che richiedono l’accesso al dato per scopi da loro definiti.

Licenza di uso (Licences)

La Licenza di uso è lo strumento (p.e., contratto) nel quale sono definite le regole e condizioni da rispettare per poter utilizzare il dato.

Servizi (Services)

Per servizio si intende una qualunque delle seguenti operazioni applicabili ad una banca dati, p.e.: Ricerca di dati, Visualizzazione, Trasferimento, Trasformazione, Modifica e/o aggiornamento. Il singolo servizio disponibile per una banca dati, può essere:

  • Aperto (Open): il servizio è liberamente disponibile ed accessibile a chiunque, senza restrizioni;

  • Limitato (Restricted): il servizio è disponibile, ma solo alle condizioni stabilite o concordate dal/col titolare del diritto di sfruttamento della proprietà intellettuale; un particolare caso è quello dei dati per i quali non è possibile accedere ad un certo tipo di servizio (tipicamente il trasferimento), per un periodo di tempo predefinito (in inglese “embargo period”).

    1. Accesso (Access)

Per accesso si intende l’autorizzazione o diritto di un utente ad usare uno o più dei servizi disponibili per una banca dati. Tali accessi possono essere distinti in relazioni alle modalità di identificazione e registrazione dell’utente:

  • Anonimo (Anonymous/Guest): in questo caso l’accesso al/ai servizi avviene senza alcuna identificazione o procedura di accredito;
  • Registrato (Registered/Standard): in questo caso l’accesso al/ai servizi richiede una identificazione mediante delle procedure di accredito che possono essere automatizzate;
  • Autorizzato (Authorized): in questo caso l’accesso al/ai servizi richiede una specifica autorizzazione da parte del gestore della banca dati.

Ai fini della sicurezza informatica, le procedure di accesso svolgono tre funzioni: l’identificazione dell’utente (Identification), l’autenticazione delle credenziali (Authentication) e l’abilitazione all’uso di taluni servizi (Authorization).

Identificativo Persistente (Persistent Identifier).

L’identificativo Persistente è un codice alfanumerico la cui struttura è definita all’interno di sistemi di gestione degli oggetti (dati, libri, persone, campioni fisici, etc.), alcuni dei quali seguono standard aperti e condivisi a livello internazionale (Open Standards). L’aggettivo “Persistente” si riferisce alla caratteristica di garantire che l’associazione tra il codice identificativo e la posizione sul Web dell’oggetto associato sia mantenuta nel tempo. Ciò implica non solo che il sistema di gestione dell’identificativo sia mantenuto funzionante nel tempo, ma che lo sia anche l’accesso all’oggetto associato. Un dato può essere associato ad uno o più tipi di Identificativi Persistenti.

3. Principi

L’INGV, nella consapevolezza di voler realizzare un ambiente di ricerca aperto, collaborativo e internazionale, basato sulla reciprocità, adotta i seguenti Principi per la gestione dei Dati prodotti nell’ambito di attività di ricerca finanziate con fondi pubblici:

3.1 Accesso Aperto

L’INGV adotta il principio dell’Accesso Aperto ai dati di ricerca prodotti nell’ambito di attività di ricerca finanziate con fondi pubblici al fine di:

  • consentire un accesso libero, aperto, pieno e tempestivo dei propri dati;

  • migliorare la qualità dei dati, la pertinenza, l’accettabilità e la sostenibilità dei risultati;

  • ridurre l’eventualità di duplicazione delle attività di ricerca;

  • accelerare il progresso scientifico;

  • dare modo agli stakeholders di interagire nel ciclo di ricerca, integrando le attese, le necessità, gli interessi ed i valori della società.

3.2 Identificazione dei Dati

L’INGV si impegna a rendere pubblicamente accessibili, utilizzabili e riutilizzabili i dati prodotti, nell’ambito di attività di ricerca finanziate con fondi pubblici per mezzo di apposita/e infrastruttura/e elettroniche digitali.

I dati saranno identificabili e saranno collegati ai relativi metadati per fornire tutti gli elementi necessari per un uso corretto degli stessi.

3.3 Ciclo di vita dei Dati

L’INGV intende promuovere e sviluppare metodologie che consentano di adottare un’impostazione comune a tute le fasi del ciclo di vita dei dati:

  • raccolta / acquisizione;

  • elaborazione / analisi;

  • archiviazione / conservazione;

  • accesso;

  • riuso.

    1. Gestione legale dei Dati

3.4 Gestione legale dei Dati

L’INGV si impegna ad applicare e recepire la complessa e stratificata normativa nazionale e comunitaria vigente riguardante la disponibilità dei dati delle pubbliche amministrazioni, i servizi di accesso ai dati, la regolamentazione della proprietà intellettuale, le modalità della fruibilità del dato ed i criteri per la gestione dei dati aperti. [1]

[1]
Appare arduo includere la molteplicità di interventi legislativi in materia. Pertanto, al fine di sistematizzare e rendere di percezione immediata lo stato delle norme vigenti, è stata predisposta una tabella riepilogativa che include un quadro della normativa esistente a livello internazionale, europeo e nazionale alla data di stesura del presente documento (Allegato 1).

3.5 Interoperabilità

L’INGV si impegna a promuovere il rispetto degli standard nazionali e comunitari di interoperabilità semantica tra le banche dati e ad adottare formati e standard aperti per la codifica e trasferimento dei dati e dei cataloghi dati, intesi come pubblici, documentati esaustivamente e neutri rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi.

3.6 Conservazione

L’INGV promuove la conservazione a lungo termine dei dati in formato digitale, al fine di rispondere all’interesse pubblico (in inglese “digital first”).

Per la realizzazione di tale principio si impegna ad attuare una relativa e progressiva pianificazione finanziaria associata.

3.7 Etica

L’INGV si impegna ad adottare una condotta etica volta ad assicurare una gestione dei dati responsabile mettendo i risultati della ricerca a disposizione degli stakeholder e favorendo la partecipazione della società. L’istituto si impegna inoltre ad adottare le misure necessarie per la mitigazione del rischio di abuso dei dati, o di uso inappropriato dei propri dati e risultati.

3.8 Categorizzazione

Al fine di procedere alla definizione dei principi di appropriata gestione dei dati, l’INGV procede alla seguente categorizzazione:

Categoria Pubblicazioni: Per Pubblicazioni si intendono tutti i prodotti della ricerca pubblicati su riviste, collane o libri, seguendo le rispettive linee editoriali.

Categoria Dati di Ricerca: l’INGV categorizza i dati di ricerca in quattro Livelli distinti sulla base del loro grado di elaborazione:

  • Livello 0: dati grezzi (raw data) o di base, acquisiti in modo automatico o manuale, senza alcun livello di elaborazione, esclusa, al più, una validazione di tipo automatico (esempi: forme d’onda, dati GPS, immagini non calibrate, campioni di roccia, ecc.);
  • Livello 1: prodotti (data products”) ottenuti da procedure automatiche o semi-automatiche (p.e., localizzazione, magnitudo, meccanismi focali dei terremoti, shakemaps, serie storiche dell’ampiezza del tremore vulcanico, dello spostamento di stazioni GPS, ecc.);
  • Livello 2: prodotti (data products”) ottenuti dall’attività di ricerca e comunque sulla base di procedure non automatiche (p.e., modelli crostali, mappe di strain, modelli di sorgente dei terremoti o delle deformazioni, risultati di campagne geofisiche, ecc.);
  • Livello 3: prodotti integrati (integrated data products) ottenuti da analisi complesse che integrano più prodotti di Livello 2 oppure da analisi che integrano prodotti di Livello 1 o 2 di diverse tipologie e/o provenienti da diverse comunità (p.e., mappe di pericolosità, cataloghi di faglie attive, rapporti di attività vulcanica, ecc.).

Per esigenze di chiarezza e valorizzazione delle professionalità, l’INGV si impegna ad istituire un apposito Registro dei Dati della Ricerca che classifichi i dati all’interno dei Livelli sopra definiti associando a ciascuno di questi i necessari attributi per la gestione della titolarità, delle Licenze, degli Identificativi Persistenti, delle regole di accesso e dei necessari collegamenti alla sorgente dei dati.

3.9 Titolarità

Al fine di bilanciare i diritti e il complesso di interessi contrapposti, l’INGV accoglie e recepisce il paradigma dell’Accesso Aperto inteso a favorire l’accesso pubblico all’informazione e alla condivisione del dato, comprimendo, se necessario le esigenze individuali a favore dell’interesse pubblico.

Per i dati di Livello 0 e 1, in considerazione della limitata proprietà intellettuale sugli stessi, l’INGV assume la titolarità piena e pertanto, il Legale rappresentante pro tempore ne gestisce il complesso dei diritti quali l’attribuzione delle Licenze, l’assegnazione degli Identificatori Persistenti e la sottoscrizione di accordi per la gestione e l’uso degli stessi.

Per i dati di Livello 2 e 3 l’INGV si impegna ad adottare un apposito Regolamento per l’attribuzione della paternità di uno specifico dato ad un singolo dipendente dell’INGV o gruppo di lavoro.

La titolarità delle pubblicazioni è stabilita in base alle norme vigenti ed a quelle delle riviste in cui il lavoro viene pubblicato. L’INGV riconosce come modelli editoriali quello proprietario adottato dalla maggior parte delle riviste scientifiche, in cui l’autore cede all’editore il diritto di pubblicare l’opera dell’ingegno cedendo anche il diritto del suo riutilizzo, e quello ad accesso aperto (Green road, Gold road) secondo cui l’autore mantiene i diritti sulla sua opera per il riconoscimento della titolarità, per una maggiore disseminazione dei risultati e per permetterne il riutilizzo.

3.10 Licenze

L’INGV promuove l’adozione delle licenze Creative Commons (vedi Appendice 2) per la gestione dei diritti relativi ai propri dati. Per i dati di cui al Livello 0 e 1 legittimato ad apporre la licenza è l’Istituto, in quanto titolare dei dati, a mezzo del suo rappresentante legale.

3.11 Cultura della Condivisione

L’Istituto si impegna a sostenere i ricercatori che aderiscono a una cultura di condivisione dei risultati delle proprie attività di ricerca incoraggiando e promuovendo l’istituzione di nuovi criteri di misurazione e nuovi indicatori.

3.12 Professionalità

L’INGV per la realizzazione ed effettiva implementazione dei principi della gestione dei dati si impegna all’allocazione di risorse professionali definendo le competenze necessarie e le corrispondenti responsabilità [1].

[1]
Le Linee Guida AgID (2014) individuano le seguenti figure professionali per una appropriata gestione dei dati:
  • Responsabile Open Data (o Data Manager}, con le capacità per gestire sia il lato tecnico che il coordinamento delle diverse attività condotte internamente al gruppo, e per interfacciarsi con figure esterne quali il Responsabile della Trasparenza (D.lgs. n.33 del 14 marzo 2013);
  • Responsabile della banca dati, è la figura dirigenziale responsabile del popolamento del portale di accesso ai dati dell’Ente;
  • Referente tecnico della banca dati, il braccio operativo del Responsabile della banca dati che mantiene operativa l’infrastruttura tecnologica;
  • Referente tematico della banca dati, il referente scientifico che entra nel merito dei contenuti e si interfaccia con gli autori dei dati;
  • Ufficio Statistica, che gestisce la visualizzazione dei dati e ne monitora l’utilizzo, andando se necessario a promuovere l’inclusione di nuovi dati;
  • Ufficio giuridico-amministrativo, che si occupa delle licenze, note legali da associare ai dati, problemi legati alla proprietà intellettuale, privacy e gestione dei dati personali, limitazioni d’utilizzo e d’accesso;
  • Team comunicazione, con le competenze per gestire la comunicazione istituzionale, sia verso l’esterno dell’Ente che al suo interno.

3.13 Assegnazione Identificativi Persistenti

L’INGV si impegna ad adottare identificativi persistenti al fine di realizzare:

  • l’identificazione univoca del dato, indipendentemente dalla sua posizione;
  • la tracciabilità del dato, sia all’interno dell’Ente, sia all’esterno;
  • la durabilità e affidabilità nel tempo, con l’onere della sostenibilità collegato;
  • certificare la paternità dei dati (authorship) e di conseguenza il grado di autorevolezza;
  • una mappatura delle relazioni sia tra i propri dati, sia con dati generati all’esterno;
  • facilitare la protezione degli investimenti.

Al fine di operare una gestione consapevole dell’attribuzione degli identificativi persistenti, l’INGV si doterà di un apposito Regolamento che conterrà istruzioni operative su richiedente, assegnazione licenze, categorizzazione e quant’altro necessario per un’efficace attribuzione.

3.14 Regole di Accesso

L’INGV si impegna a definire per ciascuna categoria e tipo di dati, le modalità di accesso da parte degli utilizzatori i quali dovranno aderire a specifiche regole e condizioni di accesso preliminarmente all’accesso sulla/e infrastrutture elettroniche/digitali.

Le Regole di Accesso saranno previste e definite dopo la realizzazione della/e infrastrutture elettroniche e digitali che gestirà/gestiranno l’accesso ai rispettivi dati.

3.15 Monitoraggio della Politica Dei Dati

L’INGV si impegna al monitoraggio e all’aggiornamento dei Principi a mezzo di un apposito Gruppo di Lavoro, che dovrà allineare la politica dei dati dell’INGV alla continua evoluzione della normativa vigente e del quadro tecnico-scientifico di riferimento in ambito interno, nazionale ed internazionale, di definire le procedure per la corretta gestione dei dati e di garantirne l’applicazione, di promuovere la formazione del personale ai fini dell’applicazione della politica dei dati.