La gestione FAIR dei dati della ricerca

"As open as possible, as closed as necessary" 

Il ciclo di vita dei dati della ricerca non può più esaurirsi con la progettazione, produzione, analisi e pubblicazione dei risultati. I dati della ricerca sono infatti essi stessi delle risorse da condividere, rendere accessibili e riproducibili ovvero efficacemente ri-utilizzabili. 

La Comunità Europea ha prodotto delle Linee Guida e tecnologie per l’implementazione dei cosiddetti principi FAIR al fine di rendere i metodi di gestione omogenei e aperto l’accesso ai dati. I principi FAIR si basano su supporti elettronici che richiedono il minimo intervento umano data l’enorme quantità e complessità dei dati nonché velocità in cui questi dati vengono creati. I principi si riferiscono a tre tipi di entità: dati (o qualsiasi oggetto digitale), metadati (informazioni su quell'oggetto digitale) e infrastrutture.

L’acronimo FAIR sta per

  • FINDABLE, i dati, metadati, infrastrutture devono poter essere reperibili 
    • ACCESSIBLE, i dati, metadati devono essere accessibili
      • INTEROPERABLE, i dati, metadati devono essere interoperabili 
        • REUSABLE, i dati, metadati devono essere ri-utilizzabili

Per guidare i ricercatori ovvero chi si occupa di raccogliere o produrre dati secondo i principi FAIR (in maniera tale da aderire anche ai requisiti posti da molti enti finanziatori), di seguito è proposta una basica checklist (in inglese) di verifica:      

REPERIBILITA'

Il primo passo per poter ri-utilizzare i dati è poterli rintracciare. I dati e i metadati devono essere resi facilmente leggibili sia dalle persone sia dalle macchine. In particolar modo l’impiego di metadati descritti in un linguaggio macchina è fondamentale per la ricerca automatica di set di dati e servizi.

F1. (Meta)data are assigned a globally unique and persistent identifier
F2. Data are described with rich metadata (defined by R1 below)
F3. Metadata clearly and explicitly include the identifier of the data they describe
F4. (Meta)data are registered or indexed in a searchable resource

ACCESSIBILITA'

Una volta che l’utente ha trovato il dato richiesto, deve poter accedere alle informazioni su come accedere a questi dati tramite autenticazione e autorizzazione. 

A1. (Meta)data are retrievable by their identifier using a standardised communications protocol
A1.1 The protocol is open, free, and universally implementable
A1.2 The protocol allows for an authentication and authorisation procedure, where necessary
A2. Metadata are accessible, even when the data are no longer available

INTEROPERABILITA'

I dati devono essere integrati con altri dati. Inoltre i dati devono essere interoperabili con appliazioni o workflows per l’analisi, il deposito e la processazione.

I1. (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.
I2. (Meta)data use vocabularies that follow FAIR principles
I3. (Meta)data include qualified references to other (meta)data

USABILITA'

I dati e i metadata devono essere descritti molto bene per poter essere riprodotti e/o combinati i diversi contesti.  

R1. Meta(data) are richly described with a plurality of accurate and relevant attributes
R1.1. (Meta)data are released with a clear and accessible data usage license
R1.2. (Meta)data are associated with detailed provenance
R1.3. (Meta)data meet domain-relevant community standards

Per maggiori dettagli e informazioni sui quattro principi FAIR con esempi e approfondimenti nonchè per auto-verificare tramite questionario online l'adesione ai principi, si raccomandano i due seguenti siti:

GO-FAIR
FAIR assessment tool