Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo

Pagina creata da Andrea Angelini
 
CONTINUA A LEGGERE
Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo
Dati FAIR e Data Management Plan
                                Corso UniTo maggio-giugno 2020

                                                                                                                                                           Elena Giglia
                                                                                                                                                         elena.giglia@unito.it
                                                                                                                                                                      @egiglia

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License. Photos are mine, available for reuse on Flickr, https://www.flickr.com/photos/eg65/albums/
Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo
Impareremo in questo modulo
1. Cosa significa FAIR nella ricerca
  quotidiana
2. come scrivere un DMP (Data
  Management Plan)
MESSAGGI CHIAVE
• FAIR è il futuro
  (se no si resta tagliati fuori)
• È più facile di quanto sembri, basta
  provarci
• DMP online è pronto all’uso, basta fare
  pratica
Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo
FAIR train – GoFAIR video

  FARM DATA TRAIN

                     PERSONAL HEALTH TRAIN
Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo
…FAIR SIGNIFICA
[anche e soprattutto per le macchine]
                           FAIR guide, Nature, March 2016

     FINDABLE
    • IDENTIFICATIVI
                                      ACCESSIBLE
      • METADATI
                       • DOVE SONO CONSERVATI E A QUALI
                             CONDIZIONI DI ACCESSO
                           • NON SIGNIFICA «OPEN»
                              • FORMATI APERTI
     INTEROPERABLE
         • STANDARDS                      REUSABLE
         • ONTOLOGIE
                               • LICENZE D’USO
                             • DOCUMENTAZIONE
                          • LEGGIBILI DALLE MACCHINE
Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo
Nov. 20, 2018

 … a report from Vienna
Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo
FAIR data – the ideal FAIR object

                            Making Open Science a reality, OECD, 2015
Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo
FAIR: technology VS domain

                                                      CC BY Erik Schultes
       https://www.go-fair.org/wp-content/uploads/2018/11/26102018_Country_meeting_GFISCO_staff_presentation.pdf
Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo
… sfumature di FAIR       Training

                      https://www.ands-nectar-rds.org.au/fair-tool
Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo
FAIR maturity evaluator

                                                           Sept. 20, 2019

                                 FAIR evaluation service

         • OGGETTIVO
  • LEGGIBILE DALLE MACCHINE –
         COME I DATI FAIR
Dati FAIR e Data Management Plan - Corso UniTo maggio-giugno 2020 - Zenodo
FAIR Data management wizard
F = Findable. Metadata

                   https://www.ands.org.au/working-with-data/metadata
F = Findable. Metadata standards

http://rd-alliance.github.io/metadata-directory/standards/
F = findable. Metadata tools

               https://metadatacenter.org/
F = Findable. Persistent identifiers

                               - ASSEGNATE DOI
                                DIGITAL OBJECT
                                   IDENTIFIER
                                 - USATE ORCID
         https://orcid.org/

                              https://www.datacite.org/
ORCID – ID. Tutto intorno a me
                   CREATE E MANTENETE UN
                 PROFILO ORCID. ATTIVA TUTTI I
                        MECCANISMI!
ACCESSIBLE≠OPEN
A = Accessible   «ACCESSO» PUÒ ANCHE ESSERE
                 RISERVATO O SOTTO EMBARGO

                  CESSDA Guide
A = Accesible. Data repositories
A = Accessible. Data lab [in progress]
               Data lab
A = Accessible. Data repositories

                           Where to keep research data
A = Accessible. Cercate un
archivio?

                         https://www.re3data.org/
[trusted repositories]

    Dec. 2018
A = Accessible. Data journals
A = Accessible. Formati

https://dans.knaw.nl/en/deposit/information-about-depositing-data/before-depositing/file-formats
A = Accessibile / formats [UK Data service]

https://www.ukdataservice.ac.uk/manage-data/format/recommended-formats.aspx
A = Accessible. Conservazione

 LUNGO O BREVE
   TERMINE?

  http://checksumchecker.sourceforge.net/
A = Accessible. Conservazione

                                                                         CESSDA Guide

      Differenti bisogni, differenti strumenti. Durante l’esperimento,
                    dovete poter condividere con il team
Cosa conservare?       How to develop

                     • Rilevanti per la
                       missione dell’ente
                      • Valore storico
                         • Unicità
                   • Potenziale di riuso
                     • Non replicabili
                     • Costo/benefici
                    • Documentazione
                           completa
I = Interoperable. Standards

    http://training.parthenos-project.eu/sample-page/intro-to-ri/interoperability/what-are-standards/
I = Interoperable. Standards

          http://ssk.huma-num.fr/#/
I = Interoperable

                    2019
I= Interoperable – adding ontologies

                                                    https://fair-dom.org/platform/

        https://fair-dom.org/platform/rightfield/
[FAIRsharing. Per essere
      interoperabili]

https://fairsharing.org
R = Reusable. Documentazione
                                                        DOCUMENTAZIONE (README FILE) PER
                                                         - EVITARE USO SCORRETTO/CATTIVE
                                                          INTERPRETAZIONI DEI VOSTRI DATI
                                                               - MANTENERE INTEGRITÀ

https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide/2.-Organise-Document/Documentation-and-metadata
R = Reusable. Documentazione
                                                       http://jupyter.org/index.ht

            https://www.rstudio.com/

                       …why not?
             - protocols.io per i protocolli
       - Open Lab Notebook tiene traccia di tutto il
           lavoro (difficile la prima volta, poi…)
R= Reusable. Licenze
             Copyright: protects the STRUCTURE,
             selection or arrangement of their Sui generis database right: protects
             contents" (Art. 3) NOT THE DATA the «substantial effort» in OBTAINING
                                                 data [NOT «CREATING»]… the right
                                                 owner often is the institution
                  Database=a collection of independent
                  works, data or other materials arranged in a
                  systematic or methodical way (Art.1)

                                                                                    2014

 RICORDA: NESSUN
COPYRIGHT SUI DATI
  (NON CREATIVI)
[DMP]
 [webinar]
         2019

                                         2020

  - POSSONO ESSERCI ALTRE FORME DI
 PROTEZIONE DEI DATI (ES. CONTRATTI)
- PER DATI CHE RICADONO SOTTO GDPR
VA SEMPRE ESPLICITATA LA BASE LEGALE
 SULLA QUALE SI CONDUCE LA RICERCA
[non suoniamo tutti la stessa musica]

                                  CESSDA guide
[regole chiare dall’inizio]

                                                  Safe to be open 2016

         … FISSATE REGOLE CHIARE DA SUBITO
        - CHI HA I DIRITTI SUI DATI (SE ESISTE)
       - CHI DEVE PROVVEDERE A CONSERVARE
                - CHI PUÒ SFRUTTARE
R = Reusable. Licenze

               http://www.dcc.ac.uk/resources/how-guides/license-research-data
Creative Commons e Open Science

https://doi.org/10.5281/zenodo.840651
Creative Commons     e  Open
             USARE UNA CC0
                             Science
             - NON SIGNIFICA
               DIVENTARE
               ACCADEMICAMENTE
               MALEDUCATI
             - LA FONTE VA CITATA
               SEMPRE
             - USATE LA CC0 E
               ASSOCIATE UNA
               FORMULAZIONE
               DELLA CITAZIONE CHE
               RICHIEDETE (DA
               COIPARE/INCOLLARE)
…in sintesi…

               S. Aliprandi
…pausa?
UN MODO
         STRUTTURATO DI     REGOLE CHIARE=MENO
         PENSARE AI DATI      ERRORI DA SUBITO

                           È UN «LIVING DOCUMENT»,
                             CRESCE COL PROGETTO

DOVE METTERE TUTTE QUESTE INFORMAZIONI?
NEL DATA MANAGEMENT PLAN
Trucchi e suggerimenti
                  SINTETICO E
                   SPECIFICO                            NON COPIATE
                                                                        OGNI DATASET È
                                                                         UNICO, OGNI
               FOSTER toolkit                                         INFRASTRUTTURA È
                                                                     UNICA, OGNI RICERCA
                                                                          HA LA SUA
                                                                        IMPOSTAZIONE

                                                                 CIÒ CHE DICHIARATE NEL
                                                                    DMP POI VA FATTO
                                                                  VERAMENTE… QUINDI
                                ESSERE GENERICI NON SERVE            A) NON FATE GLI
                                          A NULLA                        SPLENDIDI
   • USATE TABELLE,
                                  [we expect a huge size of      B) NON IMPEGNATEVI A
     ELENCHI PUNTATI
                                 data; data will be available]         FARE COSE CHE
 • SIATE SCHEMATICI E
                                                                     SAPETE IMPOSSIBILI
    NON DILUNGATEVI                                              Es. DATI PSEUDONIMYZED, non
                                                                          ANONIMYZED
Vantaggi di un DMP
                               CESSDA Guide

                CESSDA Guide

   È FONDAMENTALE PER
STIMARE I COSTI DI GESTIONE
     - STIMATE LA DATA
  STEWARDSHIP (IN-KIND?)
-POSSIBILI COSTI DI STORAGE
COSTI SONO RIMBORSABILI IN
   H2020 (6.2.D.3 AMGA)
Costs - data curation

                               ELIGIBLE COSTS:
                             - DATA CURATION
                              - DATA STORAGE
                           - DATA MANAGEMENT

       http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/amga/h2020-amga_en.pdf#page=238
DMP Core Requirements
                                    Dec. 2018

                   SEZIONI MINIME
                     IN UN DMP
DMP Core Requirements
                            Dec. 2018

              UTILI COME
            SPUNTO PER LE
             PRIME VOLTE
DMP questions

                                                             UTILI COME
                                                           SPUNTO PER LE
                                                            PRIME VOLTE

https://www.cessda.eu/content/download/4302/48656/file/TTT_DO_DMPExpertGuide_v1.2.pdf
DMP questions

             UTILI COME
           SPUNTO PER LE
            PRIME VOLTE
DMP - questions   https://fair-dom.org/knowledgehub/data-management-checklist/

                             UTILI COME
                           SPUNTO PER LE
                            PRIME VOLTE
PERSONALIZZABILE           DMP online

https://dmponline.dcc.ac.uk/
PREDISPOSTO PER                     ALLA FINE,
  LE 3 VERSIONI                   SCARICA IL PDF

                  CONDIVISIBILE
                      PER                          IDENTIFICATIVI
                   SCRIVERLO
                    INSIEME

                                    GUIDA
PRIVATO O PUBBLICO?

    SI POSSONO INVITARE
COLLABORATORI CON LIVELLI DI
     PERMESSO DIVERSI
…E NON «A
                                    HUGE AMOUNT
                                      OF DATA»

                                           COSTI

       GUIDA RAPIDA

                                                   TABELLA PER DATI DI
                       = README                     FORMATO DIVERSO
                          FILE

    SCRIVETE                ALTRE GUIDE
 DIRETTAMENTE                SPECIFICHE
(USATE TABELLE E
 PUNTI ELENCO)
                                  USATE FORMATI
                                  STANDARD (CON
 IN OGNI PASSAGGIO POTETE
                                     ELENCO)
SALVARE E CONTINUARE DOPO
APRE LA
                               DIRECTORY DEI
                                 METADATA
                                STANDARDS

RICORDA GENTILEMENTE CHE
TUTTI I DATI DEVONO ESSERE
   APERTI (SE POSSIBILE)

            APRE REGISTRY OF
              REPOSITORIES
RICORDATE LORO CHE
HANNO FIRMATO UN
GRANT AGREEMENT…
RICORDARE SEMPRE
         CHE EVENTUALI
           COSTI SONO
          RIMBORSABILI

…QUI SAREBBE UTILE POLICY
DI ATENEO; SAREBBE SEZIONE
       PRECOMPILATA
BASE LEGALE PER DATI
PERSONALI; CONSENSI
INFORMATI VANNO IN
  QUESTA SEZIONE

      QUI SAREBBE
     URGENTE UNA
    POLICY DI ATENEO
AL TERMINE SI SCARICA NEL
    FORMATO PREFERITO
(PDF, CSV, HTML, TXT) CON UN
 MINIMO DI FORMATTAZIONE
Open data – H2020

                    Guide 2016

 IN HORIZON 2020
  DMP ENTRO M6
COME DELIVERABLE
Open data – H2020

               1) DEPOSITARE IN UN DATA REPOSITORY
 2) RENDERE I DATI OPEN ACCESS CON LA LICENZA PIÙ APERTA POSSIBILE
                      3) POSSIBILE EMBARGO
   4) FORNIRE ANCHE TUTTE LE INFORMAZIONI UTILI A VALIDARE I DATI
… ora tocca a voi!
Puoi anche leggere