Riccardo Smareglia
- INAF
- http://www.inaf.it/
Riccardo Smareglia lavora presso l'INAF (Istituto Nazionale di Astrofisica - Osservatoio Astronomico di Trieste) ed è a Capo dell'ufficio ICT e Data Management della Direzione Scientifica. Gestisce da oltre 10 anni il Centro Archivi Astronomici Italiani (IA2) ed è coinvolto in diversi progetti nazionali ed internazionali tra cui IVOA, RDA e SKA. Ha partecipato a diversi progetti sulla long term preservationî, tra cui quello dedicato allíuso degli standard Astronomici per la long preservation dei dati della Biblioteca Apostolica Vaticana.
Riccardo Smareglia works at INAF, the Italian National Institute of Astrophysics, precisely at the Astronomical Observatory in Trieste, and is Head of the ICT and Data Management Office of the Scientific Directorate. He has been managing the Italian Astronomical Archives (IA2) for over 10 years and has been involved in several national and international projects including IVOA, RDA and SKA. He has participated in several projects on "long-term preservation", including the one dedicated to the use of astronomical standards for the long-term preservation of the Vatican Apostolic Library’s data
SESSIONE 1
Big Data
La strategia INAF per l’era dei Big Data
Riccardo Smareglia
Il dato astrofisico e’ unico ed irripetibile e per questa ragione la comunita’ astrofisica nazionale ed internazionale ha da tempo sviluppato sistemi che ne permettono la gestione in tutte le sue fasi di vita. Questo implica una filiera che va’ dal Data Management al Data Curation e Preservation passando per la pubblicazione dello stesso, la sua interoperabilita’ ed analisi. L’importanza scientifica del dato si vede anche dal fatto che orami dal 30 al 50 % delle pubblicazioni scientifiche provengono da riutilizzo di dati d’archivio che sono mediamente diventano pubblici dopo il periodo iniziale di proprieta’.
Le attuali politiche della Comunita’ Europea sull’Open Data e sul paradigma FAIR applicato allo stesso trova la comunita’ astrofisica gia’ pronta in questo campo tramite l’esperienza ultra decennale dell’Osservatorio Virtuale che permette all’utente di acquisire il dato astrofisico da archivi di osservatori distribuiti sul pianeta in modo semplice, univoco, interoperabile ed Open. Si desidera presentare un quadro integrato dell’esperienza e delle attivita’ INAF in preparazione alla sfida che progetti scientifici come CTA, LSST e SKA stanno portando.
Se gestire l’enorme moli di dati delle dimensioni di SKA potrà essere una grossa sfida, far si che questi dati possano interoperare con tutte le altre osservazioni astrofisiche e con le simulazioni teoriche implica uno sforzo organizzativo e gestionale che vede il dato come attore principale nei prossimi decenni.
INAF strategy for the big data era
Riccardo Smareglia
Astrophysical data are unique and for this reason the international astrophysics research community had developed systems to ensure their management for their whole lifecycle. This implies a management chain which goes from data Management to Data Curation and Preservation, through the steps of data publishing, interoperability and analysis. The fact that between 30 and 50% of the publications are the result of re-using archived data, which typically are made public only after an initial proprietary phase. The European Commission’s current policies on Open Data and the FAIR paradigm find the Astrophysics community ready, thanks to the more-than-10-year experience of the Virtual Observatory, which allows users to access the astrophysical data archived by worldwide observatories in a transparent, simple, interoperable and Open way.
We will present a complete picture of INAF activities in order to prepare to the challenges brought by the CTA, LSST and SKA projects. If managing the large amounts of data to be collected by SKA can be a big challenge, making sure that these data can interoperate with those from any other astrophysical observations, as well as of theoretical simulations will imply for the next few decades a huge effort in terms of organization and management with data at its core.