CONFERENZA GARR 2018
3-5 OTTOBRE 2018, Università di Cagliari

5 ottobre 2018

Rossella Aversa

CNR IOM
https://www.iom.cnr.it/

La prima infrastruttura di data management per le nanoscienze

Rossella Aversa si è laureata nel 2011 in Astrofisica e Cosmologia all'università di Bologna, e nel 2015 ha ottenuto il dottorato in Astrofisica alla SISSA di Trieste. Ha poi frequentato il Master in High Performance Computing a Trieste, diplomandosi nel 2016. Da allora è assegnista di ricerca al CNR-IOM di Trieste e lavora per il progetto NFFA-Europe.

Rossella Aversa graduated in 2011 in Astrophysics and Cosmology at the Università di Bologna, and in 2015 obtained her doctorate in Astrophysics at SISSA in Trieste. She then attended the Master in High Performance Computing in Trieste, graduating in 2016. Since then, she is a research fellow at the CNR-IOM in Trieste and works for the NFFA-Europe project.

SESSIONE 10. OPEN DATA - OPEN SCIENCE

La prima infrastruttura di data management per le nanoscienze

Presentiamo un caso d'uso completo per la piattaforma di deposito di informazioni e Data management Repository Platform (IDRP). L'infrastruttura è stata implementata nell'ambito del progetto H2020 NFFA-EUROPE, con l'obiettivo di offrire un'infrastruttura di dati e servizi associati nel campo delle nanoscienze. È stato progettato per soddisfare sia la necessità di interoperabilità che la compatibilità con i principi FAIR. L'infrastruttura attuale è costituita da diverse istanze cloud dedicate allo storage dei dati, alla gestione dei metadati e ad alcuni servizi di dati, il primo dei quali è uno strumento di classificazione semiautomatica delle immagini a microscopia elettronica a scansione (SEM). Tale servizio è stato implementato dopo un'ampia valutazione delle più recenti architetture e tecniche di reti neurali convoluzionali profonde, applicate al nostro caso specifico. È stato sviluppato un flusso di lavoro semi-automatico che copre l'intero ciclo di vita dei dati: dall'acquisizione delle immagini presso la struttura alla registrazione dei metadati nel repository, compresa la classificazione online, l'etichettatura automatica delle immagini, l'estrazione automatica dei metadati e l'archiviazione locale


The first data management infrastructure for nanoscience

We present here a first complete use-case for the NFFA-EUROPE Information and Data management Repository Platform (IDRP). The infrastructure has been deployed within the H2020 NFFA-EUROPE project, with the goal to offer a data infrastructure and associated services in the nanoscience domain. It has been designed to comply with the need of interoperability and with the FAIR principles. The actual infrastructure consists of different cloud instances devoted to data storage, metadata management, and some data services, the first of them being a semi-automatic classification tool of Scanning Electron Microscopy (SEM) images. Such a service has been deployed after an extensive evaluation of the most recent deep convolutional neural network architectures and techniques, applied to our specific case. A semi-automatic workflow has been developed, covering the whole data lifecycle: from image acquisition at the facility to metadata registration at the repository, including online classification, automatic labeling of the images, automatic metadata extraction, and local storage

 


Sponsor

DELL EMC
Palo Alto Networks
INTEL

juniper networks
maticmind