GARR CONFERENCE 2022
18-20 MAY 2022, Palermo

Federica Zanardini

Università di Milano
https://www.unimi.it/it

18 maggio 2022 - SESSIONE 7 | CULTURA E CONDIVISIONE DEI DATI

Archiviazione e cura a lungo termine dei contenuti digitali prodotti dall’Università degli Studi di Milano: un approccio olistico orientato alla sostenibilità e alla FAIRness

Long-term archiving and curation of digital content produced by the University of Milan: a holistic approach oriented towards sustainability and FAIRness

Slide


Federica Zanardini

Archiviazione e cura a lungo termine dei contenuti digitali prodotti dall’Università degli Studi di Milano: un approccio olistico orientato alla sostenibilità e alla FAIRness

Federica Zanardini si laurea in Fisica dello Stato Solido a Pavia, si specializza in Scienze dei Materiali e si occupa di fisica delle superfici fino al 1999. Nell'anno 2000 inizia a occuparsi di tecnologie informatiche e si trasferisce all'Università di Milano per dedicarsi alla creazione della Biblioteca Digitale dell'Ateneo che sviluppa e coordina fino al 2021. Nell'ultimo anno è entrata a far parte del gruppo di progetto per la realizzazione dell'infrastruttura di archiviazione a lungo termine dei dati della ricerca. Dall'anno 2020 è docente del corso "Digitalizzazione, Digital Preservation e Digital Curation" nell'ambito del Master in Digital Humanities dell'Università degli Studi di Milano.

Federica Zanardini graduated in Solid State Physics in Pavia and after a Master Degree in Materials Sciences in the year 2000 she began to deal with Information Technology. In that year she moved to the University of Milan working in building the University's Digital Library which she develops and coordinates until 2021. In the last year she has joined the project group for the construction of the long-term archiving infrastructure of research data. Since 2020 she has been teaching the course "Digitization, Digital Preservation and Digital Curation" within the Master in Digital Humanities of the University of Milan.

 

ABSTRACT

L’Università degli Studi di Milano, una tra le maggiori Università italiane, produce un vasto numero di contenuti digitali: dati della ricerca, dati e oggetti digitali prodotti a supporto delle attività didattiche, digitalizzazioni di beni culturali, archivistici e librari oltre a dati amministrativi. All’inizio del 2021, un censimento di Ateneo ha permesso di conoscere l’entità e il volume delle esigenze di storage per l’archiviazione (dell’ordine delle decine di PB con incrementi annuali stimati di 20PB), nonché di constatare l’estrema frammentazione e disomogeneità delle soluzioni di archiviazione adottate. UNIMI ha quindi avviato un progetto per la realizzazione di un sistema centralizzato per l’archiviazione a lungo termine di tutti gli oggetti digitali prodotti dall’Ateneo, sia dati della ricerca che materiali didattici o prodotti delle campagne di digitalizzazione di beni culturali. Il progetto, tuttora in corso, terrà conto di vincoli di sostenibilità economica e gestionale oltre che di scalabilità utilizzando il framework iRODS, avendo tra gli obiettivi la condivisione dei risultati delle ricerche e la maggiore compatibilità possibile dei dati prodotti dalla ricerca con i principi FAIR. Verranno inoltre definite policy e altri aspetti organizzativi e sarà attivato un continuo colloquio con la community degli utilizzatori del sistema. Durante l’intervento si parlerà dei criteri alla base delle scelte tecnologiche e degli sviluppi che si intende dare al progetto.

The University of Milan, one of the major Italian universities, produces a vast number of digital content: research data, digital objects produced in teaching activities, digitization of library, archive and museums and administrative data. A survey at the beginning of 2021 revealed the extent and volume of storage needs for archiving (tens of PB with estimated annual increases of 20PB), as well the extreme fragmentation of the solutions of adopted. During the same year it was decided to start a project to build a long-term archiving system for all digital objects produced and not only research data. The project, still in progress, will take into account the constraints of economic and organizational sustainability as well as scalability, using the iRODS framework, having among the objectives the sharing of research results and the greatest possible compatibility of the research data with the FAIR principles. Policies, guidelines and other organizational aspects such as roles, tasks, etc. will also be defined as well as activated a continuous conversation with the community of users of the system. During the intervention we will discuss the criteria that were the basis of the technological choices and the developments that we intend to give to the project.