CONFERENZA GARR 2019
4-6 GIUGNO 2019, POLITECNICO DI TORINO

4 giugno 2019

Rita Murri

Università Cattolica S. Cuore - Fondazione Policlinico Gemelli IRCCS
http://www.policlinicogemelli.it/
https://roma.unicatt.it/

GENERATOR.Sepsi: un modello predittivo delle infezioni del torrente ematico mediante machine learning

Sono Ricercatore Confermato presso l’Università Cattolica del S. Cuore – Fondazione Policlinico Gemelli IRCCS, medico specialista in Malattie Infettive e docente della Facoltà. Dopo aver lavorato nel Reparto della clinica, dal 2013 lavoro come clinico presso l’Unità di Consulenza Infettivologica Integrata. Dal 2013 sono state effettuate più di 50.000 consulenze infettivologiche per i pazienti ricoverati in tutti i Reparti del Policlinico Gemelli, Roma. La mia attività di ricerca inizia coi pazienti con infezione da HIV e da alcuni anni è focalizzata sulle infezioni correlate all’assistenza ed in particolare alle infezioni dovute a germi multiresistenti. Sono responsabile di alcuni progetti Nazionali sull’argomento e collaboro a Progetti Internazionali sull’antibioticoresistenza e l’Antibiotic Stewardship. Sono autrice di più di 130 pubblicazioni scientifiche presenti su PubMed.

I’m a Researcher at Catholic University of Rome – Fondazione Policlinico Gemelli IRCCS, Infectious Disease physician and Professor at Medical School. After having worked in the Infectious Disease Clinic since 2013 I’m a clinician of the Unit for Infectious Diseases Consultancies. Since 2013, more than 50.000 Infectious Diseases consultancies have been done for patients in charge in all the wards of Policlinico Gemelli Hospital in Rome. My research began for patients with HIV infection and since some years, my main fields of interests are serious healthcare-associated infections, particularly those due to multidrug resistant microrganisms abd Antibiotic Stewardship. I’m principal Investigator of some National projects on healthcare-associated infections and I participate inInternational projects on Antimicrobial Resistance and Antibiotic Stewardship. I’m co-author of more than 130 papers indexed on PubMed

SESSIONE 2. AI e Big Data: come cambia la ricerca

GENERATOR.Sepsi: un modello predittivo delle infezioni del torrente ematico mediante machine learning

Le infezioni del torrente ematico (ITE) rappresentano una condizione clinica molto seria. Le ITE sono correlate ad un’elevata mortalità (dal 13 al 20% a seconda delle casistiche analizzate) e causano un aumento dei costi anche legati al prolungamento dell’ospedalizzazione. Inoltre i clinici sono spesso di fronte ad incertezze diagnostiche rilevanti. I punteggi predittivi sono strumenti molto apprezzati per varie ragioni: 1) permettono di identificare il paziente a rischio di ITE 2) permettono di individuare i pazienti a più alto rischio di evoluzione negativa al fine di concentrare sugli stessi le maggiori risorse per test diagnostici rapidi e più cost-effective 3) permettono di ottimizzare il timing e il tipo di terapia antibiotica. Gli studi osservazionali tradizionali sulle ITE implicano la raccolta prospettica di grandi quantità di dati con un enorme dispendio di risorse e di tempo. L’opportunità di usare le infrastrutture di rete e i servizi di un grande Policlinico attraverso l’uso di tecnologie informatiche sofisticate e di modelli matematici innovativi apre nuove prospettive per la ricerca medica e per l’assistenza dei pazienti. Obiettivi del presente studio sono applicare gli algoritmi machine-learning per identificare, in un’ampia popolazione e con un approccio basato sul mondo reale, i predittori più efficaci di ITE; validare un algoritmo predittivo di ITE che possa essere applicato quotidianamente nell’assistenza routinaria dei pazienti e, eventualmente, implementato nella cartella clinica.
METODI E RISULTATI PRELIMINARI Lo studio è svolto presso un Policlinico Universitario di 1100 posti-letto (Fondazione Policlinico Gemelli IRCCS, Università Cattolica del Sacro Cuore). All’interno del Policlinico, dal 2013 è attiva un’Unità di Consulenza Infettivologica (UDCI). I dati di ogni consulenza sono prospetticamente inseriti in un database costruito ad hoc (Dream). Tutte le ITE presenti nel database Dream dal 2016 sono considerate outcome di studio e tutti i dati vengono estratti ancorati alla data dell’outcome. All’inizio, mediante analisi di studi pubblicati e dopo giudizio clinico, sono stati selezionati diversi possibili predittori di ITE e raggruppati in 6 aree: dati demografici, comorbidità, presidi e interventi chirurgici, fattori di rischio di infezioni da germi multiresistenti, indici di infiammazione, scores predittivi già esistenti. Successivamente sono state identificate le sorgenti di dati esistenti nel Policlinico ed è stata avviata l’estrazione dei dati. Per costruire il foglio-dati per l’analisi, sono stati identificati diversi data repositories: l’infrastruttura ospedaliera di rete (SI), il database dei campioni microbiologici, il Codice Internazionale di Diagnosi alla dimissione, il diario compilato dal personale infermieristico. Tutti i database ospedalieri vengono poi connessi attraverso la infrastruttura GENERATOR (GEmelli big-data NEtwork for Retrospective Analysis and Test in Oncology and medical Research). Vengono estratti i dati di più di 3000 pazienti con ITE
PIANO SPERIMENTALE: Obiettivo del lavoro è quello di sviluppare un modello predittivo attraverso l’applicazione delle tecniche di intelligenza artificiale (ad esempio le reti Bayesiane) al fine di identificare i fattori predittivi di ITE e stratificare i pazienti a rischio. L’analisi sarà Condotta con dati multidimensionali (demografici, epidemiologici, punteggi clinici, ecc…). Il database finale sarà diviso in modo casuale in 2 dataset separati, uno per la fase di apprendimento del modello e l’altro per la fase di validazione del modello stesso. L’eterogeneità dei gruppi di pazienti (apprendimento vs validazione) sarà valutata mediante test chi-square di Pearson’s con la correzione di continuità secondo Yates per le variabili categoriche e Mann-Whitney per le numeriche. Un algoritmo di selezione sarà utilizzato per individuare le caratteristiche più predittive di ITE. Inoltre il modello finale sarà fatto apprendere nel dataset di apprendimento e il potere predittivo nonché la trasferibilità saranno testate sul dataset di validazione. Infine, la performance del modello sarà valutata in termini di potere discriminante (abilità del modello di separare I pazienti con risultati clinici differenti) e di calibrazione (come il modello predittivo finale differisce dal modello reale).
CONCLUSIONI: L’uso delle infrastrutture di rete e dei servizi di un grande Policlinico potrebbero esser emolto utili per raccogliere e analizzare una enorme quantità di dati e aumentare la precisione. L’applicazione delle tecniche di intelligenza artificiale a questi dati potrebbe aumentare la conoscenza dei predittori di ITE e, in definitiva, migliorare i risultati clinici dei pazienti


GENERATOR.Sepsi: A MACHINE-LEARNING BASED MODEL TO PREDICT BLOODSTREAM INFECTIONS

BACKGROUND: Bloodstream infection (BSI) is a challenging clinical condition. BSIs episodes are correlated to high mortality (ranging from 13 to 20%), and an increase of hospitalization and expenditures. Moreover, physicians are frequently faced with diagnostic uncertainties. Predictive scores are highly desirable tools to quickly 1) identify patients at high risk of BSI 2) stratify patients for which rapid diagnostic tools may be more cost-effective, and 3) start therapies that may reduce mortality. Traditional observational studies on BSI with prospective collection of data are largely time consuming and highly expensive. The opportunity to use network infrastructures and services in a large hospital through advanced software techniques opens new perspectives for medical research and patient care. Objective of the present study is to apply machine-learning algorithms to identify, in a real-world evidence (RWE) approach, the best predictors of BSI in a large population and to validate a BSI predictive algorithm that could be routinely applied and then implemented in an electronic clinical chart.
METHODS AND PRELIMINARY RESULTS: The study was performed at a 1100-bed University Hospital in Rome, Italy (Fondazione Policlinico Gemelli IRCCS, Università Cattolica del Sacro Cuore). In the Hospital, a bedside Infectious Diseases Consultancy Unit (Unità di Consulenza Infettivologica, UDCI) was established in 2013. For each consultancy data are prospectively collected in a database (Dream). All the BSIs included in the Dream database since 2016 were considered the outcome of the study and the anchor for the predictive parameters extraction. First, several predictors of BSI were identified in the published literature and grouped in 6 areas: demographic data, comorbidities, devices and surgical operations, risk factors for infections caused by multidrug resistant microrganisms, inflammation markers, already validated predictive scores (Fig. 1). Second, we identified the hospital database sources where data can be obtained, and the extraction was started. Several data repositories were used for the building of the database analysis: the hospital network infrastructure (SI), the database of samples managed by the Microbiology laboratory, the International Diagnosis Code after the discharge, the patient diary filled by nurses. All of these databases are connected through the GENERATOR (GEmelli big-data NEtwork for Retrospective Analysis and Test in Oncology and medical Research) infrastructure. Data were extracted for more than 3000 BSIs.
EXPERIMENTAL PLAN: The aim of the experimental plan is to develop a predictive model through the application of artificial intelligence techniques (e.g. Bayesian Networks) in order to identify the predictive factors and to stratify patient risks. The analysis will be conducted on multidimensional data (demographic, epidemiological data, clinical scores, etc.) and the final database will be split into two randomly separated datasets: one will be used as the training set and another will be chosen as the validation set. Heterogeneity between patient groups (training vs validation) will be evaluated though the Pearson’s 2 test with Yates’ continuity correction for categorical variables and the Mann-Whitney test for numerical ones. A feature selection algorithm will be applied to identify the most predictive features of BSI. Furthermore, the final model will be trained on the training dataset and its predictability and transferability will be tested on the validation set. Finally, the model’s performance will be evaluated in terms of discriminatory power (the ability of the model to separate patients with different outcomes) and calibration (how the prediction outcomes differ from the actual outcomes).
CONCLUSIONS: The use of network infrastructures and services of a large hospital could be very useful to collect a large amount of data and increase precision. The application of artificial intelligence techniques of such a data could expand the acknowledgement of predictors of BSI and, ultimately, the clinical outcomes of patients

 

Sponsor

Huawei
Main Sponsor

TIM
Fortinet