Il Machine Learning arriva in corsia

1062

Un algoritmo per estrarre informazioni cliniche: al Google Cloud Summit di Milano Noovle e Arsenàl.IT presentano una ricerca per innovare la sanità

Una ricerca scientifica mirata a testare l’utilizzo di algoritmi di Machine Learning per classificare automaticamente i documenti clinici digitali ed estrarre da quelli non strutturati il maggior numero possibile di informazioni cliniche significative. Questo il progetto nato in collaborazione tra Noovle e Consorzio Arsenàl.IT che verrà presentato a Milano il 24 maggio in occasione del Google Cloud Summit.
 
Arsenàl.IT è Centro Veneto Ricerca e Innovazione per la Sanità Digitale, che, dal 2012, su mandato di Regione Veneto e Azienda Zero, coordina il progetto fascicolo sanitario elettronico regionale (FSEr), garantendo in particolare tutti gli aspetti tecnici relativi all’interoperabilità dei sistemi informativi sanitari. Uno dei motivi che hanno permesso la nascita della partnership con Noovle, Premier Partner italiano di Google Cloud e Google,  è che da oltre un decennio Arsenàl.IT collabora con enti internazionali per sviluppare l’infrastruttura del FSEr, garantendone l’aderenza agli standard più evoluti e, allo stesso tempo, la possibilità di alimentare in tempo reale un’infrastruttura di uso secondario dei dati (big data) finalizzata a scopi di ricerca scientifica.
 
In tale contesto, con la messa a regime del FSEr, si sono rese disponibili una serie di informazioni raccolte all’interno dei documenti sia in formato strutturato (come il referto di laboratorio stilato secondo lo standard CDA®) sia non strutturato (ad es. le lettere di dimissione ospedaliera in formato PDF).
 
La ricerca prevede di utilizzare tecniche di Machine Learning per l’identificazione automatica delle parti salienti delle lettere di dimissione al fine di individuare automaticamente le diagnosi presenti in ciascuna sezione secondo la codifica internazionale ICD-9-CM.
 
L’obiettivo è duplice: da un lato capire quanto e come gli algoritmi di Machine Learning e le soluzioni di Artificial Intelligence sviluppati in altri ambiti siano applicabili a quello clinico sanitario; dall’altro sviluppare algoritmi di Machine Learning specifici da trasformare in servizi collegati al FSEr, capaci di offrire un valore aggiunto sia all’ambito clinico (sviluppando applicazioni di supporto alle decisioni cliniche) sia a quello della governance regionale (medicina di popolazione, prevenzione, ecc.). La ricaduta e le potenzialità che i risultati della ricerca potranno avere dalla medicina predittiva e preventiva, offrendo vantaggi a tutta la popolazione, sono facilmente intuibili.
 
Gli elementi fondamentali che garantiscono la sicurezza nell’uso dei dati clinico-sanitari in questo progetto di ricerca sono molteplici. In particolare va sottolineato come il disegno dell’infrastruttura tecnologica prevede la distinzione tra il mondo del fascicolo (nel quale i dati sono in chiaro e usati per finalità cliniche) ed il mondo dei big data, nel quale i dati, dopo essere stati accuratamente anonimizzati, vengono inseriti ed utilizzati a scopi di ricerca. Tutto ciò così come previsto dalla normativa nazionale in materia.
 
I risultati del progetto, che si concluderà entro fine 2018, saranno resi noti dopo l’analisi accurata dell’applicazione dell’algoritmo in fase di studio ad oltre 70.000 lettere di dimissione ospedaliera.