Intelligenza artificiale e screening mammografico

Intelligenza artificiale e screening mammografico

Fin dagli anni Ottanta lo screening mammografico ha rappresentato una pietra miliare nella diagnosi precoce del cancro al seno. Tuttavia,
fra le sue criticità, si è sempre evidenziata la marcata variabilità tra radiologi nell’accuratezza diagnostica che può portare a richiami per approfondimenti non necessari o a casi di cancro non individuati.
L’intelligenza artificiale (AI) ha il potenziale per affrontare queste sfide poiché la sua accuratezza diagnostica sembrerebbe molto promettente nelle letture radiologiche delle mammografie, come dimostrano gli studi in questo ambito.

LO STUDIO SCREENTRUSTCAD
Karin Dembrower, del Karolinska Institute, e i suoi colleghi svedesi in collaborazione con lo ScreenTrustCAD Trial Consortium hanno compiuto uno studio prospettico, di non inferiorità e basato sulla popolazione per valutare se la doppia lettura delle immagini mammografiche da parte dell’intelligenza artificiale e di un radiologo possa portare all’individuazione di più casi di cancro rispetto a quanto accada con la doppia lettura da parte di due radiologi.
Lo studio ha arruolato 55.581 donne di età compresa tra 40 e 74 anni (età media 55 anni) che si sono sottoposte a screening mammografico tra l’1 aprile 2021 e il 9 giugno 2022. L’outcome primario dello studio era la diagnosi tramite screening di cancro al seno entro 3 mesi dalla mammografia. È stato esaminato l’effetto delle seguenti combinazioni: doppia lettura condotta da un solo radiologo e dall’intelligenza artificiale (IA) confrontata con la consueta doppia lettura condotta da due radiologi, e lettura singola compiuta dall’IA rispetto alla lettura tripla eseguita da due radiologi più l’AI sempre confrontate con la doppia lettura standard condotta da due radiologi.
Ai fini dello studio, l’IA è stata implementata come lettore indipendente e, per ciascuna immagine, il sistema di IA ha generato un punteggio continuo in base al grado stimato di anomalia.

I risultati
A 269 (0,5%) donne totali è stato diagnosticato un carcinoma mammario rilevato sulla base di una prima lettura positiva della mammografia. Entrando nel dettaglio dell’analisi, la doppia lettura effettuata da un radiologo e dall’IA è risultata non inferiore per la rilevazione del tumore rispetto alla doppia lettura effettuata da due radiologi [261 (0,5%) casi rilevati rispetto ai 250 (0,4%) dei due radiologi].
Anche la lettura singola tramite IA [246 (0,4%) casi rilevati rispetto ai 250 (0,4%) dei due radiologi] e la tripla lettura effettuata da due radiologi più l’IA [269 (0,5%) casi rilevati sempre rispetto ai 250 (0,4%) dei due radiologi] sono risultate non inferiori alla doppia lettura effettuata da due radiologi.
La doppia lettura da parte di un radiologo più l’IA ha comportato un aumento del 4% (11/250) nella diagnosi del tumore al seno e un aumento del 21% nel numero di esami con interpretazione anomala.
Questo potrebbe suggerire che l’IA e i lettori ‘umani’ percepiscano caratteristiche dell’immagine leggermente diverse in caso di sospetto di cancro; pertanto, un lettore umano e l’IA potrebbero rappresentare una potenziale sinergia in termini di aumento della sensibilità per rilevare i tumori al seno. Le discussioni consensuali che hanno accompagnato in questo studio l’esame di tutte le mammografie hanno prodotto un tasso di richiamo inferiore del 4% (73/1629) nel caso di doppia lettura da parte di un radiologo più l’IA rispetto alla doppia lettura da parte di due radiologi. La discussione consensuale sembrerebbe quindi efficace nel garantire che il tasso più elevato di interpretazioni anomale ottenute con la doppia lettura da parte di un radiologo e l’IA non si traduca in un aumento del tasso di richiamo. Secondo gli autori l’IA è pronta per un’implementazione controllata, che includerebbe la gestione del rischio, la sorveglianza post-commercializzazione e il follow-up sistematico delle prestazioni nel mondo reale. Tuttavia gli autori sottolineano anche che attualmente non esistono protocolli sulla qualità dei dati delle prestazioni effettuate tramite l’IA.

LO STUDIO MASAI
Condotto dai ricercatori dell’Università di Lund in Svezia coordinati da Kristina Lång e pubblicato sul Lancet Oncology, lo studio MASAI (Mammography Screening with Artificial Intelligence) ha arruolato oltre 80.020 donne ed è ancora in corso. Le mammografie di 40.024 donne sono state esaminate da due radiologi senza il supporto dell’IA (gruppo di controllo), mentre quelle di 39.996 donne sono state analizzare dall’IA e da un radiologo (gruppo di intervento), tranne nei casi in cui l’IA avesse generato il punteggio di rischio più alto (10), nel qual caso due radiologi hanno comunque valutato l’esame.
I risultati provvisori hanno evidenziato che l’analisi delle mammografie del gruppo di intervento effettuata dall’IA insieme a uno o due radiologi rispetto alla lettura effettuata da due radiologi senza IA del gruppo di controllo ha portato all’individuazione del 20% di tumori in più, con un tasso di tumori individuati di 6,1 per mille partecipanti nel gruppo di intervento rispetto al tasso di 5,1 ogni mille donne del gruppo di controllo.
Nel gruppo di intervento è stata rilevata anche una significativa riduzione del carico di lavoro per i radiologi, che hanno dedicato il 44% in meno di tempo alla lettura delle mammografie, dal momento che la doppia lettura nel gruppo di intervento è stata riservata solo alle interpretazioni più critiche.
Venendo ai tassi di richiamo per ulteriori accertamenti, questi sono stati del 2,2% nel gruppo di intervento supportato dall’IA (244 donne) e del 2% nel gruppo di controllo (203 donne), portando all’individuazione di 41 tumori in più con il supporto dell’IA, dei quali 19 invasivi e 22 in situ.

IL COMMENTO
Nereo Segnan e Antonio Ponti del Centro di Riferimento per l’Epidemiologia e la Prevenzione Oncologica piemontese nel commentare in particolare i risultati preliminari dello studio MASAI sottolineano come il loro valore risieda indubbiamente nel risparmio di risorse ottenuto grazie alla riduzione del numero di seconde letture necessarie e nella capacità dell’algoritmo utilizzato dall’IA , peraltro molto accurato, di identificare il gruppo di donne a basso rischio (punteggio 1-7), in questo studio ha rappresentato il 76,2% della popolazione target e nel quale è stato individuato il 2,5% dei tumori (6 tumori sui 244 totali del gruppo di intervento). Il valore predittivo positivo dello screening in questo studio è stato del 50,0% nel gruppo di donne con il punteggio di rischio più alto (10), con 208 (85,2%) tumori rilevati in 2875 (7,2%) donne che hanno preso parte allo screening nel gruppo di intervento.
Tuttavia, secondo Segnan e Ponti la possibile presenza di sovradiagnosi (cioè il sistema che identifica i non tumori) o di sovrarilevazione di lesioni indolenti, come una porzione rilevante di carcinomi duttali in situ, dovrebbe indurre cautela nell’interpretazione dei risultati che altrimenti sembrerebbero decisamente a favore dell’uso dell’IA. Nello studio, rispetto allo standard di cura, l’IA ha identificato infatti una percentuale (anche se non significativa) decisamente più elevata di carcinomi in situ tra i tumori rilevati dallo screening: il 25% di tutti i tumori nel gruppo di intervento rispetto al 19% nel gruppo di controllo.
E ormai da decenni si dibatte se la scoperta di un carcinoma in situ, in particolare se classificato come a basso rischio, sia benefica o dannosa nello screening del tumore al seno.
Resta quindi un’importante domanda di ricerca: l’IA, se adeguatamente strutturata, sarà in grado di catturare caratteristiche biologiche rilevanti – o, in altre parole, la storia naturale della malattia – come la capacità dei tumori di crescere e diffondersi?
Cautela arriva anche dal primo autore dello studio MASAI (Lång) che afferma che i risultati provvisori sulla sicurezza “non sono sufficienti da soli per confermare che l’intelligenza artificiale è pronta per essere implementata nello screening mammografico”. Ancora, l’intelligenza artificiale viene sempre più utilizzata in contesti medici, ma c’è ancora una forte preoccupazione su come gli algoritmi vengono definiti e convalidati, nonché sul potenziale di bias e diagnosi eccessive. In questo contesto, l’UE sta pianificando una regolamentazione rigorosa sull’uso dell’intelligenza artificiale e l’EMA sta lavorando per valutare i rischi e i benefici della tecnologia per lo sviluppo di farmaci.

Letizia Orzella
Direzione Regionale Salute e Integrazione Sociosanitaria, Area Farmaci e Dispositivi, Regione Lazio

Fonti Dembrower K, Crippa A, Colón E, Eklund M, Strand F et al. Artificial intelligence for breast cancer detection in screening mammography in Sweden: a prospective, population-based, paired-reader, non-inferiority study. Lancet Digit Health 2023; 5: e703-11
Lång K, Josefsson V, Larsson AM et al. Artificial intelligence-supported screen reading versus standard double reading in the Mammography Screening with Artificial Intelligence trial (MASAI): a clinical safety analysis of a randomised, controlled, noninferiority, single-blinded, screening accuracy study. Lancet Oncol 2023; 24(8): 936-944
Segnan N, Ponti A. Artificial intelligence for breast cancer screening: breathtaking results and a word of caution. Lancet https://doi.org/10.1016/S1470-2045(23)00336-4

Download pdf

Da Care 4-5, 2023

Share on