ChatGPT supera l’esame di Radiologia

ChatGPT supera l’esame di Radiologia

ChatGPT supera l’esame di Radiologia
In due distinte ricerche, ChatGPT, il sistema di chatbot basato sull’intelligenza artificiale, ha mostrato un’elevata capacità di rispondere correttamente a un set di 150 domande a scelta multipla tratte dagli esami del Canadian Royal College e dell’American Board of Radiology. Tuttavia il coordinatore di queste due ricerche invita alla prudenza circa l’affidabilità della tecnologia nel campo radiologico.

Con una percentuale di risposte corrette del 69%, nella versione GPT-3,5, e dell’81%, nella versione GPT-4, il sistema di chatbot basato sull’intelligenza artificiale ChatGPT funziona come un “board di esperti di radiologia”. E’ quanto emerge da due ricerche coordinate da Rajesh Bhayana, radiologo dell’University Medical Imaging Toronto, in Canada, e pubblicate da Radiology.

ChatGPT utilizza l’apprendimento automatico per riconoscere relazioni tra le parole dall’ampio set di dati con cui è stato formato, in modo da dare risposte simili a quelle dell’uomo. Tuttavia lo strumento può generare risposte errate.

“La nostra ricerca ha dato informazioni sulle prestazioni di ChatGPT in un contesto radiologico, evidenziandone l’incredibile potenziale, insieme alle attuali limitazioni che lo rendono ancora inaffidabile”, spiega Bhayana.

Per valutare le prestazioni a livello di radiologia ed esplorare punti di forza e limitazioni, il team ha testato ChatGPT nella versione attualmente più utilizzata, GPT-3.5, usando 150 domande a scelta multipla tratte dagli esami del Canadian Royal College e dell’American Board of Radiology.

Le domande non includevano immagini e sono state raggruppate per tipologia, al fine di ottenere informazioni sulle prestazioni.

ChatGPT ha risposto correttamente al 69% delle domande, raggiungendo quasi il 70% utilizzato come valore minimo di efficacia dal Royal College canadese.

La versione GPT-4, invece, ha risposto in modo corretto all’81% delle domande, superando la versione precedente e la soglia del 70%. Dai risultati, dunque, emerge che la capacità di ragionamento avanzato di GPT, soprattutto nella versione 4, si traducono in migliori prestazioni in un contesto radiologico.

Fonte: Radiology 2023

19 Maggio 2023

© Riproduzione riservata

Life science excellence show. AI in sanità: il rischio non è l’algoritmo che sbaglia, è il sistema che non lo governa
Life science excellence show. AI in sanità: il rischio non è l’algoritmo che sbaglia, è il sistema che non lo governa

È in salute, l’intelligenza artificiale? La domanda – volutamente provocatoria – ha aperto il terzo talk del Festival dell’Innovazione dei Life Science Excellence Awards con un obiettivo chiaro: spostare l’AI...

Life science excellence show. Dati o opinioni? La sanità alla prova della vita reale
Life science excellence show. Dati o opinioni? La sanità alla prova della vita reale

Non è una disputa accademica, né una guerra di religione tra statistica e percezioni. Nel secondo talk del Festival dell’Innovazione dei Life Science Excellence Awards 2025 la domanda “dati o...

Virus sinciziale, la campagna italiana con anticorpo monoclonale riduce drasticamente le ospedalizzazioni dei neonati
Virus sinciziale, la campagna italiana con anticorpo monoclonale riduce drasticamente le ospedalizzazioni dei neonati

A livello globale, le malattie respiratorie sono ancora una sfida aperta. Il Covid-19, e le influenze più in generale, hanno contribuito a rendere le patologie respiratorie (tra cui BPCO, asma,...

Leucemia mieloide acuta. Nuova terapia CAR-T mostra risultati promettenti nei pazienti pediatrici
Leucemia mieloide acuta. Nuova terapia CAR-T mostra risultati promettenti nei pazienti pediatrici

La cura della leucemia mieloide acuta pediatrica (LMA) ha compiuto un passo in avanti. Tre giovani pazienti, colpiti da una malattia particolarmente aggressiva e resistente alle terapie convenzionali, sono stati...