ChatGPT supera l’esame di Radiologia

ChatGPT supera l’esame di Radiologia

ChatGPT supera l’esame di Radiologia
In due distinte ricerche, ChatGPT, il sistema di chatbot basato sull’intelligenza artificiale, ha mostrato un’elevata capacità di rispondere correttamente a un set di 150 domande a scelta multipla tratte dagli esami del Canadian Royal College e dell’American Board of Radiology. Tuttavia il coordinatore di queste due ricerche invita alla prudenza circa l’affidabilità della tecnologia nel campo radiologico.

Con una percentuale di risposte corrette del 69%, nella versione GPT-3,5, e dell’81%, nella versione GPT-4, il sistema di chatbot basato sull’intelligenza artificiale ChatGPT funziona come un “board di esperti di radiologia”. E’ quanto emerge da due ricerche coordinate da Rajesh Bhayana, radiologo dell’University Medical Imaging Toronto, in Canada, e pubblicate da Radiology.

ChatGPT utilizza l’apprendimento automatico per riconoscere relazioni tra le parole dall’ampio set di dati con cui è stato formato, in modo da dare risposte simili a quelle dell’uomo. Tuttavia lo strumento può generare risposte errate.

“La nostra ricerca ha dato informazioni sulle prestazioni di ChatGPT in un contesto radiologico, evidenziandone l’incredibile potenziale, insieme alle attuali limitazioni che lo rendono ancora inaffidabile”, spiega Bhayana.

Per valutare le prestazioni a livello di radiologia ed esplorare punti di forza e limitazioni, il team ha testato ChatGPT nella versione attualmente più utilizzata, GPT-3.5, usando 150 domande a scelta multipla tratte dagli esami del Canadian Royal College e dell’American Board of Radiology.

Le domande non includevano immagini e sono state raggruppate per tipologia, al fine di ottenere informazioni sulle prestazioni.

ChatGPT ha risposto correttamente al 69% delle domande, raggiungendo quasi il 70% utilizzato come valore minimo di efficacia dal Royal College canadese.

La versione GPT-4, invece, ha risposto in modo corretto all’81% delle domande, superando la versione precedente e la soglia del 70%. Dai risultati, dunque, emerge che la capacità di ragionamento avanzato di GPT, soprattutto nella versione 4, si traducono in migliori prestazioni in un contesto radiologico.

Fonte: Radiology 2023

19 Maggio 2023

© Riproduzione riservata

Stati Uniti. L’Hhs revoca le autorizzazioni per l’uso in emergenza dei prodotti contro il Covid
Stati Uniti. L’Hhs revoca le autorizzazioni per l’uso in emergenza dei prodotti contro il Covid

Il Dipartimento della Salute e dei Servizi Umani degli Stati Uniti (Hhs) ha annunciato che il segretario Robert F. Kennedy Jr. ha firmato le determinazioni che pongono fine alle dichiarazioni di autorizzazione...

Stati Uniti. Dalla Fda via libera alla prima terapia genica per bambini con anemia falciforme
Stati Uniti. Dalla Fda via libera alla prima terapia genica per bambini con anemia falciforme

La Food and Drug Administration (Fda) degli Stati Uniti ha concesso l'approvazione supplementare per Casgevy (exagamglogene autotemcel) per pazienti di età pari o superiore a 2 anni affetti da anemia falciforme con...

Salmonella Stanley. Noodles aromatizzati probabile origine del focolaio europeo, segnalati 106 casi in 14 Paesi tra Ue e Regno Unito
Salmonella Stanley. Noodles aromatizzati probabile origine del focolaio europeo, segnalati 106 casi in 14 Paesi tra Ue e Regno Unito

I prodotti a base di noodles aromatizzati sono la fonte più probabile del focolaio plurinazionale di Salmonella Stanley che, tra novembre 2025 e giugno 2026, ha causato 106 casi confermati...

Depressione. Dall’Iss un approccio computazionale per predire la vulnerabilità
Depressione. Dall’Iss un approccio computazionale per predire la vulnerabilità

Capire prima chi potrebbe essere più vulnerabile alla depressione, anche quando non presenta ancora sintomi clinicamente rilevanti, attraverso una serie di semplici misurazioni dei cambiamenti del proprio stato mentale. È...