ChatGPT ha superato l’esame per diventare medico: ha solo un problema

Un gruppo di ricercatori ha sottoposto ChatGPT-4 a quasi 200 domande formulate sul modello dell’United Kingdom Medical Licensing Assessment (UKMLA). L’intelligenza artificiale ha risposto bene alla maggior parte delle domande di tipo diagnostico, meno in quelle di pratica clinica.

ChatGPT-4 ha passato il test obbligatorio nel Regno Unito per ottenere la licenza medica. In un mondo parallelo abitato dalle intelligenze artificiali, questo significherebbe che potrebbe effettivamente visitare, fare diagnosi e somministrare cure.

Sembra la trama di una nuova puntata di Black Mirror – qui abbiamo commentato il vero tema centrale dell'ultima stagione – ma si tratta invece del risultato di uno studio accademico realizzato da un gruppo di ricercatori universitari inglesi che hanno testato le competenze mediche di ChatGPT-4, l'ultimo modello di ChatGPT, trattandolo alla pari di un aspirante medico umano.

A quali domande ha risposto ChatGPT

Nel Regno Unito infatti sia i laureati in Medicina che medici provenienti da altri Paesi per poter esercitare la professione devono passare un test standardizzato, il Medical Licensing Assessment (MLA) o United Kingdom Medical Licensing Assessment (UKMLA), ovvero letteralmente "valutazione delle licenze mediche del Regno Unito". L'obiettivo era "confrontare la competenza medica di GPT-4 – scrivono i ricercatori – con il livello previsto per un medico junior del Regno Unito e discutere il suo potenziale nella pratica clinica". I risultati sono stati pubblicati su Scientific Reports.

Bravo a diagnosticare, meno a curare

Tra i vari risultati è emerso però un punto importante: ChatGPT è stato "bravo" nelle domande diagnostiche – precisione di risposte al 91,2% con suggerimenti e l'84,2% senza suggerimenti – ma non altrettanto nelle domande relative alla gestione clinica, soprattutto se poste senza opzioni multiple: la precisione in questo ambito è scesa al 51,2%.

In definitiva, ChatGPT ha superato l'esame, ma con l'aiuto delle opzioni multiple funziona meglio, inoltre ha mostrato un grado inferiore di efficienza nella pratica clinica. Questo studio dimostra che ChatGPT è in grado di superare l'UKMLA, "ma – chiariscono i ricercatori – è più adatto come strumento supplementare, di monitoraggio o di apprendimento piuttosto che come diagnosi o interazione ospedaliera".

Continua a leggere su Fanpage.it