Googleov novi chatbot prošao je medicinski ispit u SAD-u Tehnologija
Googleov medicinski chatbot koji pokreće umjetna inteligencija postigao je prolaznu ocjenu na teškom ispitu za medicinsko licenciranje u SAD-u, ali njegovi odgovori još uvijek su ispod onih ljudskih liječnika, pokazalo je recenzirano istraživanje.
Prošlogodišnje izdanje ChatGPT -a – čijeg razvojnog programera OpenAI podržava Googleov konkurent Microsoft – pokrenulo je utrku između tehnoloških divova u rastućem polju umjetne inteligencije.
Iako je mnogo učinjeno o budućim mogućnostima – i opasnostima – umjetne inteligencije, zdravlje je jedno područje u kojem je tehnologija već pokazala opipljiv napredak, s algoritmima koji mogu čitati određene medicinske snimke kao i ljudi.
Google je prvi put predstavio svoj AI alat za odgovaranje na medicinska pitanja, nazvan Med-PaLM, u studiji u prosincu. Za razliku od ChatGPT-a, nije objavljen u javnosti.
Američki tehnološki div kaže da je Med-PaLM prvi veliki jezični model, AI tehnika obučena na golemim količinama teksta proizvedenog od strane ljudi, koji je prošao US Medical Licensing Examination (USMLE).
Prolazna ocjena na ispitu, koji polažu studenti medicine i liječnici pripravnici u Sjedinjenim Državama, iznosi oko 60 posto.
U veljači je studija rekla da je ChatGPT postigao prolazne ili skoro prolazne rezultate.
U recenziranoj studiji objavljenoj u časopisu Nature , Googleovi istraživači rekli su da je Med-PaLM postigao 67,6 posto na pitanjima višestrukog izbora u stilu USMLE.
"Med-PaLM djeluje ohrabrujuće, ali ostaje inferioran u odnosu na kliničare", navodi se u studiji.
Kako bi identificirao i smanjio "halucinacije" – naziv za kada modeli umjetne inteligencije nude lažne informacije – Google je rekao da je razvio novu referentnu vrijednost.
Karan Singhal, Googleov istraživač i glavni autor nove studije, rekao je za AFP da je tim koristio referentnu vrijednost za testiranje novije verzije svog modela sa "super uzbudljivim" rezultatima.
Med-PaLM 2 dosegao je 86,5 posto na ispitu USMLE, nadmašivši prethodnu verziju za gotovo 20 posto, prema studiji preprinta objavljenoj u svibnju koja nije recenzirana.
Slon u sobi
James Davenport, informatičar na britanskom Sveučilištu Bath koji nije uključen u istraživanje, rekao je da "postoji slon u sobi" za ove medicinske chatbotove koje pokreće AI.
Postoji velika razlika između odgovaranja na "medicinska pitanja i stvarne medicine", što uključuje dijagnosticiranje i liječenje istinskih zdravstvenih problema, rekao je.
Anthony Cohn, stručnjak za umjetnu inteligenciju na britanskom Sveučilištu Leeds, rekao je da će halucinacije vjerojatno uvijek biti problem za tako velike jezične modele, zbog njihove statističke prirode.
Stoga ove modele "uvijek treba smatrati pomoćnicima, a ne onima koji donose konačne odluke", rekao je Cohn.
Singhal je rekao da bi se u budućnosti Med-PaLM mogao koristiti kao podrška liječnicima da ponude alternative koje se inače ne bi razmatrale.
Wall Street Journal izvijestio je ranije ovog tjedna da je Med-PaLM 2 u fazi testiranja u prestižnoj američkoj istraživačkoj bolnici Mayo Clinic od travnja.
Singhal je rekao da ne može govoriti o konkretnim partnerstvima.
No, naglasio je da bilo koje testiranje neće biti "kliničko, niti okrenuto pacijentu, niti može uzrokovati štetu pacijentima".
Umjesto toga, to bi bilo za "više administrativnih zadataka koji se mogu relativno lako automatizirati, s malim ulozima", dodao je.
Izvor: https://www.sciencealert.com/googles-new-chatbot-passed-the-us-medical-exam-but-only-just