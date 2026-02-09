Spraševanje umetne inteligence o zdravstvenih težavah bolnikom ne pomaga pri sprejemanju boljših odločitev o njihovem zdravju kot druge metode, na primer običajno iskanje po internetu, kaže nova študija, objavljena v reviji Nature Medicine. Avtorji so poudarili, da je študija pomembna, saj se ljudje vse pogosteje obračajo na umetno inteligenco in klepetalne robote za nasvete o svojem zdravju, brez dokazov, da je to nujno najboljši in najvarnejši pristop.

Raziskovalci pod vodstvom Oxfordskega internetnega inštituta so skupaj s skupino zdravnikov pripravili 10 različnih zdravstvenih scenarijev, od običajnega prehlada do smrtno nevarne krvavitve, ki povzroča krvavitev v možganih, poroča Reuters. Pri preizkusu brez sodelovanja ljudi so trije veliki jezikovni modeli: Chat GPT podjetja Open AI, Llama 3 podjetja Meta in Command R+ podjetja Cohere, prepoznali bolezni v 94,9 odstotka primerov in izbrali pravilen ukrep, kot je klic rešilnega avtomobila ali obisk zdravnika, v povprečju v 56,3 odstotka primerov.

Vrzel med potencialom in dejansko uspešnostjo umetne inteligence

Raziskovalci so nato v Veliki Britaniji pridobili 1.298 udeležencev, ki so bodisi uporabili umetno inteligenco bodisi svoje običajne vire, kot so iskanje po internetu, lastne izkušnje ali spletna stran Nacionalne zdravstvene službe, da bi preučili simptome in se odločili za naslednji korak. Ko so to storili udeleženci, so ustrezne bolezni prepoznali v manj kot 34,5 odstotka primerov, pravilen ukrep pa so navedli v manj kot 44,2 odstotka, kar ni bilo nič boljše od nadzorne skupine, ki je uporabljala bolj tradicionalna orodja.

Adam Mahdi, soavtor študije in izredni profesor na Oxfordu, je dejal, da študija kaže »ogromno vrzel« med potencialom umetne inteligence in pastmi pri njeni uporabi s strani ljudi. »Roboti morda imajo znanje, vendar se to znanje v interakciji z ljudmi vedno ne prenese,« je dejal.

Nepopolne informacije

Ekipa je podrobno preučila okoli 30 interakcij in ugotovila, da so ljudje pogosto podajali nepopolne ali napačne informacije, vendar so veliki jezikovni modeli včasih tudi ustvarjali zavajajoče ali napačne odgovore.

En bolnik je na primer poročal o simptomih subarahnoidne krvavitve, smrtno nevarne bolezni, ki povzroča krvavitev v možganih. Po opisu togega vratu, občutljivosti na svetlobo in »najhujšega glavobola doslej« je pravilno dobil nasvet umetne inteligence, naj gre v bolnišnico. Drugi je opisal enake simptome, s tem da je glavobol opisal kot »strašen«, in dobil nasvet, naj se uleže v zatemnjen prostor.

Raziskovalci trenutno načrtujejo podobno študijo v različnih državah in jezikih, da bi ugotovili, ali ti dejavniki vplivajo na uspešnost umetne inteligence.