Kai kitą kartą vietoj „Google" paieškos paklausite „ChatGPT" apie kosulį ar bėrimą, žinokite — tikimybė gauti teisingą atsakymą yra maždaug trys iš keturių. Penn State universiteto mokslininkai ištyrė, kaip tiksliai dirbtinis intelektas atsako į kasdienius sveikatos klausimus, ir 76 procentų tikslumo riba verčia kelti ne vieną klausimą.
Kas buvo tikrinama
2026 m. birželio 25–28 d. Monrealyje, Kanadoje, vyksiančioje ACM FAccT konferencijoje pristatomas tyrimas nagrinėjo būtent tai, ką paprastas žmogus klausia DI apie savo sveikatą — perspektyvą, kuri, anot bendraautoriaus, Penn State informatikos profesoriaus Amulya Yadav, ankstesniuose tyrimuose nebuvo nagrinėjama.
„Norėjome suprasti, jei žmonės naudoja didžiuosius kalbos modelius kaip simptomų tikrintuvą — panašiai kaip anksčiau naudojo „Google", — kiek tikslūs yra atsakymai ir kiek žalingi jie gali būti", — sakė jis. Tyrime dalyvavo 34 žmonės — Penn State dėstytojai, studentai ir darbuotojai, kurie uždavinėjo DI kasdienius sveikatos klausimus. Kiekvieną atsakymą vertino medicinos specialistai.
Kur DI stringa
Nors 76 procentai skamba neblogai, mokslininkai įspėja: specializuotose srityse — neurologijoje, dermatologijoje — tikslumas pastebimai krenta. Be to, kai kurie DI atsakymai buvo ne tik netikslūs, bet ir potencialiai žalingi, jeigu pacientas jais vadovautųsi be gydytojo konsultacijos.
Tyrėjų komanda pabrėžia, kad DI įrankiai sveikatos priežiūroje geriausiai veikia apmokytų gydytojų rankose, o ne kaip paciento savidiagnostikos priemonė. „Di gali padėti gydytojui, bet ne pakeisti jį", — tokia pagrindinė išvada.
Ką tai reiškia paprastam žmogui
Tyrimas, kurio išankstinė versija jau paskelbta „arXiv" serveryje, siunčia aiškią žinią: DI pokalbių robotai gali būti naudingas pirmas žingsnis ieškant informacijos apie sveikatą, tačiau jie neturėtų tapti vieninteliu patarėju. Tyrėjai rekomenduoja gautus atsakymus visada tikrinti su gydytoju — ypač jei simptomai kelia nerimą ar yra susiję su specializuotomis medicinos sritimis.