Велики језички модели функционишу тако што препознају обрасце и предвиђају следећу највероватнију реч у низу, а не тако што заиста „знају“ чињенице.
До проблема долази када модел не може да пронађе јасан образац за одговор, па ипак покуша да састави смислен текст на основу статистике, што може довести до нетачних информација.
Компанија Legal Guardian Digital, која се бави SEO оптимизацијом за правне фирме, анализирала је учесталост грешака ових алата, задовољство корисника и стабилност рада различитих четботова, пише Б92.
ПОВЕЗАНЕ ВЕСТИ
Резултати показују да Google Gemini има највећу стопу нетачних одговора, са чак 32% „халуцинација“. Следећи је ChatGPT са приближно 30%, док је најпрецизнији Perplexity AI, са око 13% погрешних одговора. DeepSeek и Grok такође бележе релативно ниске стопе грешака од 14% и 15%.
Када је реч о укупном утиску корисника, DeepSeek и ChatGPT имају највишу оцену задовољства од 4,7 (од максималних 5), док Perplexity AI прати са 4,6.
У коначном рангирању, које укључује све факторе, Perplexity AI заузима прво место са индексом 85, затим следе Grok и DeepSeek. ChatGPT се нашао на средини листе са скором 50, док је Gemini остварио 41, а Meta AI заузела последње место са 37 поена.

