До проблема долази када модел не може да пронађе јасан образац за одговор, па ипак покуша да састави смислен текст на основу статистике, што може довести до нетачних информација.

Компанија Legal Guardian Digital, која се бави SEO оптимизацијом за правне фирме, анализирала је учесталост грешака ових алата, задовољство корисника и стабилност рада различитих четботова, пише Б92.

ПОВЕЗАНЕ ВЕСТИ

Хиљаде отказа у „Мети“ због вештачке интелигенције
Мета и Мајкрософт смањују број запослених док повећавају улагања у AI
Anthropic инцидент: Најопаснији AI модел завршио у погрешним рукама
Истрага у дигиталном свету: Telegram оптужен за ширење забрањеног садржаја

Резултати показују да Google Gemini има највећу стопу нетачних одговора, са чак 32% „халуцинација“. Следећи је ChatGPT са приближно 30%, док је најпрецизнији Perplexity AI, са око 13% погрешних одговора. DeepSeek и Grok такође бележе релативно ниске стопе грешака од 14% и 15%.

Када је реч о укупном утиску корисника, DeepSeek и ChatGPT имају највишу оцену задовољства од 4,7 (од максималних 5), док Perplexity AI прати са 4,6.

У коначном рангирању, које укључује све факторе, Perplexity AI заузима прво место са индексом 85, затим следе Grok и DeepSeek. ChatGPT се нашао на средини листе са скором 50, док је Gemini остварио 41, а Meta AI заузела последње место са 37 поена.

chatgpt, deepseek, google gemini, вештачка интелигенција

ПОВЕЗАНЕ ВЕСТИ

Министарство формирало радну групу за израду нацрта Закона о вештачкој интелигенцији
Француска главни мотор развоја АИ у Европи, Париз предњачи по пословима у сектору
Gemini и лажна обавештења: Колико су Android AI системи заиста безбедни?
Дигитални сукоб ЕУ и Apple-а: Брисел рекао „не“ изузећу за Siri