Elon Muskov Grok zaznamenal najnižšiu mieru halucinácií v štúdii spoľahlivosti AI

Štúdia z decembra 2025 odhalila, že Elon Muskov Grok je jedným z najspoľahlivejších AI chatbotov na pracovné využitie

V decembri 2025 uskutočnená štúdia spoločnosti Relum, agregátora hazardných hier, identifikovala AI chatbot Elona Muska Grok ako jeden z najspoľahlivejších pre pracovné využitie, čo dokazuje najnižšia miera halucinácií, a to len 8% medzi desiatimi hlavnými testovanými modelmi.

Porovnanie s trhovým lídrom ChatGPT

Na porovnanie, trhový líder ChatGPT zaznamenal jednu z najvyšších mier halucinácií, a to 35%, hneď za Googleovým Gemini, ktorý vykázal vysokú mieru halucinácií 38%. Tieto zistenia zdôrazňujú faktické schopnosti Groku napriek nižšej trhovej viditeľnosti tohto modelu AI.

Grok vedie v metrike halucinácií

Výskum hodnotil chatboty podľa mnohých kritérií vrátane miery halucinácií, hodnotení zákazníkov, konzistencie odpovedí a miery výpadkov, pričom prideľoval skóre spoľahlivosti rizika od 0 do 99, pričom vyššie skóre znamenalo väčšie problémy.

Grok dosiahol mieru halucinácií 8%, hodnotenie zákazníkov 4,5, konzistenciu 3,5 a mieru výpadkov 0,07%, čo viedlo k celkovému skóre rizika len 6. DeepSeek bol tesne za ním s 14% halucináciami a nulovou mierou výpadkov pre vynikajúce skóre rizika 4. Miera halucinácií 35% u ChatGPT ho vystrelila na najvyššie skóre rizika 99, nasledované Claudeom a Meta AI, ktoré získali skóre spoľahlivosti rizika 75 a 70.

Prečo je dôležité málo halucinácií

Šéf produktov Relum, Razvan-Lucian Haiduc, zdieľal svoje postrehy o zisteniach štúdie. „Približne 65% amerických spoločností v súčasnosti využíva AI chatboty vo svojej každodennej práci a takmer 45% zamestnancov priznáva, že s týmito nástrojmi zdieľali citlivé informácie spoločnosti. Tieto čísla jasne ukazujú, aké dôležité sa chatboty stali v každodennej práci.

„Závislosť na nástrojoch AI pravdepodobne ešte viac vzrastie, takže spoločnosti by si mali vyberať svoje chatboty na základe toho, ako sú spoľahlivé a ako vyhovujú špecifickým podnikateľským potrebám. Chatbot, ktorý používajú všetci, nie je nutne ten, ktorý najlepšie funguje pre vašu oblasť alebo poskytuje presné odpovede na vaše úlohy. ”

Týmto spôsobom štúdia odhaľuje významnú medzeru medzi obľúbenosťou a výkonom AI chatbotov, pričom nízka miera halucinácií Groku ho umiestňuje ako silnú voľbu pre aplikácie, kde je presnosť kritická. Toto všetko napriek tomu, že Grok nie je medzi používateľmi taký rozšírený ako ďalšie, mainstreamovejšie aplikácie AI, ako je napríklad ChatGPT.

editorka

yoyostore.cz

yoyostore.cz