xAI, spoločnosť zaoberajúca sa umelej inteligenciou, ktorú založil Elon Musk, oficiálne uviedla na trh svoje najnovšie vlajkové modely, Grok 4 a Grok 4 Heavy. S týmto uvedením predstavila aj svoju najprémiovejšiu predplatnú úroveň doteraz, SuperGrok Heavy, ktorá stojí 300 dolárov mesačne a je zameraná na náročných používateľov a vývojárov.
Grok 4 je navrhnutý tak, aby konkuroval špičkovým modelom AI, ako sú ChatGPT od OpenAI a Gemini od Googlu. Podľa xAI Grok 4 ukazuje špičkové výkony v niekoľkých benchmarkových hodnoteniach.
Predstavenie Grok 4, najvýkonnejšieho modelu AI na svete. Sledujte livestream teraz: [link]
Na testovaní Humanity’s Last Exam, rozsiahlom teste určenom na hodnotenie všeobecných znalostí, dosiahol Grok 4 skóre 25,4% bez použitia externých nástrojov, čím prekonal o3 (vysoký) od OpenAI, ktorý dosiahol 21%, a Gemini 2.5 Pro, ktorý dosiahl 21,6%.
Keď bol vybavený nástrojmi, dosiahol Grok 4 Heavy skóre 44,4%, čím sa stal modelom s najlepším výkonom v tejto kategórii. Na porovnanie, Gemini 2.5 Pro s nástrojmi dosiahol skóre 26,9%, ako uvádza správa TechCrunch.
xAI tiež zdôraznilo systém „multi-agent“ modelu Grok 4 Heavy, ktorý umožňuje viacerým inštanciám modelu riešiť problém paralelne a porovnávať odpovede, podobne ako skupina na štúdium. Tento kolaboratívny prístup má za cieľ zlepšiť úsudok aj presnosť pri zložitých úlohách.
Grok 4 (Thinking) dosiahol nový SOTA na ARC-AGI-2 s hodnotením 15,9%
Toto takmer zdvojnásobuje predchádzajúci komerčný SOTA a predstihuje aktuálne SOTA na súťaži Kaggle.
Predplatné za 300 dolárov mesačne SuperGrok Heavy poskytuje používateľom predčasný prístup k Grok 4 Heavy, ako aj k nadchádzajúcim funkcionalitám produktu. Medzi schopnosti, ktoré sa plánujú uvedení v nasledujúcich mesiacoch, patria AI kódovací model v auguste, multi-modálny agent v septembri a systém na generovanie videí v októbri.
Grok 4 a Grok 4 Heavy sú k dispozícii prostredníctvom API ako súčasť snaženia xAI zapojiť vývojárov a podnikových používateľov. Podniková platforma spoločnosti, ktorá bola spustená len pred dvoma mesiacmi, sa tiež bude rozširovať prostredníctvom partnerstiev s cloudovými hyperscalermi, aby priniesla modely Grok do širších infraštruktúrnych prostredí.

