Notebookcheck Logo

Az xAI bemutatja a Grok 3 AI-t, amely a béta érvelési modellekkel együtt listavezető teljesítményt nyújt

az xAI piacra dobja a Grok 3 csúcstechnológiás mesterséges intelligencia családot. (Kép forrása: xAI)
az xAI piacra dobja a Grok 3 csúcstechnológiás mesterséges intelligencia családot. (Kép forrása: xAI)
A legújabb xAI nagyméretű nyelvi modellek a benchmark-listák élére kerültek, mivel képesek az interneten információt keresni, összetett problémákra következtetni, és egymillió tokenből álló kontextusablakban feldolgozni a bemenetet. A Grok 3 modellek a legtöbb benchmarkban legyőzték az OpenAI GPT-4o és a DeepSeek-V3 modelleket.
AI Software Launch

Elon Musk xAI vállalata piacra dobta a Grok 3 családot, amely olyan élvonalbeli mesterséges intelligencia nagy nyelvi modelleket tartalmaz, amelyek általában felülmúlják más mesterséges intelligenciák teljesítményét a szabványosított mesterséges intelligencia összehasonlító méréseken.

A Grok 3 modelleket a vállalat Colossus szuperszámítógép-klaszterén képezték ki, amely 100 000 Nvidia Hopper Tensor Core GPU-t használ. Egy pár standard és mini nem érvelő modell (Grok 3 béta és Grok 3 mini béta), valamint egy pár érvelő modell (Grok 3 béta (Think) és Grok 3 mini béta (Think)) jelent meg.

A nem érvelő modellek általában felülmúlják a korábbi listavezető AI-kat, például az OpenAI GPT-4o-t és a DeepSeek-V3-at. Ennek egyik oka, hogy egymillió tokenes kontextusablakkal rendelkeznek, ami lehetővé teszi az AI számára, hogy nagyon nagy mennyiségű szöveget használjon fel. Ez javítja a modellek azon képességét, hogy különböző forrásokból szintetizálják a helyes választ. Ennek ellenére a Grok 3 béta modelljei még mindig kevesebb mint 50%-os pontossággal válaszolnak a ténykereső kérdésekre (SimpleQA benchmark), így az embereknek még holnap is lesz munkájuk.

Az érvelő modellek lépésről lépésre végiggondolják az összetett kéréseket, lehetővé téve a felhasználó számára, hogy lássa a mesterséges intelligencia gondolatmenetét. Ez lehetővé teszi, hogy ezek a mesterséges intelligenciák úgy dolgozzák fel a problémákat, mint egy szakértő tenné, a probléma kisebb részeinek megoldásával és az eredmények kombinálásával a megfelelő válaszhoz. A DeepSearch ágens, vagyis a keresési opció kiválasztásával a Grok 3 széleskörű és mély keresést végez az interneten, és kódértelmezőket használ, mielőtt az eredményeket összefoglaló jelentéseket készít. A Grok 3 (Think) modellek általában a legjobbak a matematikai feladatok megoldásában, a diplomás szintű feleletválasztós kérdések megválaszolásában és a kódolási feladatok elvégzésében más mesterséges intelligenciákkal szemben.

az xAI arra számít, hogy az elkövetkező hónapokban egy 200 000 GPU-s szuperszámítógép-klaszteren folytatja a Grok 3 teljesítményének javítását. A Grok 3 már elérhető minden felhasználó számára az X-en és a Grok.com-on. Az ingyenes felhasználók korlátozásokkal találkozhatnak, míg a fizetős felhasználók hozzáférhetnek a fejlett funkciókhoz.

A Chatbot Arena ELO-pontszámai alapján a Grok 3 AI a világ legjobb teljesítményt nyújtja. (Kép forrása: xAI)
A Chatbot Arena ELO-pontszámai alapján a Grok 3 AI a világ legjobb teljesítményt nyújtja. (Kép forrása: xAI)
A Grok 3 béta és a Grok 3 mini béta általában felülmúlja az OpenAI GPT-4o és DeepSeek-V3 szabványosított AI benchmarkokon. (Kép forrása: xAI)
A Grok 3 béta és a Grok 3 mini béta általában felülmúlja az OpenAI GPT-4o és DeepSeek-V3 szabványosított AI benchmarkokon. (Kép forrása: xAI)
A Grok 3 béta (Think) és a Grok 3 mini béta (Think) általában felülmúlja az összes többi tesztelt következtető AI-modellt. (Kép forrása: xAI)
A Grok 3 béta (Think) és a Grok 3 mini béta (Think) általában felülmúlja az összes többi tesztelt következtető AI-modellt. (Kép forrása: xAI)
Please share our article, every link counts!
Mail Logo
> Magyarország - Kezdőlap > Newsarchive 2025 02 > Az xAI bemutatja a Grok 3 AI-t, amely a béta érvelési modellekkel együtt listavezető teljesítményt nyújt
David Chien, 2025-02-21 (Update: 2025-02-21)