Az xAI bemutatja a Grok 3 AI-t, amely a béta érvelési modellekkel együtt listavezető teljesítményt nyújt

az xAI piacra dobja a Grok 3 csúcstechnológiás mesterséges intelligencia családot. (Kép forrása: xAI)

A legújabb xAI nagyméretű nyelvi modellek a benchmark-listák élére kerültek, mivel képesek az interneten információt keresni, összetett problémákra következtetni, és egymillió tokenből álló kontextusablakban feldolgozni a bemenetet. A Grok 3 modellek a legtöbb benchmarkban legyőzték az OpenAI GPT-4o és a DeepSeek-V3 modelleket.

David Chien (fordította Ninh Duy), Közzétett 02/21/2025 🇺🇸 🇩🇪 ...

AI Software Launch

Elon Musk xAI vállalata piacra dobta a Grok 3 családot, amely olyan élvonalbeli mesterséges intelligencia nagy nyelvi modelleket tartalmaz, amelyek általában felülmúlják más mesterséges intelligenciák teljesítményét a szabványosított mesterséges intelligencia összehasonlító méréseken.

A Grok 3 modelleket a vállalat Colossus szuperszámítógép-klaszterén képezték ki, amely 100 000 Nvidia Hopper Tensor Core GPU-t használ. Egy pár standard és mini nem érvelő modell (Grok 3 béta és Grok 3 mini béta), valamint egy pár érvelő modell (Grok 3 béta (Think) és Grok 3 mini béta (Think)) jelent meg.

A nem érvelő modellek általában felülmúlják a korábbi listavezető AI-kat, például az OpenAI GPT-4o-t és a DeepSeek-V3-at. Ennek egyik oka, hogy egymillió tokenes kontextusablakkal rendelkeznek, ami lehetővé teszi az AI számára, hogy nagyon nagy mennyiségű szöveget használjon fel. Ez javítja a modellek azon képességét, hogy különböző forrásokból szintetizálják a helyes választ. Ennek ellenére a Grok 3 béta modelljei még mindig kevesebb mint 50%-os pontossággal válaszolnak a ténykereső kérdésekre (SimpleQA benchmark), így az embereknek még holnap is lesz munkájuk.

Az érvelő modellek lépésről lépésre végiggondolják az összetett kéréseket, lehetővé téve a felhasználó számára, hogy lássa a mesterséges intelligencia gondolatmenetét. Ez lehetővé teszi, hogy ezek a mesterséges intelligenciák úgy dolgozzák fel a problémákat, mint egy szakértő tenné, a probléma kisebb részeinek megoldásával és az eredmények kombinálásával a megfelelő válaszhoz. A DeepSearch ágens, vagyis a keresési opció kiválasztásával a Grok 3 széleskörű és mély keresést végez az interneten, és kódértelmezőket használ, mielőtt az eredményeket összefoglaló jelentéseket készít. A Grok 3 (Think) modellek általában a legjobbak a matematikai feladatok megoldásában, a diplomás szintű feleletválasztós kérdések megválaszolásában és a kódolási feladatok elvégzésében más mesterséges intelligenciákkal szemben.

az xAI arra számít, hogy az elkövetkező hónapokban egy 200 000 GPU-s szuperszámítógép-klaszteren folytatja a Grok 3 teljesítményének javítását. A Grok 3 már elérhető minden felhasználó számára az X-en és a Grok.com-on. Az ingyenes felhasználók korlátozásokkal találkozhatnak, míg a fizetős felhasználók hozzáférhetnek a fejlett funkciókhoz.

A Chatbot Arena ELO-pontszámai alapján a Grok 3 AI a világ legjobb teljesítményt nyújtja. (Kép forrása: xAI)

A Grok 3 béta és a Grok 3 mini béta általában felülmúlja az OpenAI GPT-4o és DeepSeek-V3 szabványosított AI benchmarkokon. (Kép forrása: xAI)

A Grok 3 béta (Think) és a Grok 3 mini béta (Think) általában felülmúlja az összes többi tesztelt következtető AI-modellt. (Kép forrása: xAI)

Forrás(ok)

xAI blog, xAI Colossus mesterséges intelligencia szuperszámítógép

Kapcsolódó cikkek

A Humane Ai Pin hamarosan papírnehezékké válik (Kép forrása: Humane)

Humane Ai Pin elveszíti (majdnem) minden funkcióját a HP felvásárlása után 02/20/2025

Az Edifier bemutatja a LolliClip nyitott fülű, valódi vezeték nélküli fülhallgatót zajszűréssel. (Kép forrása: Edifier)

Edifier kiadja a LolliClip nyitott fülű TWS fülhallgatót egészségkövetéssel, Hi-Res zenével, térbeli hanggal és AI zajszűréssel 02/19/2025

A saját kamera használata a téma követésére az AI Tracker platform-agnosztikussá teszi az AI Tracker-t (Kép forrása: Insta360)

Az Insta360 új Flow 2 Pro AI Tracker a zászlóshajó gimbalját a Android telefonokkal, 3rd party alkalmazásokkal teszi működőképessé 02/19/2025

A Perplexity mélykutatási képességekkel bővíti az ingyenes chatbotot. (Kép forrása: Perplexity)

Perplexity hozzáadja a Deep Research funkciót az ingyenes AI chatbotjához 02/15/2025

A potenciális OnePlus 13T megjeleni...

Fitbit viselhető kap új állapotjelz...

Editor of the original article: David Chien - Tech Writer - 525 articles published on Notebookcheck since 2023

Translator: Ninh Ngoc Duy - Editorial Assistant - 521685 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> Magyarország - Kezdőlap > Newsarchive 2025 02 > Az xAI bemutatja a Grok 3 AI-t, amely a béta érvelési modellekkel együtt listavezető teljesítményt nyújt

David Chien, 2025-02-21 (Update: 2025-02-21)