Notebookcheck Logo

A DeepSeek három hónappal a kezdeti bevezetés után kiadja a továbbfejlesztett V3 AI modellt

DeepSeek-V3-0324 megjelent a teljesítmény és a képességek javításával. (Kép forrása: DeepSeek)
DeepSeek-V3-0324 megjelent a teljesítmény és a képességek javításával. (Kép forrása: DeepSeek)
A DeepSeek-V3-0324 kiadás három hónappal a DeepSeek V3 eredeti, 2024. decemberi indulása után jelenik meg. Ez a frissített modell javított teljesítményt és képességeket kínál, például vonzó weboldalak és jól megírt kínai nyelvű jelentések készítését.
Launch AI Software Open Source

A DeepSeek, egy kínai AI vállalat kiadta a DeepSeek-V3-0324-et, a V3 AI nagy nyelvi modelljének (LLM) frissített változatát, amelyet eredetileg 2024 decemberében indítottak el. A V3-as modell meglepte a világot, mivel sokkal alacsonyabb képzési hardverigénye, rövidebb képzési ideje és alacsonyabb API-költségei mellett nagy teljesítményt nyújtott a konkurens mesterséges intelligenciákkal, például az OpenAI GPT modelljeivel szemben.

A frissített V3-as modell egy nem érvelő AI modell, ami azt jelenti, hogy a DeepSeek R1-es modelljével ellentétben megpróbál gyorsan válaszolni a kérdésekre, és nem szán extra időt a nehéz problémák átgondolására. A 685 milliárd paraméteres méretével a legnagyobb nyilvánosan elérhető LLM-ek közé tartozik. A legújabb modell a MIT licenc alatt használható.

A DeepSeek-V3-0324 5,3-19,8%-kal magasabb pontszámot ért el az AI benchmarkokon, mint az eredeti V3. Teljesítménye összehasonlítható más vezető mesterséges intelligenciával, például a GPT-4.5 és a Claude Sonnet 3.7 teljesítményével.

A frissített modellnek jobbak a képességei is. Az egyik terület, ahol javult, az a finomított képessége, hogy vonzó weboldalakat és online játékok front-endjeit hozza létre. Egy másik fejlesztés a kínai nyelven való keresés, írás és fordítás képességének javítása.

A teljes 685B DeepSeek-V3-0324 verzióval kísérletezni kívánó olvasóknak legalább 700 GB szabad tárhelyre és több Nvidia A100/H100 GPU-ra lesz szükségük. A modell desztillált és kisebb paraméterekkel rendelkező változatai egyetlen GPU-n is futtathatók, például az Nvidia 3090-en(itt kapható az Amazonon).

A DeepSeek-V3-0324 AI teljesítménye az eredeti kiadáshoz képest javult, magasabb AI benchmark pontszámokkal. (Kép forrása: DeepSeek)
A DeepSeek-V3-0324 AI teljesítménye az eredeti kiadáshoz képest javult, magasabb AI benchmark pontszámokkal. (Kép forrása: DeepSeek)

DeepSeek-V3-0324 kiadás

Jelentős növekedés a következtetési teljesítményben

Erősebb front-end fejlesztési képességek

Okosabb eszközhasználati képességek

Nem bonyolult következtetési feladatokhoz a V3 használatát javasoljuk - csak kapcsolja ki a "DeepThink"-et

Az API használata változatlan marad

A modellek mostantól MIT licenc alatt kerülnek kiadásra, akárcsak a DeepSeek-R1!

Nyílt forráskódú súlyok: huggingface.co/deepseek-ai/DeepSeek-V3-0324

Please share our article, every link counts!
Mail Logo
> Magyarország - Kezdőlap > Newsarchive 2025 03 > A DeepSeek három hónappal a kezdeti bevezetés után kiadja a továbbfejlesztett V3 AI modellt
David Chien, 2025-03-29 (Update: 2025-03-29)