Notebookcheck Logo

Az Ant Group kínai chipeken képez AI modelleket, 20 százalékkal csökkentve a költségeket

Az Ant Group sikeresen képez AI modelleket kínai félvezetőkkel, 20 százalékkal csökkentve a költségeket (Kép forrása: Ant Group)
Az Ant Group sikeresen képez AI modelleket kínai félvezetőkkel, 20 százalékkal csökkentve a költségeket (Kép forrása: Ant Group)
Az Ant Group mostantól saját fejlesztésű kínai chipeken képzi a mesterséges intelligencia modelleket, 20 százalékkal csökkentve a költségeket az Nvidia hardveréhez képest, miközben versenyképes eredményeket ér el. Ez jelentős lépés Kína technológiai önellátása felé az amerikai exportellenőrzések közepette.
AI Business

Jack Ma fintech erőműve a hazai chipeket használta fel az Alibaba és a Huawei által gyártott AI modellek képzése érdekében, amelyek a jelek szerint az Nvidia H800 GPU-ival vetekednek.

Az Ant Group az ügyet ismerő személyek szerint rájött, hogyan lehet az AI-modelleket kínai gyártású félvezetőkön betanítani, ami a hagyományos módszerekhez képest mintegy 20 százalékkal csökkenti a költségeket.

Bennfentesek szerint az Ant eredményei kedvezően állnak az Nvidia Corp. H800-as lapkáival szemben, amelyek jelenleg nem állnak a kínai vállalatok rendelkezésére, mivel Amerikai exportellenőrzés miatt. Bár az Ant még mindig Nvidia hardvert használ az AI munkájának egy részéhez, a cég most állítólag nagyobb hangsúlyt fektet az AMD processzorokra és kínai alternatívákra a legújabb modelljeihez.

Az Ant ebben a hónapban egy kutatási dokumentumot tett közzé, amelyben azt állította, hogy Ling-Plus és Ling-Lite modelljei még a Meta Platforms Inc.-t is legyőzték bizonyos benchmarkokban. Ha ezek az eredmények helytállóak, akkor ezek a rendszerek jelentős előrelépést jelenthetnek a kínai mesterséges intelligencia számára, mivel drasztikusan csökkentik a képzés és a mesterséges intelligencia-szolgáltatások bevezetésének költségeit.

A tanulmány megjegyzi, hogy 1 trillió token betanítása nagy teljesítményű hardverrel nagyjából 6,35 millió jüanba (kb. 880 000 dollár) kerül. A vállalat optimalizált megközelítésével - és a kisebb teljesítményű berendezésekkel - azonban ez a szám körülbelül 5,1 millió jüanra (kb. 700 000 dollár) csökken. Azoknak, akik nem ismerik, a tokenek lényegében az információk azon egységei, amelyeket ezek a modellek a tanuláshoz és a kimenetek előállításához használnak.

A jövőben az Ant ezeket a mesterséges intelligenciamodelleket egészségügyi és pénzügyi alkalmazásokban kívánja használni. Az év elején felvásárolta a Haodf.com kínai online platformot, hogy megerősítse az egészségügyre összpontosító AI-szolgáltatásait. Az Ant egy Zhixiaobao nevű AI "életasszisztens" alkalmazást és egy Maxiaocai nevű pénzügyi tanácsadó AI eszközt is üzemeltet.

Mindkét Ling modell nyílt forráskódú: A Ling-Lite 16,8 milliárd paramétert hordoz, míg a Ling-Plus 290 milliárdot. Bár ezek komoly számok, még mindig kisebbek, mint néhány más nagy AI-modell - a szakértők becslése szerint a GPT-4.5 körülbelül 1,8 billió paramétert tartalmaz, a DeepSeek-R1 pedig 671 milliárdot.

Az Ant elismerte, hogy van néhány bukkanó az úton, különösen a képzés alatti stabilitás tekintetében. A kutatási dokumentum megjegyezte, hogy a hardver vagy a modell tervezésének apró változtatásai néha nagy hibaszázalékokat okoztak.

Forrás(ok)

Bloomberg (angolul)

Please share our article, every link counts!
Mail Logo
> Magyarország - Kezdőlap > Newsarchive 2025 03 > Az Ant Group kínai chipeken képez AI modelleket, 20 százalékkal csökkentve a költségeket
Nathan Ali, 2025-03-25 (Update: 2025-03-25)