Photo by John Schnobrich on Unsplash

Alibaba bemutatja új Qwen mesterséges intelligencia modelljét, és azt állítja, hogy teljesítményben felülmúlja a DeepSeek-V3-at

Olvasási idő: 2 perc

Legutoljára frissítve: Jan 31, 2025

Írta Andrea Miliani Technológiai hírek szakértője
Fordította Lokalizációs & fordítói csapat Lokalizációs & fordítói szolgáltatások

A kínai óriás, az Alibaba a hét szerdáján adta ki legújabb zászlóshajó AI modelljének, a Qwennek a legfrissebb verzióját. A cég azt állítja, hogy ez jobban teljesít, mint a népszerű DeepSeek-V3.

Siet? Itt vannak a lényeges tények!

Az Alibaba ezen a szerdán mutatta be legújabb logikai modelljét, a Qwen 2.5-Max-ot.
A kínai óriáscég azt állítja, hogy ez a modell felülmúlja a népszerű modelleket, mint a DeepSeek-V3, a GPT-4o és a Llama-3.1-405B.
A cég ezen a héten elindította a Qwen2.5-VL-t is, amely egy olyan AI modell, amely képes képek feldolgozására, és AI ügynökként működve használható számítógépeken és mobiltelefonokon feladatok végrehajtására.

A Reuters szerint az Alibaba az új Qwen 2.5-Max-ot, ahogyan az új érvelési modellt nevezte, épp a kínai holdújévi ünnepek idején indította el, hogy csatlakozzon az elmúlt napok óriási AI fejlesztéseihez és egy kis belpiaci versenyt is hozzon létre.

Hétfőn a DeepSeek az első helyre került az Apple App Store-jában az Egyesült Államokban, lekörözve a ChatGPT-t, ami aggodalomra ad okot az AI iparág többi vállalata számára, és riadalmat kelt a befektetőkben – a Nvidia részvényei egyetlen nap alatt 17%-kal estek.

Most az Alibaba bejelentette a Qwen modelljének legújabb változatait – tavaly szeptemberben 100 nyílt forráskódú AI modellt adott ki a Qwen csomaghoz – jobb eredményeket ígérve, mint a népszerű fronter modellek.

“A Qwen 2.5-Max teljesítményben (…) szinte minden területen felülmúlja a GPT-4o-t, a DeepSeek-V3-at és a Llama-3.1-405B-t” – írta a vállalat hivatalos WeChat fiókján.

A Qwen 2.5-Max új érvelési modelljének API-ja az Alibaba felhőn keresztül érhető el, a felhasználók pedig kipróbálhatják a modellt annak csevegő oldalán.

„Nagy léptékű MoE modellt fejlesztünk, a Qwen2.5-Max-ot, amelyet több mint 20 trillió tokenen előzetesen kiképeztünk, majd gondosan összeállított Felügyelt Finomhangolással (SFT) és Emberi Visszajelzésből származó Megerősítő Tanulási (RLHF) módszertanokkal tovább képeztünk” – írta a Qwen csapat a Githubon.

A kínai óriáscég hétfőn bemutatta a Qwen2.5-VL-t is, ami egy olyan multimodális AI modellek sorozata, amely képes képeket is feldolgozni, és hozzáférni mobilokhoz és számítógépekhez feladatok elvégzéséhez. Az OpenAI egy hasonló funkciót jelentett be, az Operátort, amely lehetővé teszi a ChatGPT számára, hogy a felhasználó számítógépének irányítását átvegye, és önállóan végezzen feladatokat.

Az Alibaba csapata szerint az összes Qwen modell felülmúlja az OpenAI, Microsoft, Google, Meta és DeepSeek hasonló verzióit.

Alibaba bemutatja új Qwen mesterséges intelligencia modelljét, és azt állítja, hogy teljesítményben felülmúlja a DeepSeek-V3-at

Örülünk, hogy tetszett a munkánk!

Írj hozzászólást