Alibaba bemutatja új Qwen mesterséges intelligencia modelljét, és azt állítja, hogy teljesítményben felülmúlja a DeepSeek-V3-at

Photo by John Schnobrich on Unsplash

Alibaba bemutatja új Qwen mesterséges intelligencia modelljét, és azt állítja, hogy teljesítményben felülmúlja a DeepSeek-V3-at

Olvasási idő: 2 perc

A kínai óriás, az Alibaba a hét szerdáján adta ki legújabb zászlóshajó AI modelljének, a Qwennek a legfrissebb verzióját. A cég azt állítja, hogy ez jobban teljesít, mint a népszerű DeepSeek-V3.

Siet? Itt vannak a lényeges tények!

  • Az Alibaba ezen a szerdán mutatta be legújabb logikai modelljét, a Qwen 2.5-Max-ot.
  • A kínai óriáscég azt állítja, hogy ez a modell felülmúlja a népszerű modelleket, mint a DeepSeek-V3, a GPT-4o és a Llama-3.1-405B.
  • A cég ezen a héten elindította a Qwen2.5-VL-t is, amely egy olyan AI modell, amely képes képek feldolgozására, és AI ügynökként működve használható számítógépeken és mobiltelefonokon feladatok végrehajtására.

A Reuters szerint az Alibaba az új Qwen 2.5-Max-ot, ahogyan az új érvelési modellt nevezte, épp a kínai holdújévi ünnepek idején indította el, hogy csatlakozzon az elmúlt napok óriási AI fejlesztéseihez és egy kis belpiaci versenyt is hozzon létre.

Hétfőn a DeepSeek az első helyre került az Apple App Store-jában az Egyesült Államokban, lekörözve a ChatGPT-t, ami aggodalomra ad okot az AI iparág többi vállalata számára, és riadalmat kelt a befektetőkben – a Nvidia részvényei egyetlen nap alatt 17%-kal estek.

Most az Alibaba bejelentette a Qwen modelljének legújabb változatait – tavaly szeptemberben 100 nyílt forráskódú AI modellt adott ki a Qwen csomaghoz – jobb eredményeket ígérve, mint a népszerű fronter modellek.

“A Qwen 2.5-Max teljesítményben (…) szinte minden területen felülmúlja a GPT-4o-t, a DeepSeek-V3-at és a Llama-3.1-405B-t” – írta a vállalat hivatalos WeChat fiókján.

A Qwen 2.5-Max új érvelési modelljének API-ja az Alibaba felhőn keresztül érhető el, a felhasználók pedig kipróbálhatják a modellt annak csevegő oldalán.

„Nagy léptékű MoE modellt fejlesztünk, a Qwen2.5-Max-ot, amelyet több mint 20 trillió tokenen előzetesen kiképeztünk, majd gondosan összeállított Felügyelt Finomhangolással (SFT) és Emberi Visszajelzésből származó Megerősítő Tanulási (RLHF) módszertanokkal tovább képeztünk” – írta a Qwen csapat a Githubon.

A kínai óriáscég hétfőn bemutatta a Qwen2.5-VL-t is, ami egy olyan multimodális AI modellek sorozata, amely képes képeket is feldolgozni, és hozzáférni mobilokhoz és számítógépekhez feladatok elvégzéséhez. Az OpenAI egy hasonló funkciót jelentett be, az Operátort, amely lehetővé teszi a ChatGPT számára, hogy a felhasználó számítógépének irányítását átvegye, és önállóan végezzen feladatokat.

Az Alibaba csapata szerint az összes Qwen modell felülmúlja az OpenAI, Microsoft, Google, Meta és DeepSeek hasonló verzióit.

Tetszett ez a cikk? Értékelje!
Utáltam Nem igazán tetszik nekem Rendben volt Nagyon jó! Imádtam!

Örülünk, hogy tetszett a munkánk!

Értékes olvasóként írnál rólunk véleményt a Trustpilotra? Csak pár perc, és a világot jelentené számunkra. Köszönjük, hogy ilyen szuper vagy!

Értékelj minket a Trustpiloton
0 0 felhasználó szavazott
Cím
Hozzászólás
Köszönjük visszajelzését
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Írj hozzászólást

Loader
Loader Mutass többet...