Image by Matheus Bertelli, from Pexels

A DeepSeek mesterséges intelligenciája megtanul önállóan gondolkodni

Olvasási idő: 2 perc

Legutoljára frissítve: Apr 8, 2025

Írta Kiara Fabbri Multimédia újságíró
Fordította Lokalizációs & fordítói csapat Lokalizációs & fordítói szolgáltatások

A kínai startup, a DeepSeek, együttműködve a Tsinghua Egyetemmel, azt állítja, hogy kifejlesztett egy okosabb módszert az mesterséges intelligencia modellek gondolkodásának javítására és gyorsítására, anélkül hogy hatalmas számítógépekre vagy drága eszközökre lenne szükség.

Siet? Itt vannak a lényeges tények:

A DeepSeek egy önmagát fejlesztő AI-t hozott létre az Önálló Elveken Alapuló Kritika Afinálás (ÖEKA) segítségével.
Az ÖEKA az AI-t saját munkájának értékelésére tanítja, saját létrehozott szabályok segítségével.
A módszer növeli a teljesítményt anélkül, hogy hatalmas számítási kapacitásra lenne szükség.

Az áttörést egy új technika eredményezi, amit Önálló Elvi Kritika Hangolásnak (Self-Principled Critique Tuning, SPCT) hívnak. Az SPCT nem egyszerűen arról szól, hogy az AI modelleket nagyobbá tesszük a teljesítmény növelése érdekében – az SPCT nem igényel sok energiát és számítási kapacitást ahhoz, hogy megtanítsa az AI-t, hogyan ítélje meg saját munkáját egy általa létrehozott szabályrendszer alapján.

A működés módja egy beépített “bíró” segítségével történik, amely ellenőrzi, hogy az AI válasza megfelel-e a belső logikai szabályoknak, és alkalmas-e az emberi kimenetre. Amikor az AI megfelelő választ ad, pozitív visszajelzést kap, ami segít a hasonló kérdések megválaszolásának képességének fejlesztésében a jövőben.

A DeepSeek ezt a módszert alkalmazza a DeepSeek-GRM rendszerében, amely a Generative Reward Modeling (Generatív Jutalom Modellezés) rövidítése. A GRM eltér a hagyományos módszerektől, mert párhuzamos ellenőrzéseket végez, hogy növelje mind a pontosságot, mind a következetességet.

“Az Önálló Alapelvű Kritika Afinálás (Self-Principled Critique Tuning, SPCT) javasoljuk, hogy elősegítsük a skálázható jutalom generáló viselkedéseket” – írták a kutatók a tanulmányukban. “Az SPCT lehetővé teszi [a modell] számára, hogy adaptívan alakítsa ki az alapelveket és kritikákat az input lekérdezés és válaszok alapján, ami jobb eredményjutalmakhoz vezet.”

Ezzel a rendszerrel a DeepSeek azt állítja, hogy mesterséges intelligenciája most már jobban teljesít, mint a versenytársak, mint például a Google Gemini, a Meta Llama és az OpenAI GPT-4o, különösen bonyolult feladatok, mint az érvelés vagy a döntéshozatal esetében, ahogy a Euronews megjegyezte.

Fontos, hogy a DeepSeek azt tervezi, hogy ezeket az új eszközöket nyílt forráskódú szoftverként fogja kiadni, bár még nem osztottak meg konkrét megjelenési dátumot.

A DeepSeek mesterséges intelligenciája megtanul önállóan gondolkodni

Örülünk, hogy tetszett a munkánk!

Írj hozzászólást