
Image by Matheus Bertelli, from Pexels
A DeepSeek mesterséges intelligenciája megtanul önállóan gondolkodni
A kínai startup, a DeepSeek, együttműködve a Tsinghua Egyetemmel, azt állítja, hogy kifejlesztett egy okosabb módszert az mesterséges intelligencia modellek gondolkodásának javítására és gyorsítására, anélkül hogy hatalmas számítógépekre vagy drága eszközökre lenne szükség.
Siet? Itt vannak a lényeges tények:
- A DeepSeek egy önmagát fejlesztő AI-t hozott létre az Önálló Elveken Alapuló Kritika Afinálás (ÖEKA) segítségével.
- Az ÖEKA az AI-t saját munkájának értékelésére tanítja, saját létrehozott szabályok segítségével.
- A módszer növeli a teljesítményt anélkül, hogy hatalmas számítási kapacitásra lenne szükség.
Az áttörést egy új technika eredményezi, amit Önálló Elvi Kritika Hangolásnak (Self-Principled Critique Tuning, SPCT) hívnak. Az SPCT nem egyszerűen arról szól, hogy az AI modelleket nagyobbá tesszük a teljesítmény növelése érdekében – az SPCT nem igényel sok energiát és számítási kapacitást ahhoz, hogy megtanítsa az AI-t, hogyan ítélje meg saját munkáját egy általa létrehozott szabályrendszer alapján.
A működés módja egy beépített “bíró” segítségével történik, amely ellenőrzi, hogy az AI válasza megfelel-e a belső logikai szabályoknak, és alkalmas-e az emberi kimenetre. Amikor az AI megfelelő választ ad, pozitív visszajelzést kap, ami segít a hasonló kérdések megválaszolásának képességének fejlesztésében a jövőben.
A DeepSeek ezt a módszert alkalmazza a DeepSeek-GRM rendszerében, amely a Generative Reward Modeling (Generatív Jutalom Modellezés) rövidítése. A GRM eltér a hagyományos módszerektől, mert párhuzamos ellenőrzéseket végez, hogy növelje mind a pontosságot, mind a következetességet.
“Az Önálló Alapelvű Kritika Afinálás (Self-Principled Critique Tuning, SPCT) javasoljuk, hogy elősegítsük a skálázható jutalom generáló viselkedéseket” – írták a kutatók a tanulmányukban. “Az SPCT lehetővé teszi [a modell] számára, hogy adaptívan alakítsa ki az alapelveket és kritikákat az input lekérdezés és válaszok alapján, ami jobb eredményjutalmakhoz vezet.”
Ezzel a rendszerrel a DeepSeek azt állítja, hogy mesterséges intelligenciája most már jobban teljesít, mint a versenytársak, mint például a Google Gemini, a Meta Llama és az OpenAI GPT-4o, különösen bonyolult feladatok, mint az érvelés vagy a döntéshozatal esetében, ahogy a Euronews megjegyezte.
Fontos, hogy a DeepSeek azt tervezi, hogy ezeket az új eszközöket nyílt forráskódú szoftverként fogja kiadni, bár még nem osztottak meg konkrét megjelenési dátumot.
Írj hozzászólást
Mégse