
Image by TechCrunch, from Flickr
AI, ami gondolkodik, mielőtt megszólal? Bemutatkozik a Claude 3.7 Sonnet hibrid logikai rendszer
Az Anthropic kiadta a Claude 3.7 Sonnet nevű AI modelljének új változatát, amely bevezeti az opcionális “kiterjesztett gondolkodás” módot, így a felhasználóknak nagyobb kontrolljuk lesz a modell komplex feladatok feldolgozásában.
Siet? Itt vannak a lényeges tények!
- A modell javítja a problémamegoldást és a gondolkodást, mivel lehetőséget nyújt az önértékelésre a válaszadás előtt.
- Az átfogó gondolkodási mód csak a fizetős terveken érhető el.
- A Claude Code, egy kódoló asszisztens, korlátozott előnézetben áll a fejlesztők rendelkezésére
Az Anthropic kiadta a Claude 3.7 Sonnet-et, egy frissített AI modellt, amely bevezeti a hibrid gondolkodást, lehetővé téve a felhasználóknak, hogy választhatnak a gyors válaszok és a bővebb gondolkodás között.
Ez az új megközelítés arra törekszik, hogy javítsa a problémamegoldást azzal, hogy lehetőséget ad a modellnek arra, hogy szükség esetén további időt fordítson a válaszainak értékelésére és finomítására.
Alap üzemmódban a Claude 3.7 Sonnet iteratív fejlesztésként funkcionál elődje, a Claude 3.5 Sonnet felett. Azonban az átgondolt gondolkodási módban a modell önelmélkedésbe kezd, mielőtt választ adna.
Michael Gerstenhaber, az Anthropic AI termékfejlesztési vezetője úgy írta le a funkciót, mint egy eszközt a felhasználók számára, hogy egyensúlyt teremtsenek a válaszidő és az érvelés mélysége között. “A [felhasználó] nagy kontrollal rendelkezik a viselkedés felett – mennyi időt gondolkodik, és cserélhet érvelést és intelligenciát idővel és költségvetéssel” – mondta, ahogy a WIRED jelentette.
Ez a folyamat arra szolgál, hogy növelje a pontosságot azokban a területeken, amelyek többlépéses érvelést igényelnek, mint például a matematika, fizika, kódolás és utasítások követése. A modellel API-n keresztül interakciót létesítő felhasználók meghatározhatják, hány token-t használjon a “gondolkodáshoz”, lehetővé téve a válasz sebességének és költségének szabályozását.
A WIRED megjegyzi, hogy a frissítés magában foglal egy “scratchpad” funkciót is, amely láthatóvá teszi a modell gondolkodási lépéseit, miközben feldolgoz egy kérést. Ez a megközelítés hasonló más AI modellekben alkalmazott technikákhoz, mint például a DeepSeek-é.
Az Anthropic azt állítja, hogy a Claude 3.7 Sonnetet a valós világbeli alkalmazásokra optimalizálták, nem pedig a verseny stílusú benchmarkokra. A korai tesztek azt sugallják, hogy a kiterjesztett gondolkodási mód javítja a teljesítményt olyan feladatokban, amelyek bonyolult kódhalmazokat, fejlett eszközhasználatot és teljes stack szoftverfejlesztést tartalmaznak.
A modell értékelése a SWE-bench Ellenőrzött és a TAU-bench-en történt, ahol állítólag felülmúlja az előző verziókat, ahogy azt az Anthropic jelentette.
CNN Megjegyzi, hogy az Anthropic ugyanazon az áron tartja a Claude 3.7-et, mint az előző modelleket, pozicionálva azt az OpenAI legújabb ajánlatai alatt. A bemeneti tokenek milliónkénti ára 3 dollár, míg a kimeneti tokeneké milliónként 15 dollár, szemben az OpenAI 15 és 60 dolláros árával hasonló szinteken.
Írj hozzászólást
Mégse