Új korszak kezdődik az AI ügynökök eszközhasználatában: dinamikus felfedezés, programozott vezérlés és példák az optimális működéshez

Az AI ügynökök fejlődése egyre inkább arra irányul, hogy modellek zökkenőmentesen működjenek együtt több száz vagy akár több ezer különböző eszközzel. Legyen szó fejlesztői környezeti asszisztensekről, amelyek git műveleteket, fájlkezelést, csomagkezelőket, tesztelési keretrendszereket és telepítési folyamatokat integrálnak, vagy olyan operációs koordinátorokról, amelyek egyszerre kapcsolódnak Slackhez, GitHubhoz, Google Drive-hoz, Jira-hoz és több MCP szerverhez, a jövő az eszközök dinamikus és hatékony használatáról szól. A hagyományos megközelítések azonban hamar elérik korlátjaikat, hiszen a korai eszközdefiníciók és eredmények gyakran túlzottan leterhelik a modell kontextusablakát, ami csökkenti az AI teljesítményét és pontosságát.

Dinamikus eszközfelfedezés a Tool Search Tool segítségével

A hagyományos módszer során az összes eszköz definícióját és eredményét egyszerre betöltik a modell kontextusába, ami akár több tízezer token fogyasztását is jelentheti már a beszélgetés megkezdése előtt. Például egy átlagos öt szerveres rendszer (GitHub, Slack, Sentry, Grafana, Splunk) esetén az eszközök definíciója több mint 55 000 tokent foglalhat el, ami jelentősen korlátozza a modell hatékonyságát. Ezen felül a hasonló nevű eszközök közötti téves választások és helytelen paraméterhasználatok is gyakoriak.

Az Anthropic által fejlesztett Tool Search Tool megoldja ezt a problémát azzal, hogy nem tölti be az összes eszköz definícióját azonnal, hanem csak az adott feladathoz releváns eszközöket keresi és tölti be dinamikusan. Ezáltal akár 85%-kal csökken a tokenhasználat, miközben a teljes eszközkönyvtár elérhető marad.

A rendszer úgy működik, hogy az eszközöket „defer_loading” paraméterrel látják el, így csak azok töltődnek be előre, amelyeket mindig használni kell. A többit Claude, az AI ügynök, igény szerint keresi meg és hívja be. Például, ha GitHub műveletekre van szükség, csak a github.createPullRequest és github.listIssues eszközök töltődnek be, a többi, például Slack vagy Jira eszközök nem. Ez a megközelítés nemcsak a tokenhasználatot csökkenti, de javítja az eszközhasználat pontosságát is.

Programozott eszközhasználat a hatékonyabb munkafolyamatokért

A hagyományos eszközhasználat során minden eszközhívás egy külön modell értelmezési lépést igényel, ami lassítja a folyamatokat és növeli a hibák kockázatát. Emellett a köztes eredmények – például egy több tízezer soros táblázat vagy egy nagy logfájl – azonnal betöltődnek a modell kontextusába, ezzel elzárva helyet a fontosabb információk elől.

Az új programozott eszközhasználat (Programmatic Tool Calling) lehetővé teszi, hogy Claude kódot írjon, amely több eszközt hív meg párhuzamosan és kezeli a kimeneteket egy szigorúan kontrollált kódvégrehajtási környezetben. Így a modell csak a végső eredményt látja, anélkül, hogy a teljes nyers adatot kellene feldolgoznia. Ez jelentős mértékben csökkenti a tokenfogyasztást, gyorsítja a folyamatokat és növeli a pontosságot.

Példaként vegyük egy vállalati költségvetési ellenőrzés esetét, amikor azt kell megállapítani, hogy melyik munkatárs lépte túl a negyedéves utazási keretét. A hagyományos módszer akár több ezer adatpontot tölt be a modellbe, míg a programozott megoldás egy Python szkriptet futtat, amely párhuzamosan hívja meg az eszközöket, összesíti az adatokat, és csak a túllépő munkatársak nevét és költését adja vissza a modellnek. Az eredmény drasztikusan kisebb tokenhasználat (37%-os csökkenés), kevesebb késleltetés és jobb pontosság.

Példák az eszközhasználatra a hibamentes működés érdekében

Az eszközök sikeres alkalmazásához nem elég csupán a JSON sémákra hagyatkozni, hiszen ezek csak az adatok szerkezetét és típusát határozzák meg, de nem írják le a helyes használati mintákat. Például egy támogatási jegy létrehozásakor a séma nem ad választ arra, hogy milyen formátumban kell megadni a dátumokat, vagy hogyan kell helyesen kitölteni a bejelentő adatait.

Az új Tool Use Examples funkció lehetővé teszi, hogy valós példákat adjunk meg az eszközök használatára, bemutatva a helyes paraméterezést, opcionális mezők használatát és a tipikus API konvenciókat. Ezzel a Claude pontosabban érti, mikor és hogyan kell egy-egy eszközt hívnia, csökkentve a hibás hívások számát és növelve a rendszer megbízhatóságát.

Az internal tesztek szerint ezen példák alkalmazásával akár 72%-ról 90%-ra nőtt a komplex paraméterkezelés pontossága.

Hogyan érdemes alkalmazni az új funkciókat?

Az új eszközhasználati fejlesztések nem feltétlenül szükségesek együttesen minden feladathoz. Érdemes a legnagyobb szűk keresztmetszetekkel kezdeni, így például:

– Ha a kontextusablak túlzottan telítődik az eszközdefinícióktól, először a Tool Search Tool-t érdemes bevezetni.
– Ha a köztes eredmények miatt túl nagy a kontextusfelhasználás, a Programmatic Tool Calling nyújthat megoldást.
– Ha pedig a hibás paraméterhasználat a fő probléma, a Tool Use Examples segíthet.

Ezek a funkciók egymás mellett is alkalmazhatók, így a Tool Search Tool gondoskodik a releváns eszközök kiválasztásáról, a Programmatic Tool Calling a hatékony végrehajtásról, míg a Tool Use Examples javítja a hívások helyességét.

Út a jövő AI ügynökeinek fejlesztése felé

Az Anthropic által bemutatott új megoldások új szintre emelik az AI ügynökök eszközhasználatát, lehetővé téve a komplex, több száz eszközt kezelő rendszerek hatékony működését. A dinamikus eszközfelfedezés, a programozott vezérlés és a használati példák ötvözésével az AI képes lesz komplex munkafolyamatokat kezelni, miközben csökkenti a tokenhasználatot, növeli a pontosságot és gyorsítja a válaszidőt.

Ezek a fejlesztések már béta verzióban elérhetők és hamarosan egyre több fejlesztő és vállalat fogja alkalmazni őket, hogy még intelligensebb és hatékonyabb AI megoldásokat hozzon létre. A jövő AI ügynökei így nem csupán egyszerű eszközhasználók lesznek, hanem komplex munkafolyamatokat képesek lesznek intelligensen összehangolni és végrehajtani.

—

Az új funkciók részletes dokumentációja és fejlesztői útmutatói elérhetők az Anthropic hivatalos oldalán, amelyek segítségével a fejlesztők könnyedén integrálhatják ezeket a lehetőségeket saját projektjeikbe. A technológia fejlődése jelentős lépés az AI rendszerek gyakorlati alkalmazása felé, és izgalmas fejlesztési irányokat nyit meg a mesterséges intelligencia jövőjében.

Forrás: az eredeti angol cikk itt olvasható