Anthropic vydal Claude Opus 4.8: rekordní výsledky a orchestrace stovek AI agentů
Claude Opus 4.8 překonal hranici 60 bodů v AI Intelligence Indexu a přináší nástroj pro řízení stovek paralelních AI agentů najednou.
Anthropic vydal 28. května 2026 nový model Claude Opus 4.8. Od předchozí verze 4.7 uplynulo pouhých 41 dní, což je dosud nejrychlejší vývojový cyklus v historii řady Claude Opus. Toto tempo je samo o sobě signálem: trh špičkových jazykových modelů (velké AI systémy schopné psát, analyzovat a rozhodovat) se pohybuje rychleji, než dovolují roční aktualizační cykly firemních politik.
Co nový model umí
Na benchmarku SWE-bench Verified, který měří schopnost modelu opravovat reálné softwarové chyby, dosáhl Opus 4.8 skóre 88,6 procenta oproti 87,6 procenta u předchůdce 4.7. Na náročnější variantě SWE-bench Pro model dosáhl 69,2 procenta. V oblasti vědeckého uvažování měřeného benchmarkem GPQA Diamond model dosáhl 93,6 procenta.
Nejviditelnějším výsledkem je skóre 61,4 bodu v Artificial Analysis Intelligence Index, což je souhrnné hodnocení schopností AI modelů. Opus 4.8 se tak stal prvním modelem, který překonal hranici 60 bodů v tomto žebříčku.
Klíčová novinka: Dynamic Workflows
Zásadní novinkou je funkce Dynamic Workflows, aktuálně dostupná jako research preview (předběžná verze určená k testování). Umožňuje modelu řídit stovky paralelních subagentů (dílčích AI asistentů) v rámci jedné úlohy. To otevírá cestu k automatizaci rozsáhlých procesů, kde více AI agentů pracuje souběžně na různých částech zadání.
Anthropic zároveň představil Fast Mode, který přináší 2,5násobné zrychlení generování odpovědí na úkor hloubky uvažování. Cena Fast Mode je 10 USD za milion vstupních tokenů (tokenem se rozumí přibližně čtyři znaky textu) a 50 USD za milion výstupních tokenů. Základní cena modelu zůstává na 5 USD za milion vstupních a 25 USD za milion výstupních tokenů, tedy beze změny oproti Opus 4.7.
Co to znamená pro vaši organizaci
Rychlý vývojový cyklus má přímé důsledky pro organizace, které s modely Claude pracují nebo je plánují nasadit. Kratší interval mezi verzemi znamená rychlejší přístup k vylepšeným schopnostem, ale také nutnost průběžně ověřovat, zda výstupy nové verze splňují požadavky nasazených aplikací.
Dynamic Workflows v předběžné verzi vyžadují zvláštní pozornost bezpečnostních týmů. Orchestrace stovek paralelních agentů s přístupem k externím nástrojům a datovým zdrojům výrazně rozšiřuje plochu potenciálního zneužití nebo nekontrolovaného chování. Organizace by měly před nasazením tohoto funkčního bloku provést analýzu rizik.
Co z toho plyne
-
Týmy využívající Claude API by měly otestovat Opus 4.8 na svých produkčních use-casech před migrací, protože zlepšení na benchmarcích nemusí rovnoměrně odpovídat výsledkům v konkrétní aplikaci.
-
Fast Mode je vhodný pro scénáře, kde záleží na rychlosti odpovědi a kde nejsou vysoké nároky na hloubku uvažování. V regulovaných kontextech (právní analýza, medicína, compliance) zvažte zachování standardního módu.
-
Nasazení Dynamic Workflows by mělo být podmíněno definicí bezpečnostních hranic: jaké nástroje mohou subagenti volat, jaká data smějí zpracovávat a kdo schvaluje akce s nevratnými důsledky.
-
Governance týmy by měly aktualizovat interní dokumentaci a registry rizik tak, aby odrážely nové schopnosti modelu, zejména v kontextu přípravy na AI Act (evropský zákon o umělé inteligenci).
-
Zrychlenou iteraci výrobce sledujte jako signál: trh špičkových modelů se pohybuje rychleji, než dovolují roční aktualizační cykly interních politik.
Zdroje:
Tento přehled sestavil automatizovaný redakční systém CIAD z veřejně dostupných zdrojů, ověřil fakta vůči více nezávislým zdrojům a uvedl je níže. Redakční odpovědnost nese CIAD. Nepřesnost nahlaste na office@ciad.cz.
← Zpět na blog