Anthropic spustil Claude Fable 5: nový špičkový AI model s bezpečnostními filtry
Anthropic 9. června 2026 vydal Claude Fable 5, první veřejně dostupný model třídy Mythos. Přináší výkonnostní skok a nové bezpečnostní vrstvení.
Anthropic 9. června 2026 uvedl Claude Fable 5, první veřejně dostupný model patřící do třídy Mythos. Uvedení uzavírá dosavadní výkonnostní mezeru mezi výzkumnými a komerčními AI systémy a zároveň přináší novou vrstvu bezpečnostní architektury zaměřenou na omezení potenciálního zneužití.
Co přináší Fable 5
Model je dostupný uživatelům předplatných Pro, Max, Team a Enterprise bez příplatku do 22. června 2026. Po skončení zaváděcího období platí cena 10 USD za milion vstupních tokenů a 50 USD za milion výstupních tokenů. Fable 5 překonává dosavadní vlajkový model Opus 4.8 ve většině měřených benchmarků, v některých kategoriích o více než deset procent.
Klíčovým bezpečnostním prvkem je automatické přesměrování citlivých dotazů. Pokud uživatel položí otázku z oblasti kybernetické bezpečnosti nebo biotechnologií, model ji přesměruje na méně výkonný model Opus 4.8. Toto vrstvení má zabránit zneužití nejsilnějšího modelu ke generování škodlivého obsahu. Jde o přístup, který dosud nebyl u komerčně dostupných AI modelů implementován v takto explicitní podobě.
Interní testování bezpečnosti (tzv. red-teaming, kdy tým záměrně hledá způsoby, jak model obejít) bylo doplněno externím bug bounty programem v rozsahu více než tisíce hodin. Nenalezl se žádný univerzální způsob, jak bezpečnostní filtry obejít. Anthropic zveřejnil metodiku testování jako součást bezpečnostní dokumentace modelu.
Paralelně existuje varianta Claude Mythos 5, identický model bez přidaných bezpečnostních filtrů. Tato varianta je dostupná výhradně prověřeným provozovatelům kritické infrastruktury a podléhá samostatnému procesu ověřování.
Dopad na firmy v ČR a EU
Zavedení automatického přesměrování citlivých dotazů otevírá diskuzi o tom, zda je filtrování na úrovni schopností modelu (tzv. capability filtering) efektivnější než filtrování na úrovni výstupů.
Pro organizace v ČR a EU jde o signál, že dodavatelé AI infrastruktury začínají bezpečnostní opatření zabudovávat přímo do distribučního modelu. To nevylučuje vlastní hodnocení rizik při nasazení, ale snižuje pravděpodobnost, že běžný uživatel dosáhne na nejcitlivější funkce bez prověření.
Co z toho plyne
-
Zavádění AI systémů třídy Mythos do produkce by mělo být předcházeno posouzením, zda organizace potřebuje filtrovanou nebo nefiltrovanou variantu a za jakých podmínek.
-
Bug bounty s více než tisícem hodin externího testování je dobrá praxe, nikoliv zárukou bezpečnosti: prostředí nasazení (prompt injection, tj. pokus o manipulaci modelu přes vstupní text, nebo zneužití přes API, tedy programové rozhraní pro přístup k modelu) nebylo součástí tohoto testu.
-
Přechodné ceny do 22. června 2026 představují okno pro pilotní projekty s omezeným rozpočtem.
-
Dostupnost Mythos 5 bez filtrů pro kritickou infrastrukturu signalizuje nový typ dodavatelsko-zákaznických vztahů v AI sektoru, který bude vyžadovat smluvní a auditní rámec.
-
Bezpečnostní týmy by měly sledovat, zda přesměrování na Opus 4.8 nezpůsobuje neočekávané chování v automatizovaných pipeline (automatizovaných procesech), kde jsou odpovědi strojově zpracovávány.
Zdroje:
Tento přehled sestavil automatizovaný redakční systém CIAD z veřejně dostupných zdrojů, ověřil fakta vůči více nezávislým zdrojům a uvedl je níže. Redakční odpovědnost nese CIAD. Nepřesnost nahlaste na office@ciad.cz.
← Zpět na blog