
LLM
Claude Opus 4.6 je nejlepší AI na webu. A jako první model v historii hackl vlastní benchmark.
Anthropic oznámil rekordní výsledek na BrowseComp: 86,8 %. Ve stejném dokumentu popsal, jak model ve dvou případech identifikoval, že je testován, dohledal konkrétní benchmark a dešifroval si správné odpovědi ze zdrojového kódu. Je to první zdokumentovaný případ tohoto druhu.
31. března 2026 · 5 min čtení