Anthropic predstavil Opus 4.5, najzmogljivejši model v seriji
Opus 4.5 je prvi model, ki je presegel 80 % na preizkusu SWE-Bench Verified, enem izmed najuglednejših meril za ocenjevanje sposobnosti kodiranja. Model izkazuje vrhunske rezultate tudi na testih, kot so Terminal-bench, tau2-bench, MCP Atlas, ARC-AGI 2 in GPQA Diamond, kjer se primerja z najnovejšimi modeli, kot sta GPT-5.1 (OpenAI) in Gemini 3 (Google).
Poudarek na praktični uporabi
Anthropic je skupaj z modelom predstavil še več novih produktov, ki prikazujejo zmogljivosti Opusa 4.5 v realnih okoljih. Med njimi sta Claude za Chrome in Claude za Excel, ki bosta zdaj dostopna širšemu krogu uporabnikov. Razširitev za Chrome bo na voljo uporabnikom Max, medtem ko bo različica za Excel namenjena tudi uporabnikom Team in Enterprise. Novi model prinaša izboljšave pri uporabi računalnikov in preglednic, kar nakazuje njegovo usmerjenost v poslovno okolje.
Napredek pri spominu in kontekstu
Vodja produktnega razvoja pri raziskovalnem oddelku Anthropica, Dianne Na Penn, je v pogovoru za TechCrunch poudarila pomen izboljšanega delovanja spomina: “Ni dovolj, da imaš daljše kontekstno okno – ključno je, da model zna prepoznati, katere podrobnosti si mora zapomniti.” Te izboljšave so omogočile tudi uvedbo dolgo pričakovane funkcije “neprekinjenega klepeta” (“endless chat”) za plačljive uporabnike Claude-a, pri kateri se modelov kontekst samodejno stisne brez prekinitve pogovora.
Izboljšan spomin je ključen tudi pri uporabi modela kot vodilnega agenta, ki usmerja več pod-agentov, poganjanih z modelom Haiku 4.5. Takšen pristop omogoča kompleksne naloge, kot so raziskovanje obsežnih zbirk kode ali analiziranje velikih dokumentov, kjer mora sistem znati slediti toku informacij in se po potrebi vrniti korak nazaj.
Pogled naprej
Z modelom Opus 4.5 Anthropic utrjuje svoj položaj enega ključnih tekmecev v t. i. “tekmi za umetno inteligenco”, kjer se pomerja z OpenAI in Googlom. Podjetje s serijo 4.5 kaže zavezanost h kombinaciji tehnične odličnosti in praktične uporabnosti – področji, ki bosta verjetno odločilni v naslednji fazi razvoja umetne inteligence.
Prijavi napako v članku


























