Anthropic predstavil Claude Opus 4.6
Anthropic je v objavi na blogu sporočil, da je njihov »najpametnejši model« z novo različico Claude Opus 4.6 dobil pomembno nadgradnjo. Podjetje model opisuje kot neposredno izboljšavo predhodnika, ki se bolje spopada z zahtevnimi, večstopenjskimi nalogami in že v prvem poskusu doseže raven kakovosti, bližjo končni, produkcijski uporabi. To pomeni manj popravljanja in ponavljanja pri pripravi dokumentov, preglednic in predstavitev. Model je na voljo takoj in po enaki ceni kot prejšnja različica. Po navedbah podjetja posebej izstopa na področjih agentnega programiranja, uporabe orodij, iskanja in finančne analitike.
Ob tej izdaji želi Anthropic očitno razširiti navdušenje nad Claudom tudi zunaj programerskih krogov in se uveljaviti na širšem področju intelektualnega dela. Pri razvoju Opusa 4.6 so zato veliko pozornosti namenili izboljšavam pri pripravi PowerPoint predstavitev in Excel dokumentov. V blogu so izpostavili tudi Cowork, nedavno predstavljeno rešitev, ki prinaša izkušnjo Claude Code v bolj dostopni obliki za tehnično ne tako podkovane uporabnike. S tem želijo spodbuditi uporabo v raziskovanju, marketingu in drugih poslovnih okoljih.
Na področju programiranja je Anthropic poudaril, da je Opus 4.6 zasnovan za še boljšo izkušnjo razvijalcev pri delu s Claude Code. Specializiran je za dolgoročne in kompleksne projekte. Razvojne naloge, ki bi običajno trajale več dni, lahko skrajša na nekaj ur, pri čemer pokrije vse – od arhitekture do postavitve v produkcijo.
Podjetje je predstavilo tudi novo funkcionalnost v raziskovalnem predogledu z imenom »agent teams«. Ta omogoča, da model v okolju Claude Code deluje podobno kot prava inženirska ekipa, kjer se delo na projektu razdeli med več agentov, od katerih vsak prevzame svoj del naloge in se usklajuje z drugimi.
Dianne Na Penn, vodja produktnega upravljanja za raziskave pri Anthropicu, je za The Verge pojasnila, da so se pri tej izdaji osredotočili na izboljšanje izkušnje z več agenti, predvsem z vidika kakovosti rezultatov in hitrosti. Hkrati so želeli model okrepiti tudi za druge vrste znanjskega dela – ne le za programiranje, temveč tudi za delo v Excelu, PowerPointu in pri iskanju informacij.
Po njenih besedah gre za prvo različico modela Opus, ki v beta fazi ponuja kontekstno okno z zmogljivostjo enega milijona enot. Odzivi na Opus 4.5 so bili zelo pozitivni, zato so uporabniki kot eno ključnih želja izpostavili prav daljše kontekstno okno, ki omogoča delo z večjim številom dokumentov hkrati.
Anthropic je še navedel, da so za Opus 4.6 izvedli doslej najobsežnejši sklop varnostnih testiranj. Nova preverjanja so vključevala ocene vpliva na dobrobit uporabnikov, zahtevnejše teste zavračanja potencialno nevarnih zahtevkov in posodobljene preizkuse, ki preverjajo, ali bi model lahko prikrito izvajal škodljiva dejanja. Za izboljšane kibernetskovarnostne sposobnosti modela so dodali tudi šest novih varnostnih preizkusov za spremljanje morebitnih zlorab.
Prijavi napako v članku


























