Claude Sonnet 4.5 samostojno deloval 30 ur

Anthropic je predstavil svoj najnovejši model umetne inteligence, Claude Sonnet 4.5, ki je pokazal izjemen napredek v avtonomnem delovanju. Model je samostojno deloval 30 ur in v tem času napisal celotno klepetalno aplikacijo, podobno orodjema, kot sta Slack ali Teams. Po podatkih podjetja je pri tem ustvaril približno 11.000 vrstic kode in se ustavil šele, ko je nalogo v celoti dokončal.
30-urno avtonomno delovanje predstavlja izjemen skok naprej v primerjavi s prejšnjim modelom, Opus 4, ki je maja dosegel sedem ur samostojnega delovanja.
Ta dosežek je pomemben korak v Anthropicovi bitki za prevlado na trgu tako UI agentov kot UI kodiranja. Podjetje je Claude Sonnet 4.5 označilo za »najboljši model na svetu za realne agente, kodiranje in uporabo računalnika« ter poudarilo, da je vodilni na trgu v »uporabi računalnikov«, s čimer se sklicuje na funkcijo Computer Use, ki jo je Anthropic predstavil pred skoraj letom dni.
Model je specializiran za področja, kot so kibernetska varnost, finančne storitve in raziskovanje. Podjetje Canva je nov model preizkušalo med prvimi in pravijo, da jim je novi model pomagal pri »kompleksnih nalogah z dolgim kontekstom, od inženiringa v naši kodni bazi do funkcij znotraj izdelkov in raziskav.«
Anthropic je napovedal tudi, da bo novi model povezan z dodatnimi posodobitvami, ki bodo razvijalcem pomagale pri kodiranju lastnih UI agentov. To vključuje dostop do virtualnih strojev, pomnilnika, upravljanja konteksta in podpore za več agentov. Podjetje pravi, da s tem v bistvu ponuja enake gradnike, ki poganjajo Claude Code, kar razvijalcem omogoča, da ustvarijo lastne vrhunske agente.
Dianne Penn, vodja produktnega menedžmenta pri Anthropicu, je bila kljub vsem napovedim presenečena nad novo pridobljeno zmogljivostjo njihovega modela. Pennova je dodala, da model uporablja tudi za pomoč pri zaposlovanju, saj samostojno izvede poglobljeno spletno iskanje, določi parametre za profile in ustvari preglednico s potencialnimi kandidati ter njihovimi profili LinkedIn.
Prijavi napako v članku