Tukaj je Anthropicov najpametnejši UI model do zdaj
Anthropic je izdal model Claude 3.7 Sonnet, njihov prvi hibridni model, ki je sposoben sklepanja in poglobljenega razmišljanja. Po pisanju portala The Verge je model 3.7 Sonner boljši od predhodnikov, predvsem na področju kodiranja in matematike.
Poleg zgoraj izpostavljenega modela pa Anthropic predstavlja tudi omejen raziskovalni predogled svojega agentskega orodja namenjenega kodiranja, Claude Code. Medtem ko Anthropic že poganja UI programerska orodja, kot je Cursos, bi naj zdaj s Claudom Code dosegel novo stopnjo aktivnega sodelovanja pri raziskovanju in kodiranju. Claude Code je zmožen urejanja datotek, pisanja in poganjanja testov, postavljanja kode na GitHub in še nekaterih drugih zanimivih funkcionalnosti.
Claude 3.7 Sonnet je v aplikaciji Claude na voljo od ponedeljka naprej. Za razvijalce je dostop možen preko Anthropic-ovega API-ja, storitve Amazon Bedrock in Google Cloud Vertex AI. Cenovno gledano je model enak predhodnim, in sicer 3 dolarjev na milijon (input) žetonov in 15 dolarjev na milijon “output” žetonov.
Medtem ko OpenAI in drugi ponujajo ločene tako imenovane modele sklepanja, vodja produktnih raziskav pri Anthropicu Dianne Penn za The Verge pravi, da je podjetje želelo poenostaviti izkušnjo uporabe modela. “V osnovi verjamemo, da je razmišljanje značilnost umetne inteligence in ne popolnoma ločena stvar,” pravi in ugotavlja, da Claude ne bi smel predolgo odgovarjati na vprašanje “Koliko je ura?” v primerjavi z bolj zapletenim pozivom, kot je “načrtuj dvotedensko potovanje v Italijo in upoštevaj vreme konec marca.”
Pennova pravi, da je Claude 3.7 Sonnet opazno boljši pri “agentskem kodiranju”, financah in pravnih nalogah. Medtem ko Claude še vedno nima spletnega iskanja v realnem času kot drugi modeli, je presečni datum znanja različice 3.7 oktober 2024, ker je bolj aktualizirana različica od prejšnje. Anthropic razvijalcem omogoča tudi, da pomagajo usmerjati, kako model “razmišlja” in celo natančno narekujejo, koliko časa traja, da se odzove. “Včasih mora razvijalec samo reči, da ne bi smelo trajati več kot 200 milisekund, da odgovori na to vprašanje,” pravi podpredsednik pri Anthropicu, Michael Gerstenhaber.
Pravi, da podjetje preizkuša svoje modele tudi glede njihove zmožnosti napredovanja skozi videoigro stare šole Pokémon s preslikavo API-ja modela v shemo krmilnika. Claude 3.5 Sonnet se na začetku igre ni mogel prebiti iz Pallet Towna, medtem ko je različica 3.7 to uspela in je prišla dlje v igri.
Kot je prejšnji teden pokazal Elon Musk z modelom Grok-3, se tekma UI modelov odvija neverjetno hitro. Za zdaj se zdi, da je Anthropic spet v vodstvu zahvaljujoč povečanju zmogljivosti modela Claude 3.7 Sonnet. Njegova objava tudi nakazuje, da se industrija namesto da ponuja samostojne modele sklepanja premika proti točki, kjer lahko en model naredi vse.
Prijavi napako v članku