Računalništvo, telefonija
Programska oprema
26.02.2025 10:00

Deli z drugimi:

Share

Tukaj je Anthropicov najpametnejši UI model do zdaj

Postopoma pa pričenjajo še s testom agentskega razvijalskega orodja imenovanega Claude Code.

Anthropic je izdal model Claude 3.7 Sonnet, njihov prvi hibridni model, ki je sposoben sklepanja in poglobljenega razmišljanja. Po pisanju portala The Verge je model 3.7 Sonner boljši od predhodnikov, predvsem na področju kodiranja in matematike.

Poleg zgoraj izpostavljenega modela pa Anthropic predstavlja tudi omejen raziskovalni predogled svojega agentskega orodja namenjenega kodiranja, Claude Code. Medtem ko Anthropic že poganja UI programerska orodja, kot je Cursos, bi naj zdaj s Claudom Code dosegel novo stopnjo aktivnega sodelovanja pri raziskovanju in kodiranju. Claude Code je zmožen urejanja datotek, pisanja in poganjanja testov, postavljanja kode na GitHub in še nekaterih drugih zanimivih funkcionalnosti.

Claude 3.7 Sonnet je v aplikaciji Claude na voljo od ponedeljka naprej. Za razvijalce je dostop možen preko Anthropic-ovega API-ja, storitve Amazon Bedrock in Google Cloud Vertex AI. Cenovno gledano je model enak predhodnim, in sicer 3 dolarjev na milijon (input) žetonov in 15 dolarjev na milijon “output” žetonov.

Medtem ko OpenAI in drugi ponujajo ločene tako imenovane modele sklepanja, vodja produktnih raziskav pri Anthropicu Dianne Penn za The Verge pravi, da je podjetje želelo poenostaviti izkušnjo uporabe modela. “V osnovi verjamemo, da je razmišljanje značilnost umetne inteligence in ne popolnoma ločena stvar,” pravi in ugotavlja, da Claude ne bi smel predolgo odgovarjati na vprašanje “Koliko je ura?” v primerjavi z bolj zapletenim pozivom, kot je “načrtuj dvotedensko potovanje v Italijo in upoštevaj vreme konec marca.”

Claude’s latest model card.
Vir: Anthropic
Claude’s software engineering performance.
Vir: Anthropic

Pennova pravi, da je Claude 3.7 Sonnet opazno boljši pri “agentskem kodiranju”, financah in pravnih nalogah. Medtem ko Claude še vedno nima spletnega iskanja v realnem času kot drugi modeli, je presečni datum znanja različice 3.7 oktober 2024, ker je bolj aktualizirana različica od prejšnje. Anthropic razvijalcem omogoča tudi, da pomagajo usmerjati, kako model “razmišlja” in celo natančno narekujejo, koliko časa traja, da se odzove. “Včasih mora razvijalec samo reči, da ne bi smelo trajati več kot 200 milisekund, da odgovori na to vprašanje,” pravi podpredsednik pri Anthropicu, Michael Gerstenhaber.

Pravi, da podjetje preizkuša svoje modele tudi glede njihove zmožnosti napredovanja skozi videoigro stare šole Pokémon s preslikavo API-ja modela v shemo krmilnika. Claude 3.5 Sonnet se na začetku igre ni mogel prebiti iz Pallet Towna, medtem ko je različica 3.7 to uspela in je prišla dlje v igri.

Kot je prejšnji teden pokazal Elon Musk z modelom Grok-3, se tekma UI modelov odvija neverjetno hitro. Za zdaj se zdi, da je Anthropic spet v vodstvu zahvaljujoč povečanju zmogljivosti modela Claude 3.7 Sonnet. Njegova objava tudi nakazuje, da se industrija namesto da ponuja samostojne modele sklepanja premika proti točki, kjer lahko en model naredi vse.


Prijavi napako v članku
Vas zanima več iz te teme?
umetna inteligenca


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Nova Vizija, informacijski inženiring in svetovanje, d.d.

Celjska cesta 9, 3310 Žalec, Tel: 03 71 21 800
Odločitev, v katero informacijsko tehnologijo bi moralo vlagati vaše podjetje in v katere ne, je težka. Po eni strani želite biti tisti, ki je odgovoren za inovacije in rast ... Več

eTAROK, MIROSLAV CIGAN s.p.

Ulica Štefana Kovača 2, 9231 Beltinci, Tel: 041 519 443
Računalniška igra za ljubitelje taroka Življenje se je v zadnjem letu preselilo v naše domove, kjer poleg dela iščemo različne vrste razvedrila. Za ljubitelje igre s tarok ... Več

GRID d.o.o.

Cesta v Šmartno 49a, 1000 Ljubljana, Tel: 040 299 901
Zlati partner

Kaspersky

, ,
Kaspersky je globalno priznano podjetje, specializirano za raziskovanje, razvoj in ponudbo visoko zmogljivih varnostnih rešitev za informacijsko varnost in zaščito pred spletnimi ... Več