Lahko novi Grok prehiti Claude Opus?
Elon Musk je prek družbenega omrežja X naznanil, da je njihov najnovejši adut na področju umetne inteligence Grok 4.5 uradno vstopil v fazo zaprtega testiranja. Namesto v nevtralna računalniška okolja v oblaku je podjetje xAI novi model najprej namestilo neposredno v delovne procese podjetij SpaceX in Tesla. Nova različica temelji na temeljni arhitekturi V9, ki obsega kar 1,5 bilijona parametrov. V praksi to pomeni ogromen skok v primerjavi s starejšim modelom V8, ki je deloval s 500 milijardami parametrov in se je soočal z določenimi strukturnimi omejitvami.
Pri xAI so za pospešitev razvoja ubrali precej nenavadno in agresivno strategijo. K projektu so namreč pritegnili nekaj deset najboljših sistemskih inženirjev iz programov Starlink in Starship, ki s svojim znanjem o obsežnih omrežjih in zapleteni strojni opremi pomagajo optimizirati celoten sistem. Dodatno so model podprli s podatki iz napredne kodirne platforme Cursor. Matično podjetje Anysphere, ki stoji za Cursorjem, naj bi namreč SpaceX kupil za astronomskih 55 milijard evrov, posel pa naj bi se uradno zaključil v tretjem četrtletju. Ti podatki vključujejo resnične interakcije programerjev, s čimer želi Grok postati prvo orodje, po katerem bodo razvijalci posegli ob odpiranju terminala.
Musk trdi, da prve interne analize kažejo, da se Grok 4.5 po zmogljivosti že kosa z uveljavljenim modelom Claude Opus podjetja Anthropic, v določenih segmentih pa naj bi ga celo prekašal. Primerjave scier temeljijo izključno na lastnih internih meritvah podjetja xAI, neodvisni testi pa teh navedb za zdaj še niso potrdili. Musk je kasneje ublažil retoriko in model opisal kot “zanesljivega delovnega konja v istem rangu kot Opus”.
Nadaljnje učenje sistema s človeško povratno informacijo še vedno poteka, ekipa pa hkrati prenavlja programsko kodo v jezikih C in C++ za večjo učinkovitost ter optimizira delovanje za prihajajočo strojno platformo Nvidia GB300. Načrti za prihodnost so naravnost osupljivi, saj nameravajo vsak mesec do konca leta izdati povsem nov model, zgrajen od samega začetka. Čeprav imajo na voljo močne superračunalnike, kot je sistem Colossus, pa tako hiter tempo odpira vprašanja o stabilnosti in dolgoročni kakovosti preverjanja teh sistemov.
Prijavi napako v članku



























