Alibaba trdi, da je njihov najnovejši model umetne inteligence boljši od DeepSeek-V3
Nenavaden termin izdaje modela Qwen 2.5-Max, na prvi dan kitajskega novega leta, ko večina Kitajcev ne dela in čas preživlja s svojimi družinami, dokazuje enormen pritisk, ki ga je DeepSeek povzročil ne samo pri tujih konkurentih, temveč tudi pri domačih.
“Qwen 2.5-Max prekaša … po skoraj vseh parametrih GPT-4o, DeepSeek-V3 in LIama-3.1-405B“, so na svojem WeChat računu zapisali pri Alibabinimi oblačni enoti. S tem, ko so prst jasno pokazali na OpenAI-jev in Metin najnaprednejši model, so poželi veliko zanimanja.
Izid UI asistenta DeepSeek 10. januarja, ki ga poganja model DeepSeek-V3 in potem še izid modela R1 20. januarja, je dobesedno šokiral ZDA in povzročil tektonske premike na delniških trgih. Kitajski startup je pokazal, kako lahko z nizkimi stroški razvoja in uporabe konkurira ameriškim modelom in tako pri investitorjih dvignil stopnjo zaskrbljenosti glede velikih vložkov, ki jih načrtujejo ameriška podjetja.
Toda uspeh DeepSeeka je privedel tudi do prerivanja med domačimi konkurenti.
Dva dni po izdaji DeepSeek-R1 je lastnik TikToka ByteDance izdal posodobitev svojega vodilnega UI modela, za katerega je trdil, da je v AIME primerjalnem testu, ki meri, kako dobro UI modeli razumejo in se odzivajo na zapletena navodila, presegel OpenAI o1, ki ga podpira Microsoft.
To je dodatno opolnomočilo trditev DeepSeeka, da njihov model R1 lahko tekmuje z o1.
DeepSeek proti domačim konkurentom
Predhodnik modela DeepSeek V3, DeepSeek-V2, je lani maja na Kitajskem sprožil cenovno vojno UI modelov.
Dejstvo, da je bil DeepSeek-V2 odprtokoden in izjemno poceni, le 1 juan (0,14 USD) za 1 milijon žetonov – ali enot podatkov, obdelanih z modelom – je privedlo do tega, da je Alibabina oblačna enota napovedala znižanje cen do 97 % na paleto modelov.
Druga kitajska tehnološka podjetja so sledila zgledu, vključno z Baidujem, ki je marca 2023 izdal prvi kitajski ekvivalent ChatGPT in največjim internetnim podjetjem v državi Tencent.
Liang Wenfeng, enigmatični ustanovitelj DeepSeeka, je julija v redkem intervjuju za kitajski medij Waves dejal, da podjetju “ni mar” za cenovne vojne in da je doseganje AGI (splošne umetne inteligence) njihov glavni cilj.
OpenAI definira AGI kot avtonomne sisteme, ki prekašajo ljudi pri večini ekonomsko vrednih nalog.
Medtem ko imajo velika kitajska tehnološka podjetja, kot je Alibaba, več sto tisoč zaposlenih, DeepSeek deluje kot raziskovalni laboratorij, v katerem delajo predvsem mladi diplomanti in doktorski študenti z najboljših kitajskih univerz.
Liang je v svojem julijskem intervjuju dejal, da verjame, da največja kitajska tehnološka podjetja morda niso primerna za prihodnost industrije umetne inteligence, pri čemer je njihove visoke stroške in strukture od zgoraj navzdol primerjal z vitkim delovanjem DeepSeeka in agilnim slogom upravljanja.
“Veliki temeljni modeli zahtevajo stalne inovacije, zmogljivosti tehnoloških velikanov imajo svoje meje,” je dejal.
Prijavi napako v članku