Programska oprema
30.01.2025 14:15
Posodobljeno 1 leto nazaj.

Deli z drugimi:

Share

Alibaba trdi, da je njihov najnovejši model umetne inteligence boljši od DeepSeek-V3

Kitajsko tehnološko podjetje Alibaba je v sredo, 29. januarja, predstavilo novo verzijo modela Qwen 2.5, za katerega pravijo, da naj bi bil bolšji od trenutno najbolj vročega modela DeepSeek-V3.

Nenavaden termin izdaje modela Qwen 2.5-Max, na prvi dan kitajskega novega leta, ko večina Kitajcev ne dela in čas preživlja s svojimi družinami, dokazuje enormen pritisk, ki ga je DeepSeek povzročil ne samo pri tujih konkurentih, temveč tudi pri domačih.

Qwen 2.5-Max prekaša … po skoraj vseh parametrih GPT-4o, DeepSeek-V3 in LIama-3.1-405B“, so na svojem WeChat računu zapisali pri Alibabinimi oblačni enoti. S tem, ko so prst jasno pokazali na OpenAI-jev in Metin najnaprednejši model, so poželi veliko zanimanja.

Izid UI asistenta DeepSeek 10. januarja, ki ga poganja model DeepSeek-V3 in potem še izid modela R1 20. januarja, je dobesedno šokiral ZDA in povzročil tektonske premike na delniških trgih. Kitajski startup je pokazal, kako lahko z nizkimi stroški razvoja in uporabe konkurira ameriškim modelom in tako pri investitorjih dvignil stopnjo zaskrbljenosti glede velikih vložkov, ki jih načrtujejo ameriška podjetja.

Toda uspeh DeepSeeka je privedel tudi do prerivanja med domačimi konkurenti.

Dva dni po izdaji DeepSeek-R1 je lastnik TikToka ByteDance izdal posodobitev svojega vodilnega UI modela, za katerega je trdil, da je v AIME primerjalnem testu, ki meri, kako dobro UI modeli razumejo in se odzivajo na zapletena navodila, presegel OpenAI o1, ki ga podpira Microsoft.

To je dodatno opolnomočilo trditev DeepSeeka, da njihov model R1 lahko tekmuje z o1.

DeepSeek proti domačim konkurentom

Predhodnik modela DeepSeek V3, DeepSeek-V2, je lani maja na Kitajskem sprožil cenovno vojno UI modelov.

Dejstvo, da je bil DeepSeek-V2 odprtokoden in izjemno poceni, le 1 juan (0,14 USD) za 1 milijon žetonov – ali enot podatkov, obdelanih z modelom – je privedlo do tega, da je Alibabina oblačna enota napovedala znižanje cen do 97 % na paleto modelov.

Druga kitajska tehnološka podjetja so sledila zgledu, vključno z Baidujem, ki je marca 2023 izdal prvi kitajski ekvivalent ChatGPT in največjim internetnim podjetjem v državi Tencent.

Liang Wenfeng, enigmatični ustanovitelj DeepSeeka, je julija v redkem intervjuju za kitajski medij Waves dejal, da podjetju “ni mar” za cenovne vojne in da je doseganje AGI (splošne umetne inteligence) njihov glavni cilj.

OpenAI definira AGI kot avtonomne sisteme, ki prekašajo ljudi pri večini ekonomsko vrednih nalog.

Medtem ko imajo velika kitajska tehnološka podjetja, kot je Alibaba, več sto tisoč zaposlenih, DeepSeek deluje kot raziskovalni laboratorij, v katerem delajo predvsem mladi diplomanti in doktorski študenti z najboljših kitajskih univerz.

Liang je v svojem julijskem intervjuju dejal, da verjame, da največja kitajska tehnološka podjetja morda niso primerna za prihodnost industrije umetne inteligence, pri čemer je njihove visoke stroške in strukture od zgoraj navzdol primerjal z vitkim delovanjem DeepSeeka in agilnim slogom upravljanja.

“Veliki temeljni modeli zahtevajo stalne inovacije, zmogljivosti tehnoloških velikanov imajo svoje meje,” je dejal.


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku
Vas zanima več iz te teme?
Alibaba umetna inteligenca


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Zlati partner

NEWSROOM SLOVENIJA & ECETERA d.o.o.

Motnica 7a, 1236 Trzin, Tel: 01 600 10 10
Ecetera se je rodila leta 2001. Najprej se je morala spopasti s svojimi prvimi koraki na trgu in se boriti za obstoj v krutem svetu. Iz podjetja je napredovala v podjetje, ki se je ... Več

M-SISTEM d.o.o.

Pot na Drenikov vrh 12, 1000 Ljubljana, Tel: 041 693 934
Nov IT sistem, bodisi strojni ali programski, je lahko velika naložba. Da bi jo karseda najbolje izkoristili, je pomembno, da izberete pravega IT dobavitelja in ponudnika programskih ... Več
Zlati partner

UL FRI

Večna pot 113, 1000 Ljubljana, Tel: 01 479 81 03
Spoznali smo že, da so računalniki neverjetni stroji, za katere se zdi, da ni meja, da so sposobni narediti vse, kar si človek zamisli in tudi tisto, kar si danes večina ljudi še ... Več

PRANA 3STIL d.o.o.

Opekarniška cesta 15a, 3000 Celje, Tel: 051 807 390
Podjetje Prana 3stil je specializirano za računalniške stortve, kot so razvoj Windows/Linux programske opreme, prodaja, servis in podobno. Več