Programska oprema
30.01.2025 14:15
Posodobljeno 1 leto nazaj.

Deli z drugimi:

Share

Alibaba trdi, da je njihov najnovejši model umetne inteligence boljši od DeepSeek-V3

Kitajsko tehnološko podjetje Alibaba je v sredo, 29. januarja, predstavilo novo verzijo modela Qwen 2.5, za katerega pravijo, da naj bi bil bolšji od trenutno najbolj vročega modela DeepSeek-V3.

Nenavaden termin izdaje modela Qwen 2.5-Max, na prvi dan kitajskega novega leta, ko večina Kitajcev ne dela in čas preživlja s svojimi družinami, dokazuje enormen pritisk, ki ga je DeepSeek povzročil ne samo pri tujih konkurentih, temveč tudi pri domačih.

Qwen 2.5-Max prekaša … po skoraj vseh parametrih GPT-4o, DeepSeek-V3 in LIama-3.1-405B“, so na svojem WeChat računu zapisali pri Alibabinimi oblačni enoti. S tem, ko so prst jasno pokazali na OpenAI-jev in Metin najnaprednejši model, so poželi veliko zanimanja.

Izid UI asistenta DeepSeek 10. januarja, ki ga poganja model DeepSeek-V3 in potem še izid modela R1 20. januarja, je dobesedno šokiral ZDA in povzročil tektonske premike na delniških trgih. Kitajski startup je pokazal, kako lahko z nizkimi stroški razvoja in uporabe konkurira ameriškim modelom in tako pri investitorjih dvignil stopnjo zaskrbljenosti glede velikih vložkov, ki jih načrtujejo ameriška podjetja.

Toda uspeh DeepSeeka je privedel tudi do prerivanja med domačimi konkurenti.

Dva dni po izdaji DeepSeek-R1 je lastnik TikToka ByteDance izdal posodobitev svojega vodilnega UI modela, za katerega je trdil, da je v AIME primerjalnem testu, ki meri, kako dobro UI modeli razumejo in se odzivajo na zapletena navodila, presegel OpenAI o1, ki ga podpira Microsoft.

To je dodatno opolnomočilo trditev DeepSeeka, da njihov model R1 lahko tekmuje z o1.

DeepSeek proti domačim konkurentom

Predhodnik modela DeepSeek V3, DeepSeek-V2, je lani maja na Kitajskem sprožil cenovno vojno UI modelov.

Dejstvo, da je bil DeepSeek-V2 odprtokoden in izjemno poceni, le 1 juan (0,14 USD) za 1 milijon žetonov – ali enot podatkov, obdelanih z modelom – je privedlo do tega, da je Alibabina oblačna enota napovedala znižanje cen do 97 % na paleto modelov.

Druga kitajska tehnološka podjetja so sledila zgledu, vključno z Baidujem, ki je marca 2023 izdal prvi kitajski ekvivalent ChatGPT in največjim internetnim podjetjem v državi Tencent.

Liang Wenfeng, enigmatični ustanovitelj DeepSeeka, je julija v redkem intervjuju za kitajski medij Waves dejal, da podjetju “ni mar” za cenovne vojne in da je doseganje AGI (splošne umetne inteligence) njihov glavni cilj.

OpenAI definira AGI kot avtonomne sisteme, ki prekašajo ljudi pri večini ekonomsko vrednih nalog.

Medtem ko imajo velika kitajska tehnološka podjetja, kot je Alibaba, več sto tisoč zaposlenih, DeepSeek deluje kot raziskovalni laboratorij, v katerem delajo predvsem mladi diplomanti in doktorski študenti z najboljših kitajskih univerz.

Liang je v svojem julijskem intervjuju dejal, da verjame, da največja kitajska tehnološka podjetja morda niso primerna za prihodnost industrije umetne inteligence, pri čemer je njihove visoke stroške in strukture od zgoraj navzdol primerjal z vitkim delovanjem DeepSeeka in agilnim slogom upravljanja.

“Veliki temeljni modeli zahtevajo stalne inovacije, zmogljivosti tehnoloških velikanov imajo svoje meje,” je dejal.


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku
Vas zanima več iz te teme?
Alibaba umetna inteligenca


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Zlati partner

AGENCIJA ODMEV

Gregorčičeva ulica 3, 1000 Ljubljana,
Zlati partner

SAMSUNG GmbH, podružnica v Ljubljani

Letališka cesta 29a, 1000 Ljubljana, Tel: +386 80 697 267
Samsung Electronics Co. je vodilni tehnološki gigant, ki navdihuje svet ter oblikuje prihodnost s prodornimi zamislimi in tehnologijami. Njihova poslovna filozofija, ki temelji na ... Več
Zlati partner

GROWTHCOM d.o.o.

PE Ljubljana, Šmartinska cesta 152, 1000 Ljubljana, Tel: 051 313 192
Growthcom - vaš specialist za digitalni marketing Svoje 10-letne izkušnje s področja prodaje in digitalnega marketinga je z nami delil direktor podjetja, David Fabjan. V Growthcomu ... Več
Zlati partner

Računalniški muzej

Celovška cesta 111, 1000 Ljubljana,
Že od leta 2004 si jemljemo za svoje osnovno poslanstvo opominjanje na informacijsko dediščino. Kot kulturna ustanova s sedežem v Ljubljani, se posvečamo zbiranju, ohranjanju ... Več