Programska oprema
30.01.2025 14:15
Posodobljeno 9 mesecev nazaj.

Deli z drugimi:

Share

Alibaba trdi, da je njihov najnovejši model umetne inteligence boljši od DeepSeek-V3

Kitajsko tehnološko podjetje Alibaba je v sredo, 29. januarja, predstavilo novo verzijo modela Qwen 2.5, za katerega pravijo, da naj bi bil bolšji od trenutno najbolj vročega modela DeepSeek-V3.

Nenavaden termin izdaje modela Qwen 2.5-Max, na prvi dan kitajskega novega leta, ko večina Kitajcev ne dela in čas preživlja s svojimi družinami, dokazuje enormen pritisk, ki ga je DeepSeek povzročil ne samo pri tujih konkurentih, temveč tudi pri domačih.

Qwen 2.5-Max prekaša … po skoraj vseh parametrih GPT-4o, DeepSeek-V3 in LIama-3.1-405B“, so na svojem WeChat računu zapisali pri Alibabinimi oblačni enoti. S tem, ko so prst jasno pokazali na OpenAI-jev in Metin najnaprednejši model, so poželi veliko zanimanja.

Izid UI asistenta DeepSeek 10. januarja, ki ga poganja model DeepSeek-V3 in potem še izid modela R1 20. januarja, je dobesedno šokiral ZDA in povzročil tektonske premike na delniških trgih. Kitajski startup je pokazal, kako lahko z nizkimi stroški razvoja in uporabe konkurira ameriškim modelom in tako pri investitorjih dvignil stopnjo zaskrbljenosti glede velikih vložkov, ki jih načrtujejo ameriška podjetja.

Toda uspeh DeepSeeka je privedel tudi do prerivanja med domačimi konkurenti.

Dva dni po izdaji DeepSeek-R1 je lastnik TikToka ByteDance izdal posodobitev svojega vodilnega UI modela, za katerega je trdil, da je v AIME primerjalnem testu, ki meri, kako dobro UI modeli razumejo in se odzivajo na zapletena navodila, presegel OpenAI o1, ki ga podpira Microsoft.

To je dodatno opolnomočilo trditev DeepSeeka, da njihov model R1 lahko tekmuje z o1.

DeepSeek proti domačim konkurentom

Predhodnik modela DeepSeek V3, DeepSeek-V2, je lani maja na Kitajskem sprožil cenovno vojno UI modelov.

Dejstvo, da je bil DeepSeek-V2 odprtokoden in izjemno poceni, le 1 juan (0,14 USD) za 1 milijon žetonov – ali enot podatkov, obdelanih z modelom – je privedlo do tega, da je Alibabina oblačna enota napovedala znižanje cen do 97 % na paleto modelov.

Druga kitajska tehnološka podjetja so sledila zgledu, vključno z Baidujem, ki je marca 2023 izdal prvi kitajski ekvivalent ChatGPT in največjim internetnim podjetjem v državi Tencent.

Liang Wenfeng, enigmatični ustanovitelj DeepSeeka, je julija v redkem intervjuju za kitajski medij Waves dejal, da podjetju “ni mar” za cenovne vojne in da je doseganje AGI (splošne umetne inteligence) njihov glavni cilj.

OpenAI definira AGI kot avtonomne sisteme, ki prekašajo ljudi pri večini ekonomsko vrednih nalog.

Medtem ko imajo velika kitajska tehnološka podjetja, kot je Alibaba, več sto tisoč zaposlenih, DeepSeek deluje kot raziskovalni laboratorij, v katerem delajo predvsem mladi diplomanti in doktorski študenti z najboljših kitajskih univerz.

Liang je v svojem julijskem intervjuju dejal, da verjame, da največja kitajska tehnološka podjetja morda niso primerna za prihodnost industrije umetne inteligence, pri čemer je njihove visoke stroške in strukture od zgoraj navzdol primerjal z vitkim delovanjem DeepSeeka in agilnim slogom upravljanja.

“Veliki temeljni modeli zahtevajo stalne inovacije, zmogljivosti tehnoloških velikanov imajo svoje meje,” je dejal.


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku
Vas zanima več iz te teme?
Alibaba umetna inteligenca


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

noviSplet, ATRIBUT d.o.o.

Verovškova ulica 55, 1000 Ljubljana, Tel: 01 565 32 61
Agencija za spletne storitve noviSplet Spletna agencija noviSplet deluje od leta 2004. Izdelala je že več kot 1000 spletnih mest. Na področju izdelave spletnih strani spada med ... Več

NJORKA d.o.o.

Tovarniška cesta 4c, 5270 Ajdovščina, Tel: 05 901 21 22
Podjetja se srečujejo z vse več podatki, za njihovo učinkovito obravnavo pa potrebujejo številne programe in aplikacije, kar sčasoma vodi v administracijsko zmešnjavo in posledično ... Več

RETTRO d.o.o., vaš partner v razvoju IT-rešitev

Šlandrova 4b, 1000 Ljubljana, Tel: 031 313 312
Mikro podjetje Rettro d.o.o. je specializirano za razvoj različnih informacijskih sistemov z najnovejšimi tehnologijami po meri naročnika. Znanje in izkušnje Rettrovih strokovnjakov ... Več
Zlati partner

INFO-KOD d.o.o.

Cesta v Gorice 34a, 1000 Ljubljana, Tel: 01 256 24 99
Skupina INFO-KOD že dvajset let ponuja rešitve na področju avtomatske identifikacije, ki je podlaga za računalniško izmenjavo podatkov. INFO-KOD d.o.o. je eden izmed glavnih distributerjev ... Več