Poslovna rješenja
Računalstvo, telefonija
Trikovi i savjeti
Životni stil
10.02.2025 14:00

Podijelite s drugima:

Udio

DeepSeek: Zašto cijeli svijet ludi? Što se događa u pozadini?

Znali smo da će se to dogoditi, ali dogodilo se puno prije nego što smo očekivali. Čak su i u SAD-u mislili da imaju barem godinu ili dvije pred sobom prije nego što ih Kina sustigne na polju umjetne inteligencije.
DeepSeek: Zašto cijeli svijet ludi? Što se događa u pozadini?

DeepSeek je ime koje je utjeralo strah u kosti najvećim američkim kompanijama. Nije samo OpenAI pokrenuo ludnicu generativne umjetne inteligencije (AI), već su se uplašili i Google, Microsoft, Anthropic, Meta, Amazon i svi ostali koji su pogrešno mislili da će barem još neko vrijeme dominirati i privući milijarde investicija.

Kada je kineska tvrtka DeepSeek prošli mjesec predstavila svoj model umjetne inteligencije, uzdrmala je američke temelje porukom da je njihov model ekvivalentan, ili na neki način čak i bolji od američkih, i to za djelić cijene. Model DeepSeek-V3 navodno zahtijeva samo 6 milijuna dolara računalne snage za treniranje, što ne uključuje "prethodna istraživanja i eksperimente ablacije na arhitekturama, algoritmima ili podacima".

DeepSeek je odmah po izlasku pretekao ChatGPT po ocjenama u Apple mobilnoj trgovini, a broj preuzimanja također je u stalnom porastu.

Posljedice su bile ogromne. U SAD-u se pitaju jesu li enormna ulaganja u umjetnu inteligenciju doista bila potrebna ako su njihovi kineski kolege uz mizerna ulaganja mogli postići isti rezultat. Dionice kompanija, uključujući i Nvidiju, pale su, a ponovno se postavilo pitanje je li ovo trenutak kada će AI balon puknuti.

S druge strane, mnogi se pitaju je li DeepSeek zaista tako revolucionaran kao što tvrtka kaže. Skrivaju li nešto? Što su koristili za obuku svog modela?

Što je DeepSeek?

DeepSeek je naziv startupa, širokog jezičnog modela i chatbota koji radi na sličan način kao ChatGPT, Gemini i Copilot. Izgled, način korištenja, a također i način komunikacije gotovo su identični američkim rješenjima, pa je prijelaz korisnicima bio vrlo jednostavan, a korištenje već poznato.

Koliko je moćan i je li stvarno bolji od ChatGPT-a i ostalih? Tvrtka kaže da je moćan poput OpenAI-jevog modela o1, koji je objavljen krajem prošle godine, u zadacima poput matematike i kodiranja. OpenAI je nedavno predstavio novi model, o3, koji je navodno moćniji od svih modela u testovima, ali još nije dostupan javnosti za testiranje.

Najnoviji model R1 (DeepSeek) model je jezika za rasuđivanje. Isto kao i OpenAI-jev o1 model. Ovi modeli postupno generiraju odgovore i simuliraju način na koji ljudi razmišljaju o problemima ili idejama.

DeepSeek umjetna inteligencija ChatGPT-1

Najveći šok bila je činjenica da je samo 6 milijuna dolara potrošeno na obuku V3 modela koji pokreće chatbot. Za usporedbu, OpenAI je potrošio više od 100 milijuna dolara na razvoj modela GPT-4, a Meta je potrošila oko 60 milijuna dolara na Llamu. Uspjeli su to učiniti unatoč trgovinskim ograničenjima koja su značila da Kina već neko vrijeme nije službeno imala pristup najnovijim čipovima.

Osnivač DeepSeeka navodno je skladištio Nvidia A100 čipove, čiji je izvoz u Kinu zabranjen od rujna 2022. Neki stručnjaci vjeruju da je kombinirao te čipove s jeftinijim, manje sofisticiranim, što je rezultiralo mnogo učinkovitijim procesom. DeepSeek također koristi manje memorije od svojih konkurenata, što u konačnici smanjuje troškove izvršavanja zadataka za korisnike.

Postoje i glasine da tvrtka zapravo koristi najnovije Nvidia H100 čipove, ali nema konkretnih dokaza, a tvrtka još nije komentirala "optužbe".

Novo neovisno istraživanje tvrtke SemiAnalysis kaže da su potrošili oko 500 milijuna dolara na hardver. Njihov munjevit tempo razvoja ekvivalentnih AI modela također je pod lupom OpenAI-ja, koji sumnja da je kineska tvrtka "destilirala njihove modele".

Ubrzo nakon pokretanja i preuzimanja vodstva u popularnosti u Apple Storeu, DeepSeek je počeo doživljavati prekide. Chatbot je dugo bio nedostupan, a tvrtke i programeri nisu imali pristup njegovom API-ju. Tvrtka je objavila da je bila meta zlonamjernih napada koji su usporili rad i privremeno ograničili registraciju.

Tko predvodi kinesku AI revoluciju?

DeepSeek se nije pojavio preko noći, ali sve do prošlog mjeseca nije privlačio veliku pozornost medija, iako se znalo da razvija AI modele. Startup je u većinskom vlasništvu Liang Wenfenga, koji je ujedno i suosnivač investicijskog fonda High-Flyer. Potonji je u ožujku 2023. objavio da započinje novi projekt i uspostavlja "novu i neovisnu istraživačku grupu za istraživanje suštine opće umjetne inteligencije". Nekoliko mjeseci kasnije kupili smo tvrtku DeepSeek. Mlade i iskusne talente privukli su prvenstveno obećanjem visokih plaća i mogućnošću rada na jedinstvenim istraživačkim projektima.

Nejasno je koliko je High-Flyer uložio u DeepSeek. High-Flyer ima ured u istoj zgradi kao i DeepSeek, a prema podacima iz kineskih registara tvrtki također ima patente koji se odnose na čipove koji se koriste za treniranje modela umjetne inteligencije.

Kako dalje?

DeepSeek je u istraživanju opisao kako trenira svoje modele. Budući da službena tvrtka nema pristup istim čipovima kao njeni američki konkurenti, morala je pronaći drugi način.

Vodeći sustavi umjetne inteligencije uče svoje vještine pronalaženjem uzoraka u velikim količinama podataka, uključujući tekst, slike i zvukove. DeepSeek je opisao način distribucije ove analize podataka na višestruke specijalizirane AI modele uz minimaliziranje gubitka vremena u prijenosu podataka s jednog mjesta na drugo.

Slične metode već su koristili i drugi, ali premještanje podataka između modela obično je smanjilo učinkovitost. DeepSeek je to učinio na način koji mu je omogućio korištenje manje računalne snage.

Cijena i metoda obuke nisu jedine razlike u usporedbi s drugim AI modelima. DeepSeek je također otvorenog koda, što znači da ga može preuzeti, koristiti i nadograditi gotovo svatko.

Nasuprot tome, modeli iz Mete i Googlea, iako su dostupni svima za pregled, ne smatraju se istinski otvorenim kodom, jer je način na koji korisnici koriste modele ograničen licencama, a skupovi podataka za obuku nisu javno dostupni, a također su predmet brojnih tužbi. Na primjer, Facebook ili Meta vodi pravnu bitku s autorima koji optužuju tvrtku za korištenje piratskih kopija njihovih knjiga u nastavne svrhe. New York Times tuži Microsoft i OpenAI zbog navodnog korištenja njihovog sadržaja za učenje bez dopuštenja.

Jedan od razloga zašto američki UI modeli nisu otvorenog koda je veća mogućnost širenja lažnih informacija, govora mržnje i slično, no glavni je svakako profit i više mogućnosti monetizacije UI modela.

Kineski open-source modeli, prema mišljenju stručnjaka, mogu demokratizirati umjetnu inteligenciju, što bi moglo uvelike narušiti strategiju američkih tvrtki. Strah je da će američke tvrtke i znanstvenici također početi koristiti DeepSeek za razvoj i izgradnju vlastitih rješenja.

U Kini su najnoviji model već koristile telekomunikacijske tvrtke, a Geely je prvi među automobilskim kompanijama koji je model DeepSeek integrirao u pametne sustave svojih automobila.

U međuvremenu, drugdje u svijetu već razmišljaju o mogućoj blokadi. Italija, Irska, Belgija, Nizozemska i Francuska su zemlje koje su već pokrenule istragu o tome na koji način DeepSeek koristi i pohranjuje podatke te krši li možda europsku regulativu o podacima. DeepSeek je preventivno blokiran u Italiji, a korištenje je zabranjeno i u Južnoj Koreji i Australiji.

DeepSeek kaže da su poduzeli sve sigurnosne mjere kako bi zaštitili podatke koje pohranjuju u Kini. Ali nije trebalo dugo prije nego što su stručnjaci otkrili da je tvrtka slučajno ostavila milijune redaka podataka nezaštićenima, uključujući softverske ključeve, zapise, chatove i još mnogo toga.

Cisco je analizirao najnovijeg AI aktera i otkrio da "DeepSeek R1 nema robusne zaštite, što ga čini vrlo osjetljivim na algoritamski proboj i potencijalnu zlouporabu."

Otvorena je nova fronta

Do siječnja 2025. Sjedinjene Države bile su jedini konj u utrci, a američki jahači nisu se morali ugledati ni na koga u unutrašnjosti. Sada im Kina diše za vratom. Između SAD-a i Kine već je neko vrijeme otvorena trgovinska i tehnološka fronta, a DeepSeek je otvorio novu frontu na kojoj će se odlučivati o sudbini umjetne inteligencije.


Zanima vas više o ovoj temi?
ChatGPT Ko-pilot DeepSeek umjetna inteligencija


Što drugi čitaju?