Računalništvo, telefonija
Življenjski slog
Poslovne rešitve
Triki in nasveti
10.02.2025 14:00

Deli z drugimi:

Share

DeepSeek: Zakaj ves svet nori? Kaj se dogaja v ozadju?

Vedeli smo, da se bo zgodilo, ampak zgodilo se je veliko prej, kot smo pričakovali. Tudi v ZDA so mislili, da imajo vsaj še kakšno leto ali dve prednosti, preden jih bo Kitajska dohitela na področju umetne inteligence.

DeepSeek je ime, ki je pognalo strah v kosti največjih ameriških podjetij. Ne samo OpenAI, ki je začel mrzlico generativne umetne inteligence (UI), prestrašili so se tudi Google, Microsoft, Anthropic, Meta, Amazon in vsi ostali, ki so v zmoti mislili, da bodo še vsaj nekaj časa dominirali in privabili milijardne vložke.

Ko je kitajsko podjetje DeepSeek prejšnji mesec predstavilo svoj model umetne inteligence, je zamajalo ameriške temelje s sporočilom, da je njihov model enakovreden ali v nekaterih pogledih celo boljši od ameriških, in to za le delček cene. Model DeepSeek-V3 naj bi za učenje potreboval le za 6 milijonov dolarjev računske moči, kar pa ne vključuje »predhodnih raziskav in poskusov ablacije na arhitekturah, algoritmih ali podatkih«.

Takoj po izidu je DeepSeek po ocenjenosti v Applovi mobilni trgovini prehitel ChatGPT, število prenosov pa tudi vztrajno raste.

Posledice so bile ogromne. V ZDA se sprašujejo, ali so bili enormni vložki v UI res potrebni, če so kitajski kolegi lahko do enakega rezultata prišli z mizernimi vložki. Delnice podjetij, vključno z Nvidio, so padle in spet se je pojavilo vprašanje, ali je to trenutek, ko bo počil UI balon.

Po drugi strani pa se mnogi sprašujejo, ali je DeepSeek res tako revolucionaren, kot pravi podjetje. Ali kaj skrivajo? Kaj so uporabili za učenje svojega modela?

Kaj je DeepSeek?

DeepSeek je ime zagonskega podjetja, velikega jezikovnega modela in klepetalnega robota, ki deluje na podoben način kot ChatGPT, Gemini in Copilot. Videz, način uporabe in tudi način komunikacije je skoraj identičen ameriškim rešitvam, zato je bil prehod za uporabnike zelo enostaven, uporaba pa že domača.

Kako zmogljiv je in ali je res boljši od ChatGPT-ja in ostalih? Podjetje pravi, da je pri nalogah, kot sta matematika in kodiranje, enako zmogljiv kot model o1 podjetja OpenAI, ki je bil objavljen konec lanskega leta. OpenAI je pred kratkim predstavil nov model o3, ki naj bi bil na testih zmogljivejši od vseh modelov, ampak javnosti še ni na voljo za testiranje.

Najnovejši model R1 (DeepSeek) je jezikovni model, ki razmišlja (angl. reasoning model). Enako kot model o1 podjetja OpenAI. Ti modeli ustvarjajo odgovore postopoma in simulirajo način, kako ljudje razmišljajo o problemih ali idejah.

DeepSeek umetna inteligenca ChatGPT-1

Največji šok je prizadejalo dejstvo, da so za usposabljanje modela V3, ki poganja klepetalnega robota, porabili le 6 milijonov dolarjev. Za primerjavo, OpenAI je za razvoj modela GPT-4 porabil več kot 100 milijonov dolarjev, Meta pa za Llamo okoli 60 milijonov dolarjev. To jim je uspelo kljub trgovskim omejitvam, zaradi katerih Kitajska že nekaj časa uradno nima dostopa do najnovejših čipov.

Ustanovitelj podjetja DeepSeek naj bi zbral zalogo čipov Nvidia A100, katerih izvoz na Kitajsko je od septembra 2022 prepovedan. Nekateri strokovnjaki menijo, da je te čipe združil s cenejšimi, manj izpopolnjenimi, s čimer je dobil veliko učinkovitejši postopek. DeepSeek uporablja tudi manj pomnilnika kot njegovi tekmeci, kar na koncu zmanjša stroške izvajanja nalog za uporabnike.

Pojavljajo se tudi govorice, da podjetje v resnici uporablja najnovejše čipe Nvidia H100, vendar konkretnih dokazov ni, podjetje pa »obtožb« še ni komentiralo.

Nova neodvisna raziskava podjetja SemiAnalysis pravi, da so za strojno opremo porabili približno 500 milijonov dolarjev. Njihova bliskovita hitrost razvoja enakovrednih UI modelov je tudi pod drobnogledom podjetja OpenAI, ki sumi, da je kitajsko podjetje »destiliralo njihove modele«.

Kmalu po lansiranju in prevzemu vodstva po priljubljenosti v Applovi trgovini je DeepSeek začel beležiti izpade. Klepetalni robot je bil dalj časa nedosegljiv, podjetja in razvijalci pa niso imeli dostopa do njihovega API-ja. Podjetje je sporočilo, da je bilo tarča zlonamernih napadov, zaradi katerih je bilo delovanje upočasnjeno, registracija pa začasno omejena.

Kdo vodi kitajsko UI revolucijo?

DeepSeek se ni pojavil kar čez noč, a do prejšnjega meseca ni pritegnil veliko medijske pozornosti, čeprav se je vedelo, da razvija UI modele. Zagonsko podjetje z večinskim deležem vodi Liang Wenfeng, ki je hkrati soustanovitelj naložbenega sklada High-Flyer. Slednji je marca 2023 objavil, da začenja z novim projektom in ustanavlja »novo in neodvisno raziskovalno skupino za raziskovanje bistva splošne umetne inteligence«. Nekaj mesecev kasneje smo dobili podjetje DeepSeek. Mlade in izkušene talente so privabili predvsem z obljubo o visokih plačah in priložnostjo za delo na edinstvenih raziskovalnih projektih.

Ni jasno, koliko je High-Flyer vložil v DeepSeek. High-Flyer ima pisarno v isti stavbi kot DeepSeek, po podatkih iz kitajskih registrov podjetij pa ima tudi patente, povezane s čipi, ki se uporabljajo za usposabljanje modelov umetne inteligence.

Kako naprej?

DeepSeek je v raziskavi opisal, kako uri svoje modele. Ker uradno podjetje nima dostopa do enakih čipov kot ameriška konkurenca, je moralo najti drug način.

Vodilni sistemi umetne inteligence se učijo svojih spretnosti tako, da v velikih količinah podatkov, vključno z besedilom, slikami in zvoki, najdejo vzorce. DeepSeek je opisal način, kako to analizo podatkov porazdeliti med več specializiranih modelov umetne inteligence in pri tem čim bolj zmanjšati izgubo časa zaradi prenašanja podatkov z enega mesta na drugo.

Podobne metode so pred tem uporabljali tudi drugi, vendar je premikanje podatkov med modeli običajno zmanjšalo učinkovitost. DeepSeek je to storil na način, ki mu je omogočil uporabo manjše računalniške moči.

Stroški in način usposabljanja nista edini razliki v primerjavi z ostalimi UI modeli. DeepSeek je tudi odprtokoden, kar pomeni, da ga lahko prenese, uporablja in nadgrajuje praktično vsak.

Nasprotno pa modeli podjetij Meta in Google, čeprav so za ogled na voljo vsakomur, ne veljajo za resnično odprtokodne, saj je način, kako uporabniki uporabljajo modele, omejen z licencami, nabori učnih podatkov pa niso javno objavljeni in so tudi vzrok številnih tožb. Facebook oziroma Meta je na primer v sodni bitki z avtorji, ki podjetje obtožujejo, da je za učenje uporabilo piratske kopije njihovih knjig. New York Times pa toži Microsoft in OpenAI, ker naj bi brez dovoljenja za učenje uporabljali njihovo vsebino.

Eden od razlogov, zakaj ameriški UI modeli niso odprtokodni, je večja možnost za širjenje lažnih informacij, sovražnega govora in podobno, glavni pa zagotovo zaslužek in več možnosti za monetizacijo UI modelov.

Kitajski odprtokodni modeli lahko po mnenju strokovnjakov demokratizirajo umetno inteligenco, kar bi lahko močno spodkopalo strategijo ameriških podjetij. Strah je, da bi tudi ameriška podjetja in znanstveniki začeli uporabljati DeepSeek za razvoj in gradnjo lastnih rešitev.

Na Kitajskem so najnovejši model že začela uporabljati telekomunikacijska podjetja, Geely pa je prvi med avtomobilističnimi podjetji, ki je model DeepSeek integriral v pametne sisteme svojih avtomobilov.

Medtem drugod po svetu že razmišljajo o morebitni blokadi. Italija, Irska, Belgija, Nizozemska in Francija so države, ki so že sprožile raziskavo, kako DeepSeek uporablja in hrani podatke in ali morebiti krši evropske podatkovne uredbe. V Italiji je DeepSeek preventivno blokiran, uporaba je nedovoljena tudi v Južni Koreji in Avstraliji.

Pri DeepSeeku pravi, da so sprejeli vse varnostne ukrepe za zaščito podatkov, ki jih hranijo na Kitajskem. Ni pa trajalo dolgo, preden so strokovnjaki odkrili, da je podjetje pomotoma pustilo nezavarovanih več milijonov vrstic podatkov, vključno s programskimi ključi, dnevniki, klepeti in še več.

Podjetje Cisco je analiziralo najnovejšega UI akterja in odkrilo, da »DeepSeek R1 nima zanesljivih varoval, zato je zelo dovzeten za algoritmični preboj in morebitno zlorabo«.

Odprla se je nova fronta

Do januarja 2025 so bile ZDA edini konj v dirki, ameriškim jezdecem pa ni bilo potrebno nikomur gledati v zaledje. Zdaj jim za vratom diha Kitajska. Že nekaj časa je odprta trgovska in tehnološka fronta med ZDA in Kitajsko, DeepSeek pa je odprl novo fronto, kjer se bo odločala usoda o umetni inteligenci.


Prijavi napako v članku
Vas zanima več iz te teme?
umetna inteligenca ChatGPT Copilot DeepSeek


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Zlati partner

MICROSOFT d.o.o.

Ameriška ulica 8, 1000 Ljubljana, Tel: 01 584 61 11
Slovenska podružnica Microsofta je bila ustanovljena leta 1994 z željo, da bi tudi slovenskemu trgu ponudili inovativno programsko opremo. Od začetkov, ko so bili v podjetju zaposleni ... Več
Zlati partner

Mastercard Europe SA, Podružnica v Sloveniji

Dimičeva ulica 13, 1000 Ljubljana, Tel: +386 1 589 81 26
Mastercard Europe SA, Podružnica v Sloveniji, je globalno tehnološko podjetje za plačilne rešitve. Družba je del mreže Mastercard, ki obsega več kot 210 držav in ozemelj po ... Več
Zlati partner

MIKROCOP d.o.o.

Ulica Ambrožiča Novljana 7, 1000 Ljubljana, Tel: 01 587 42 80
Mikrocop je vodilni ponudnik celovitih IT rešitev in storitev za digitalno poslovanje. S povečevanjem učinkovitosti in zagotavljanjem zakonske skladnosti podpira podjetja na ... Več
Zlati partner

RITTAL d.o.o.

Letališka cesta 16, 1000 Ljubljana, Tel: 01 546 63 70
Rittal spodbuja inovacije in živi svoje vrednote To je Rittal. Globalni igralec, vodilni inovator, družinsko podjetje in zgleden delodajalec. Rittal zgodba Prihodnost Rittala se je ... Več