Domov Računalništvo, telefonija DeepSeek: Zakaj ves svet nori? Kaj se dogaja v ozadju?

Računalništvo, telefonija

Življenjski slog

Poslovne rešitve

Triki in nasveti

10.02.2025 14:00

Deli z drugimi:

DeepSeek: Zakaj ves svet nori? Kaj se dogaja v ozadju?

Vedeli smo, da se bo zgodilo, ampak zgodilo se je veliko prej, kot smo pričakovali. Tudi v ZDA so mislili, da imajo vsaj še kakšno leto ali dve prednosti, preden jih bo Kitajska dohitela na področju umetne inteligence.

DeepSeek je ime, ki je pognalo strah v kosti največjih ameriških podjetij. Ne samo OpenAI, ki je začel mrzlico generativne umetne inteligence (UI), prestrašili so se tudi Google, Microsoft, Anthropic, Meta, Amazon in vsi ostali, ki so v zmoti mislili, da bodo še vsaj nekaj časa dominirali in privabili milijardne vložke.

Ko je kitajsko podjetje DeepSeek prejšnji mesec predstavilo svoj model umetne inteligence, je zamajalo ameriške temelje s sporočilom, da je njihov model enakovreden ali v nekaterih pogledih celo boljši od ameriških, in to za le delček cene. Model DeepSeek-V3 naj bi za učenje potreboval le za 6 milijonov dolarjev računske moči, kar pa ne vključuje »predhodnih raziskav in poskusov ablacije na arhitekturah, algoritmih ali podatkih«.

Takoj po izidu je DeepSeek po ocenjenosti v Applovi mobilni trgovini prehitel ChatGPT, število prenosov pa tudi vztrajno raste.

Posledice so bile ogromne. V ZDA se sprašujejo, ali so bili enormni vložki v UI res potrebni, če so kitajski kolegi lahko do enakega rezultata prišli z mizernimi vložki. Delnice podjetij, vključno z Nvidio, so padle in spet se je pojavilo vprašanje, ali je to trenutek, ko bo počil UI balon.

Po drugi strani pa se mnogi sprašujejo, ali je DeepSeek res tako revolucionaren, kot pravi podjetje. Ali kaj skrivajo? Kaj so uporabili za učenje svojega modela?

Kaj je DeepSeek?

DeepSeek je ime zagonskega podjetja, velikega jezikovnega modela in klepetalnega robota, ki deluje na podoben način kot ChatGPT, Gemini in Copilot. Videz, način uporabe in tudi način komunikacije je skoraj identičen ameriškim rešitvam, zato je bil prehod za uporabnike zelo enostaven, uporaba pa že domača.

Kako zmogljiv je in ali je res boljši od ChatGPT-ja in ostalih? Podjetje pravi, da je pri nalogah, kot sta matematika in kodiranje, enako zmogljiv kot model o1 podjetja OpenAI, ki je bil objavljen konec lanskega leta. OpenAI je pred kratkim predstavil nov model o3, ki naj bi bil na testih zmogljivejši od vseh modelov, ampak javnosti še ni na voljo za testiranje.

Najnovejši model R1 (DeepSeek) je jezikovni model, ki razmišlja (angl. reasoning model). Enako kot model o1 podjetja OpenAI. Ti modeli ustvarjajo odgovore postopoma in simulirajo način, kako ljudje razmišljajo o problemih ali idejah.

Največji šok je prizadejalo dejstvo, da so za usposabljanje modela V3, ki poganja klepetalnega robota, porabili le 6 milijonov dolarjev. Za primerjavo, OpenAI je za razvoj modela GPT-4 porabil več kot 100 milijonov dolarjev, Meta pa za Llamo okoli 60 milijonov dolarjev. To jim je uspelo kljub trgovskim omejitvam, zaradi katerih Kitajska že nekaj časa uradno nima dostopa do najnovejših čipov.

Ustanovitelj podjetja DeepSeek naj bi zbral zalogo čipov Nvidia A100, katerih izvoz na Kitajsko je od septembra 2022 prepovedan. Nekateri strokovnjaki menijo, da je te čipe združil s cenejšimi, manj izpopolnjenimi, s čimer je dobil veliko učinkovitejši postopek. DeepSeek uporablja tudi manj pomnilnika kot njegovi tekmeci, kar na koncu zmanjša stroške izvajanja nalog za uporabnike.

Pojavljajo se tudi govorice, da podjetje v resnici uporablja najnovejše čipe Nvidia H100, vendar konkretnih dokazov ni, podjetje pa »obtožb« še ni komentiralo.

Nova neodvisna raziskava podjetja SemiAnalysis pravi, da so za strojno opremo porabili približno 500 milijonov dolarjev. Njihova bliskovita hitrost razvoja enakovrednih UI modelov je tudi pod drobnogledom podjetja OpenAI, ki sumi, da je kitajsko podjetje »destiliralo njihove modele«.

Kmalu po lansiranju in prevzemu vodstva po priljubljenosti v Applovi trgovini je DeepSeek začel beležiti izpade. Klepetalni robot je bil dalj časa nedosegljiv, podjetja in razvijalci pa niso imeli dostopa do njihovega API-ja. Podjetje je sporočilo, da je bilo tarča zlonamernih napadov, zaradi katerih je bilo delovanje upočasnjeno, registracija pa začasno omejena.

Kdo vodi kitajsko UI revolucijo?

DeepSeek se ni pojavil kar čez noč, a do prejšnjega meseca ni pritegnil veliko medijske pozornosti, čeprav se je vedelo, da razvija UI modele. Zagonsko podjetje z večinskim deležem vodi Liang Wenfeng, ki je hkrati soustanovitelj naložbenega sklada High-Flyer. Slednji je marca 2023 objavil, da začenja z novim projektom in ustanavlja »novo in neodvisno raziskovalno skupino za raziskovanje bistva splošne umetne inteligence«. Nekaj mesecev kasneje smo dobili podjetje DeepSeek. Mlade in izkušene talente so privabili predvsem z obljubo o visokih plačah in priložnostjo za delo na edinstvenih raziskovalnih projektih.

Ni jasno, koliko je High-Flyer vložil v DeepSeek. High-Flyer ima pisarno v isti stavbi kot DeepSeek, po podatkih iz kitajskih registrov podjetij pa ima tudi patente, povezane s čipi, ki se uporabljajo za usposabljanje modelov umetne inteligence.

Kako naprej?

DeepSeek je v raziskavi opisal, kako uri svoje modele. Ker uradno podjetje nima dostopa do enakih čipov kot ameriška konkurenca, je moralo najti drug način.

Vodilni sistemi umetne inteligence se učijo svojih spretnosti tako, da v velikih količinah podatkov, vključno z besedilom, slikami in zvoki, najdejo vzorce. DeepSeek je opisal način, kako to analizo podatkov porazdeliti med več specializiranih modelov umetne inteligence in pri tem čim bolj zmanjšati izgubo časa zaradi prenašanja podatkov z enega mesta na drugo.

Podobne metode so pred tem uporabljali tudi drugi, vendar je premikanje podatkov med modeli običajno zmanjšalo učinkovitost. DeepSeek je to storil na način, ki mu je omogočil uporabo manjše računalniške moči.

Stroški in način usposabljanja nista edini razliki v primerjavi z ostalimi UI modeli. DeepSeek je tudi odprtokoden, kar pomeni, da ga lahko prenese, uporablja in nadgrajuje praktično vsak.

Nasprotno pa modeli podjetij Meta in Google, čeprav so za ogled na voljo vsakomur, ne veljajo za resnično odprtokodne, saj je način, kako uporabniki uporabljajo modele, omejen z licencami, nabori učnih podatkov pa niso javno objavljeni in so tudi vzrok številnih tožb. Facebook oziroma Meta je na primer v sodni bitki z avtorji, ki podjetje obtožujejo, da je za učenje uporabilo piratske kopije njihovih knjig. New York Times pa toži Microsoft in OpenAI, ker naj bi brez dovoljenja za učenje uporabljali njihovo vsebino.

Eden od razlogov, zakaj ameriški UI modeli niso odprtokodni, je večja možnost za širjenje lažnih informacij, sovražnega govora in podobno, glavni pa zagotovo zaslužek in več možnosti za monetizacijo UI modelov.

Kitajski odprtokodni modeli lahko po mnenju strokovnjakov demokratizirajo umetno inteligenco, kar bi lahko močno spodkopalo strategijo ameriških podjetij. Strah je, da bi tudi ameriška podjetja in znanstveniki začeli uporabljati DeepSeek za razvoj in gradnjo lastnih rešitev.

Na Kitajskem so najnovejši model že začela uporabljati telekomunikacijska podjetja, Geely pa je prvi med avtomobilističnimi podjetji, ki je model DeepSeek integriral v pametne sisteme svojih avtomobilov.

Medtem drugod po svetu že razmišljajo o morebitni blokadi. Italija, Irska, Belgija, Nizozemska in Francija so države, ki so že sprožile raziskavo, kako DeepSeek uporablja in hrani podatke in ali morebiti krši evropske podatkovne uredbe. V Italiji je DeepSeek preventivno blokiran, uporaba je nedovoljena tudi v Južni Koreji in Avstraliji.

Pri DeepSeeku pravi, da so sprejeli vse varnostne ukrepe za zaščito podatkov, ki jih hranijo na Kitajskem. Ni pa trajalo dolgo, preden so strokovnjaki odkrili, da je podjetje pomotoma pustilo nezavarovanih več milijonov vrstic podatkov, vključno s programskimi ključi, dnevniki, klepeti in še več.

Podjetje Cisco je analiziralo najnovejšega UI akterja in odkrilo, da »DeepSeek R1 nima zanesljivih varoval, zato je zelo dovzeten za algoritmični preboj in morebitno zlorabo«.

Odprla se je nova fronta

Do januarja 2025 so bile ZDA edini konj v dirki, ameriškim jezdecem pa ni bilo potrebno nikomur gledati v zaledje. Zdaj jim za vratom diha Kitajska. Že nekaj časa je odprta trgovska in tehnološka fronta med ZDA in Kitajsko, DeepSeek pa je odprl novo fronto, kjer se bo odločala usoda o umetni inteligenci.

Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Prijavi napako v članku

Vas zanima več iz te teme?

umetna inteligenca ChatGPT Copilot DeepSeek

Sorodne novice

Lenovo Idea Pad Slim 5 14IMH9 je tukaj

Philips Century The Janet – kdaj si nazadnje raztegnil ...

Huawei Mate 70 Air – boj tankih telefonov se ...

Sparkasse Pay predstavlja edinstveno kartico Diners ...

Izid GTA VI prestavljen na november 2026

Telekom Slovenije in Xiaomi tudi letos z društvom ...

Kaj berejo drugi?

Celovito in estetsko dovršeno upravljanje pametnega doma

Grok AI se uči na naših objavah. Kako to preprečiti?

Nothing Phone 3 – prvi paradni telefon mladega podjetja

Čista in osvežujoča voda iz vaše pipe

Polnilnica na ključ: udobje doma in svoboda na poti!

Pametne ure FOREVER: tehnologija za vsak dan

Izpostavljeno

Vibor – partner, ki povezuje tradicijo in inovacije ...

Jabra: vedno pripravljeni na pogovor, sestanek ali ...

Hi-Fi Butik – zvok in slika po meri

Generali Investments – svet naložb v novi mobilni ...

Katere slušalke bi izbrali?

Najbolj brano

Kvantni preboj v optiki

Kitajski čip 1.000× hitrejši od Nvidie H100!

Električno kolo z dosegom 137 km in pametnimi funkcijami

Najnovejši mali oglasi

130,00 €

Maribor

Samsung galaxy a70

1.450,00 €

Ljubljana

Prodam iPad Pro 13 512 GB Space black

BOŽIČNI OVITKI za Samsung A36 5G /A56 5g

5,00 €

Ljubljana

BOŽIČNI OVITKI za Samsung A36 5G /A56 5g

Vrhunski QD-OLED Dell Alienware AW3423DWF črte na zaslonu (glej foto)

140,00 €

Ljubljana

Vrhunski QD-OLED Dell Alienware AW3423DWF črte na zaslonu (glej foto)

3.099,00 €

Maribor

16" MacBook Pro *KOT NOV* / M4 Max / 36 GB RAM / 1TB SSD

150,00 €

Maribor

HP ZBook 15 G2 Mobile Workstation

Dogodki

Nov

16. PR TEATER

Nov

Strokovna delavnica Korak za korakom do skladnosti ...

Vsi dogodki

Dražbe / Licitacije Prikaži vse

Trenutna cena 50,⁰⁰€

Bluetooth zvočnik Sencor Resonex Midi 80W – IZKLICNA CENA 1 €!

Trenutna cena 4,⁰⁰€

Bluetooth slušalke z mikrofonom SBOX ANC LCD zaslon – IZKLICNA CENA 1 €!

Trenutna cena 4,⁰⁰€

Gaming USB mikrofon Marvo BLAST 60 – TESTNI MODEL – IZKLICNA CENA 1 €!

Izklicna cena 1,⁰⁰€

Pametna ura Joyroom Classic Series JR-FC2 Pro – IZKLICNA CENA 1 €!

Partnerji Računalniških novic Prikaži vse

Zlati partner

TEKSEL d.o.o.

Tržaška cesta 132, 1000 Ljubljana, Tel: 01 620 77 25

Skoraj vsak mora vsebino, namen in vrednost svojega dela sporočiti strankam, obiskovalcem ali sodelavcem. Multimedijska oprema z integriranimi avdio in video funkcijami pomaga širiti ... Več

Zlati partner

ELKOTEX d.o.o.

Magistrova ulica 1, 1000 Ljubljana, Tel: 01 583 79 10

Elkotex, d. o. o., je grosistično podjetje za nadaljnjo prodajo podjetjem, fizičnim in spletnim trgovinam ter trgovskim verigam. So distributer IT opreme in uporabne elektronike, ... Več

Zlati partner