DeepSeek se po zmogljivosti že kosa z vodilnimi svetovnimi rešitvami
Podjetje DeepSeek je v tehnološki javnosti sprožilo val zanimanja z razkritjem predogleda svojega najnovejšega modela umetne inteligence (AI). Čeprav je DeepSeek že uveljavljeno ime, njihova nova različica predstavlja pomemben mejnik, saj se v številnih neodvisnih preizkusih zmogljivosti uvršča tik ob bok najzmogljivejšim modelom, kot sta GPT-4o in Claude 3.5 Sonnet. Ključna prednost novega modela je njegova dostopnost in transparentnost, kar razvijalcem po vsem svetu omogoča lažjo integracijo naprednih funkcij v lastne aplikacije.
Tehnično gledano novi model uporablja izboljšano arhitekturo “Mixture-of-Experts” (MoE). Ta pristop omogoča, da se med obdelavo vprašanja aktivira le majhen del celotne mreže parametrov (približno od 10 do 20 odstotkov), kar drastično zmanjša stroške računanja in pospeši odzivni čas, ne da bi pri tem žrtvovali kakovost odgovorov. Model se je izkazal za posebej močnega pri generiranju kode in razhroščevanju, kjer z natančnostjo do 0,01 odstotkov sledi navodilom razvijalca, ter pri kompleksnem logičnem sklepanju, kjer premaguje številne večje in dražje modele.
Poleg surove moči DeepSeek poudarja tudi optimizacijo za delo z dolgimi besedili. Novi model podpira kontekstno okno velikosti do 128.000 žetonov (tokens, kar ustreza približno 300 stranem besedila. To podjetjem omogoča, da v model naložijo celotno tehnično dokumentacijo ali dolge pogodbe, AI pa jih analizira v nekaj sekundah. DeepSeek prav tako nadaljuje svojo strategijo nizkih cen; ocenjuje se, da bo uporaba njihovega API-ja za razvijalce stala do petkrat manj kot uporaba konkurenčnih ameriških storitev, kar bi lahko povzročilo premik na trgu globalnih ponudnikov umetne inteligence.
Zanimanje za DeepSeek pa ni omejeno le na zmogljivost, temveč tudi na strateški pomen. Kot eno vodilnih kitajskih podjetij na tem področju dokazujejo, da lahko z inovacijami v algoritmih nadomestijo morebitne omejitve pri dostopu do najnovejše strojne opreme (čipov). Njihov novi model ni le dokaz tehnične odličnosti, temveč jasen signal, da se konkurenca na področju t.i. “mejnih modelov” zaostruje, kar bo na koncu koristilo predvsem uporabnikom v obliki hitrejših in cenejših orodij AI.
Prijavi napako v članku



























