DeepSeek-V3.1: Hibridni AI, ki spreminja pravila igre

DeepSeek je predstavil DeepSeek-V3.1, izboljšano različico svojega revolucionarnega modela umetne inteligence. Slednja je bila prvič predstavljena decembra leta 2024 in se takoj uvrstila med deset najmočnejših AI sistemov na svetu. Podjetje je presenetilo tehnološki svet z razkritjem, da je model treniralo z bistveno manj računalniškimi viri in po precej nižjih stroških kot konkurenca.
Nova različica deluje kot hibridni model umetne inteligence, ki združuje hitro odzivnost modela V3 z globokim razmišljanjem modela R1. Model DeepSeek-V3.1 je na voljo brezplačno pod odprtokodno licenco MIT. Za uporabo celotne različice 671B je potrebnih vsaj 720 GB prostora (ali 170 GB za 1-bitno kvantizirano različico). Najmanjši model zahteva zmogljivo grafično kartico z vsaj 24 GB pomnilnika. Na primer Nvidia 5090 z 32 GB, ki stane preračunanih 1.600 evrov.
Model DeepSeek-V3.1 je izboljšan pri programiranju in presega zmogljivosti prejšnjih modelov V3 in R1 po testiranjih v merilnem programu SWE-bench. Prav tako dosega boljše rezultate v drugih testih razmišljanja, kot so xbench-DeepSearch, SimpleQA in FRAMES AI. Z oknom konteksta 128K omogoča brezplačen klepet z umetno inteligenco. Torej vse, kar potrebujejo napredni.
Prijavi napako v članku