Nvidia predstavila Rubin, novo arhitekturo za dobo umetne inteligence
Rubin je že v proizvodnji, širša uporaba pa se pričakuje v drugi polovici letošnjega leta. Po Huangovih besedah je arhitektura zasnovana predvsem za soočanje z osrednjim izzivom današnje umetne inteligence: eksplozivno rastjo potreb po računski moči.
Zakaj nova arhitektura?
Sodobni sistemi umetne inteligence – zlasti veliki jezikovni modeli in t. i. agentski sistemi – za svoje delovanje potrebujejo vse več računske moči. GPU (grafični procesorji), ki so sprva nastali za obdelavo grafike, so se izkazali kot bistveno učinkovitejši od klasičnih procesorjev pri vzporednih izračunih, ki jih zahteva učenje in izvajanje UI modelov.
Rubin je odgovor na dejstvo, da se potrebe po računanju povečujejo hitreje, kot jih je mogoče reševati z zgolj postopnimi izboljšavami obstoječih rešitev. Po Huangovih besedah je Vera Rubin – poimenovana po priznani astronomki Veri Florence Cooper Rubin – zasnovana posebej za novo generacijo delovnih tokov, ki vključujejo dolgotrajne naloge, več korakov sklepanja in večjo avtonomijo sistemov.
Kaj prinaša arhitektura Rubin?
Rubin ni le nov grafični čip, temveč celovita arhitektura, sestavljena iz šestih specializiranih čipov, zasnovanih za skupno delovanje. V njenem središču je novi Rubin GPU, ki pa ga dopolnjujejo tudi izboljšave na področju procesiranja, povezovanja in shranjevanja podatkov.
Pomembna novost je tudi novi procesor Vera CPU, namenjen t. i. agentskemu sklepanju – načinu delovanja, pri katerem UI sistemi samostojno razčlenjujejo naloge, sprejemajo odločitve in izvajajo daljše zaporedje dejanj. Takšni sistemi močno obremenjujejo pomnilnik, saj morajo hraniti in obdelovati velike količine vmesnih podatkov.
Prav zato Rubin naslavlja tudi ozka grla pri shranjevanju podatkov. Nvidia je uvedla nov sloj zunanjega pomnilnika, ki se povezuje neposredno z računsko enoto in omogoča učinkovitejše upravljanje t. i. KV predpomnilnika, ključnega za sodobne jezikovne modele.
Hitreje, varčneje in zmogljivejše
Po internih testih podjetja Nvidia arhitektura Rubin pri učenju modelov dosega do triinpolkrat višjo zmogljivost kot predhodna arhitektura Blackwell, pri izvajanju modelov (inference) pa do petkrat višjo. Zmogljivost sistema lahko doseže do 50 petaflopov, ob tem pa nova platforma omogoča tudi do osemkrat več računske moči na porabljeni vat energije.
Takšni preskoki niso pomembni zgolj z vidika hitrosti, temveč tudi zaradi energetske učinkovitosti. Z naraščanjem obsega UI sistemov postaja poraba energije ena ključnih omejitev nadaljnjega razvoja.
Rubinova arhitektura bo uporabljena pri skoraj vseh večjih ponudnikih oblačnih storitev. Med potrjenimi partnerji so Anthropic, OpenAI in Amazon Web Services, sistemi na osnovi Rubina pa bodo poganjali tudi superračunalnike, kot sta HPE Blue Lion ter prihajajoči Doudna superračunalnik v laboratoriju Lawrence Berkeley.
Predstavitev nove arhitekture poteka v času izjemno ostre konkurence na področju UI infrastrukture. Po Huangovi oceni bo v naslednjih petih letih v podatkovne centre, čipe in energetsko infrastrukturo za umetno inteligenco vloženih med 3 in 4 bilijone ameriških dolarjev.
Premik k infrastrukturi
Rubin jasno kaže smer, v katero se razvija umetna inteligenca: od eksperimentalnih modelov k stabilni, industrijski infrastrukturi. Nvidia z novo arhitekturo odgovarja na tehnične omejitve današnjih sistemov, hkrati pa nakazuje, da bo prihodnji napredek umetne inteligence vse bolj odvisen od temeljnih strojnih rešitev in njihove učinkovitosti.
Prijavi napako v članku





























