Kvantni računalniki prinašajo pametnejšo umetno inteligenco
IBM raziskovalci so razvili inovativno metodo, ki s pomočjo kvantnega računalništva bistveno zmanjšuje negotovost in napake v sistemih umetne inteligence. Po besedah avtorjev gre za sploh prvi dokaz “kvantne izboljšave” na že izurjenem velikem jezikovnem modelu (LLM), ki se že množično uporablja v praksi.
Ena ključnih metrik za merjenje kakovosti modelov, kot sta ChatGPT ali Claude, je tako imenovana zmedenost oziroma PPL (perplexity). Ta matematična enota meri sposobnost sistema, da pravilno napove naslednjo besedo v stavku. Nižji kot je PPL, boljši in stabilnejši je model. Tradicionalni načini za zniževanje te vrednosti vključujejo dodatno fino nastavljanje ali drastično povečevanje števila parametrov. Prihajajoče različice komercialnih modelov naj bi imele že med 2 in 5 millijard parametrov, kar ustvarja ogromen pritisk na strojno opremo in pomnilniške zmogljivosti.
Znanstveniki iz podjetja Multiverse Computing pa so ubrali povsem drugo pot. V svoji študiji so dokazali, da lahko z uporabo posebnih kvantnih vezij dosežejo opazno zmanjšanje zmedenosti modela ob zanemarljivem povečanju števila parametrov. V sistem Meta Llama 3.1 8B (ki ima sicer 8 milijard parametrov) so vgradili tako imenovane Cayleyjeve unitarne adapterje (CUA). Gre za majhne matematične matrike, ki se najprej izurijo na klasičnem računalniku, medtem ko prvotni parametri modela ostanejo zamrznjeni.
Ta hibridni sistem so nato pognali na 156-kubitnem superprevodnem kvantnem procesorju IBM Quantum System Two. Rezultat je bil fascinanten. Tako imenovana zmedenost modela se je zmanjšala za 1,4 odstotka, pri čemer so modelu dodali zgolj 6000 parametrov, kar predstavlja zanemarljiv 0,000075-% porast.
Zaradi majhnosti teh adapterjev je sistem manj dovzeten za kvantni šum in zunanje motnje, kot so sevanja ali magnetna polja, ki sicer povzročajo napake v kvantnih izračunih. Kvantno nadgrajeni hibridni model je v praksi pravilno odgovoril na več zahtevnih vprašanj iz astronomije in biologije, pri katerih je osnovni model Llama odpovedal.
To odkritje odpira pot iz slepe ulice, kjer razvoj umetne inteligence omejuje zmogljivost klasične računalniške infrastrukture. Končni cilj raziskav je doseči polno “kvantno prednost” oziroma doseči točko, ko bodo hibridni AI sistemi sposobni reševati naloge, ki jim klasični superračunalniki sploh niso več kos.
Prijavi napako v članku




























