Računalništvo, telefonija
Programska in razvojna orodja
Aplikacije in dodatni programi
Programska oprema
Triki in nasveti
02.02.2026 10:00

Deli z drugimi:

Share

Kaj je Googlovo novo UI orodje Project Genie?

Predstavljajte si svet, v katerem meja med vašo domišljijo in digitalno resničnostjo praktično ne obstaja.
Foto: Gemini
Foto: Gemini

Svet, kjer narisana skica na kosu papirja ali preprosta fotografija gozda za vašo hišo v trenutku postane interaktivna video igra, ki jo lahko dejansko igrate. To niso sanje ljubiteljev znanstvene fantastike iz devetdesetih let prejšnjega stoletja, temveč resničnost, ki jo gradi Googlov raziskovalni laboratorij DeepMind. Njihov najnovejši dosežek, imenovan Project Genie (Generative Interactive Environment), napoveduje konec dobe, ko je bilo ustvarjanje digitalnih svetov omejeno na programerje in oblikovalce z leti izkušenj.

Trenutno je Project Genie na voljo le naročnikom storitve Google AI Ultra v ZDA, za katero uporabniki plačujejo dobrih 250 ameriških dolarjev na mesec.

Kaj sploh je Project Genie?

Genie je prvi »generativni interaktivni svetovni model« na svetu. Če smo se v zadnjih dveh letih navadili na klepetalne robote, kot je ChatGPT, ki generirajo besedilo, in orodja, kot je Midjourney, ki ustvarjajo slike, Genie stopa korak dlje. Ne ustvarja le statične vsebine, temveč žive, odzivne prostore.

Genie je model umetne inteligence, ki se je učil iz več kot 200.000 ur videoposnetkov 2D platformnih iger z interneta. Ključna razlika med tem modelom in drugimi pa je v tem, da se je Genie učil brez kakršnih koli dodatnih informacij o tem, kateri gumbi so bili pritisnjeni ali kako so se liki premikali. Samostojno je ugotovil, kateri deli slike so »igralni«, kaj se zgodi, če se lik premakne levo, in kako gravitacija vpliva na predmete v navideznem svetu.

To pomeni, da Genie ni le generator videa. Lahko bi rekli, da je igralni pogon (angl. game engine), ki ga poganja umetna inteligenca. Ko mu podate sliko, on ne predvidi le naslednji niz sličic v videu, temveč razume logiko prostora in vam omogoči, da v ta prostor vstopite in z njim upravljate.

Google DeepMind je Genie 3 sprva predstavil avgusta lani kot raziskovalni predogled, zdaj – pet mesecev zatem – pa z dostopnostjo prek Project Genie išče širši nabor povratnih informacij uporabnikov, medtem ko pospešeno razvija še zmogljivejše svetovne modele. Konkurenca na tem področju namreč narašča. Fei-Fei Li je s svojim laboratorijem World Labs konec lanskega leta izdala prvi komercialni izdelek Marble, startup Runway je pred kratkim prav tako lansiral svoj svetovni model, nekdanji vodilni znanstvenik pri Meti Yann LeCun pa z zagonskim podjetjem AMI Labs prav tako cilja na razvoj tovrstnih modelov.

Kako deluje Genie?

Raziskovalci pri DeepMindu so uporabili tisto, čemur pravijo »latentni model akcije« (angl. Latent Action Model). Večina modelov za generiranje videa zgolj ugiba, kakšna bo naslednja sličica na podlagi prejšnjih. Genie pa gre globlje.

Ko model opazuje video igro, se vpraša: »Katera nevidna akcija je povzročila to spremembo na zaslonu?« Sčasoma se je naučil prepoznati vzorce gibanja. Čeprav nikoli ni videl krmilnika ali kode igre, je razumel koncept skoka, hoje in interakcije. Ko danes uporabnik pritisne tipko na tipkovnici, Genie v realnem času generira naslednjo sličico sveta, ki ustreza tej specifični akciji.

Njegova sposobnost ustvarjanja iz ene same slike je osupljiva. Lahko mu pokažete fotografijo realnega sveta, umetniško sliko ali celo otroško risbo. Genie bo to vizualno informacijo pretvoril v igralno okolje z dosledno fiziko. Če je na risbi prepad, bo model razumel, da lik ne sme hoditi po zraku. Če je tam ovira, se bo lik ob njo zaletel.

Žal nimamo dostopa do novega UI orodja, smo pa vseeno prišli do informacij, kako se to novo UI orodje sploh uporablja.

Najprej uporabnik zapiše besedni opis želenega okolja in lika (oziroma naloži svojo izhodiščno sliko) v ustrezna polja znotraj spletne aplikacije. To je lahko denimo »gost tropski pragozd z antičnimi ruševinami, junak je raziskovalec, ki hodi po visečem mostu«. Google AI nato s pomočjo modela Nano Banana Pro iz opisa najprej ustvari predogledno sliko sveta. Uporabnik lahko to sliko še dodatno izpopolni (doda ali odstrani elemente, spremeni določen detajl, da bolje ustreza viziji sveta, ki si ga želi). Hkrati lahko izbere perspektivo pogleda (prvoosebni ali tretjeosebni način).

Ko je osnutek zadovoljiv, uporabnik klikne Ustvari in Project Genie v nekaj trenutkih generira celoten interaktivni prizor ter uporabnika postavi v ta svet. Na zaslonu se prikaže okolje skupaj z osnovnimi kontrolami. Gibanje poteka s standardnimi tipkami (W, A, S, D za premik, preslednica za skok/dvig, smerne puščice za obračanje pogleda), podobno kot v računalniških igrah. Ključna posebnost Genieja je, da svet ni vnaprej v celoti izrisan, temveč se dinamično gradi sproti. To pomeni, da ko se lik premika, UI sproti ustvarja nove dele pokrajine, dogodke in objekte pred igralcem.

Svet je trenutno upodobljen v 720p ločljivosti pri 24 sličicah na sekundo.

Vsak svet oziroma generirana izkušnja je časovno omejena na 60 sekund. Po preteku ene minute se seansa zaključi, kar je pričakovano, saj gre za intenzivno računsko nalogo. Po koncu ima uporabnik več možnosti: lahko shrani videoposnetek svojega raziskovanja, poizkus ponovi ali pa začne povsem nov svet z novim opisom.

Poleg ustvarjanja iz nič lahko uporabniki preizkusijo tudi že pripravljene ali svetove drugih. Project Genie namreč omogoča mešanje svetov. V galeriji je na voljo izbor primerov svetov, ki jih je mogoče naložiti in nato preoblikovati po svoje.

Čeprav je impresivno gledati, kako UI ustvarja svetove iz nič, smo že omenili nekaj omejitev. Poleg slabše ločljivosti in časovne omejitve uporabniki pravijo še, da je interakcija lika in sveta okoli njega zelo osnovna. Tudi odzivnost je slabša, kot smo je vajeni pri današnjih igrah. Skratka, zelo zanimivo orodje, vendar se opazijo simptomi razvijalne faze.

Google poudarja, da Project Genie razvijajo v skladu z načeli odgovornega razvoja. Prepovedana je zloraba. Vgrajeni so varnostni filtri, da uporabniki ne bi generirali škodljivih, nezakonitih ali neprimernih vsebin.

Zakaj je to pomembno za prihodnost umetne inteligence?

Se mogoče sprašujete, ali res potrebujemo še eno UI orodje, še posebej za ustvarjanje video iger. Odgovor je, da Genie ni le orodje za igre. Nekateri strokovnjaki so prepričani, da so t. i. svetovni modeli zelo pomembni, če želimo doseči splošno umetno inteligenco (AGI).

Da bi UI resnično razumela človeški svet, se ne more le učiti iz besedil. Razumeti mora vzrok in posledico. Če UI ve, da bo kozarec padel na tla in se razbil, če ga potisnemo z mize, je to oblika inteligence, ki presega zgolj zlaganje besed v stavke. Modeli, kot je Genie, učijo umetno inteligenco fizike, prostorske orientacije in logike delovanja v realnem svetu.

To ima ogromne posledice za robotiko. Namesto da bi robote učili hoditi v dragih in nevarnih realnih okoljih, jih lahko učimo v neskončnih, z UI generiranih simulacijah, ki so vizualno in fizikalno identične realnosti. Če se robot nauči navigirati v tisočih različnih Genie svetovih, bo veliko bolje pripravljen na vstop v vašo kuhinjo.

Kmalu tudi pri nas?

Google za zdaj skrbno nadzoruje širjenje novega orodja. Dostop dobivajo le najbolj zagreti uporabniki z Ultra naročninami v ZDA, medtem ko ostali lahko le občudujejo posnetke in čakajo na širšo dostopnost. Podjetje pravi, da namerava postopoma omogočiti dostop več uporabnikom in na več območjih, ko bo tehnologija bolj zrela.


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku
Vas zanima več iz te teme?
Google umetna inteligenca Google Gemini


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

ZwCAD SLOVENIA

Prečna 9b, 2000 Maribor, Tel: 02 471 12 40
ZwCAD Slovenia pod okriljem podjetja Birocom 2000 d.o.o. ponuja rešitve na področju CAD, CAD/CAM in CAE programske (in strojne) opreme. Več
Srebrni partner

VERLAG DASHOFER d.o.o.

Dunajska cesta 21, 1000 Ljubljana, Tel: 01 434 55 90
Založba Verlag Dashöfer je v Sloveniji prisotna že več kot 20 let. Od ustanovitve leta 2003 smo postali zanesljiva podpora že več kot 15.300 poslovnim uporabnikom, ki spremembe ... Več
Zlati partner

BROTHER CEE GmbH

Glavna cesta 46, 4202 Naklo, Tel: 030 600 474
Dejavni so v 28 državah, Brotherjevi izdelki pa so na voljo v več kot 100 državah.  Od ustanovitve korporacije leta 1934 si prizadevajo, da bi ideje prenesli v prakso z ustvarjanjem ... Več

NCOM d.o.o.

Bičevje 5, 1000 Ljubljana, Tel: 040 855 519
Mobilne aplikacije so korenito spremenila način delovanja podjetij. Več kot 3 milijarde ljudi ima dostop do pametnega telefona. Mobilne aplikacije trenutno predstavljajo najučinkovitejši, ... Več