Google Gemini bo dobil več nadgradenj
Je kdo štel, kolikokrat je Google na konferenci I/O rekel »umetna inteligenca«? Jaz sem nehal pri številki 50.
Ne rabiš biti jasnoviden, da bi predvidel, da bo Google večino časa govoril o umetni inteligenci. Vendarle gre za tehnologijo, ki je največji povod za ogromne rasti in tudi kar nekaj negotovosti.
Gemini, Googlov sveti gral, bo dobil več pomembnih novosti. Na prvi pogled bo uporabnik najprej opazil prenovljen videz, vendar je oblikovna osvežitev le del zgodbe. Google v Gemini uvaja tudi nov model Gemini 3.5 Flash, napoveduje zmogljivejši Gemini 3.5 Pro, dodaja model za ustvarjanje videov Gemini Omni Flash in preizkuša stalno aktivnega osebnega UI agenta Gemini Spark, ki lahko naloge opravlja v ozadju.
Gemini 3.5 Flash: hitrejši model za agente, kodo in interaktivne odgovore
Najpomembnejša tehnična novost je Gemini 3.5 Flash, nova različica Googlovega modela, ki prihaja v aplikacijo Gemini in v AI Mode znotraj Iskanja Google. Google model opisuje kot hitrejši in učinkovitejši od prejšnjih različic, posebej močan pa naj bi bil pri agentskih nalogah, programiranju, ustvarjanju interaktivnih spletnih vmesnikov in grafičnih prikazov.
To pomeni, da Gemini ne bo več uporaben samo za klasične besedilne odgovore, temveč tudi za bolj kompleksne naloge, pri katerih mora razumeti cilj, izvesti več korakov in ustvariti uporaben rezultat. Google poudarja, da je 3.5 Flash zasnovan prav za takšne dolgotrajnejše agentske poteke dela, kjer model ne odgovori le na eno vprašanje, ampak pomaga izpeljati celoten proces.
Gemini 3.5 Flash je prvi model v novi družini Gemini 3.5. Zmogljivejši Gemini 3.5 Pro naj bi sledil prihodnji mesec.

Gemini dobiva bolj živ in vizualen vmesnik
Poleg novega modela Google prenavlja tudi videz aplikacije Gemini. Nova oblikovna smer se imenuje Neural Expressive in prinaša bolj tekoče animacije, živahnejše barve, novo tipografijo ter haptični odziv pri dotiku gumbov v aplikaciji. Prenova prihaja v Gemini na spletu, Androidu in iOS-u.
Google spreminja tudi način prikaza odgovorov. Gemini naj bi najpomembnejše informacije postavil višje v odgovoru, hkrati pa bo lahko vključeval slike, interaktivne časovnice, pripovedovane videoposnetke in dinamične grafike.
Pomembna je tudi tesnejša povezava med tipkanjem in glasovnim načinom Gemini Live. Google želi uporabnikom omogočiti bolj naraven prehod med pisanjem in pogovorom, Gemini Live pa naj bi dobil tudi nove regionalne dialekte.

Gemini Omni Flash: ustvarjanje videov iz besedila, slik, zvoka in videa
Google v aplikacijo Gemini uvaja tudi novo vrsto modela, imenovano Gemini Omni Flash. Gre za prvi model iz družine Gemini Omni, ki naj bi dolgoročno omogočala ustvarjanje različnih vrst vsebin iz skoraj kateregakoli vhodnega podatka. Za začetek je poudarek na videu. Uporabnik bo lahko ustvarjal videoposnetke s kombinacijo besedila, slik, zvoka in videa.
Google trdi, da lahko Gemini Omni Flash ustvarja realističnejše prizore z bolj prepričljivo fiziko in boljšim razumevanjem tega, kaj se mora v prizoru zgoditi naslednje. To je pomembno zato, ker generativni video pogosto ne pade pri prvem kadru, ampak pri nadaljevanju gibanja: predmeti izgubijo obliko, liki se spremenijo, fizika postane nelogična, prizor pa izgubi kontinuiteto.
Zanimiva novost so tudi Avatars, funkcija za ustvarjanje videov z digitalno različico uporabnika in njegovim glasom. Uporabnik naj bi lahko ustvarjeni video nato urejal kar s pogovorom v aplikaciji Gemini. Gemini Omni Flash prihaja v aplikacijo Gemini in Google Flow za naročnike Google AI Plus, Pro in Ultra, brezplačno pa naj bi bil na voljo tudi v YouTube Shorts in aplikaciji YouTube Create.
Daily Brief: osebni povzetek dneva iz koledarja, Gmaila in povezanih aplikacij
Google v Gemini dodaja tudi funkcijo Daily Brief, osebni dnevni povzetek, ki zbira informacije iz aplikacij, povezanih z Geminijem. Uporabniku lahko pripravi pregled dneva, prihajajoče dogodke iz Koledarja, pomembne posodobitve iz Gmaila in druge informacije, ki jih oceni kot relevantne. Nekaj podobnega je že nekaj časa na voljo na Samsung telefonih.
Daily Brief naj bi povzetke organiziral in razvrščal glede na uporabnikove cilje, uporabnik pa bo lahko z odzivom, na primer s palcem gor ali dol, vplival na to, kakšni povzetki so zanj uporabni. Funkcija prihaja za naročnike Google AI Plus, Pro in Ultra v ZDA.
Googlov osebni UI agent, ki dela v ozadju
Ena najbolj ambicioznih novosti je Gemini Spark, Googlov stalno aktivni UI-agent. Spark ni zamišljen kot navaden klepetalnik, temveč kot pomočnik, ki lahko naloge opravlja v ozadju, medtem ko uporabnik počne druge stvari. Google ga predstavlja kot agenta, ki deluje 24 ur na dan in lahko pomaga pri nalogah, kot so pisanje elektronskih sporočil, pregled mesečnih izpiskov kreditnih kartic, iskanje skritih naročnin ali priprava povzetkov zapiskov s sestankov.
Več o Gemini Spark pa v ločenem članku.
Gemini noče več biti samo klepetalnik
A s tem raste tudi odgovornost. Bolj kot Gemini postaja oseben, več podatkov potrebuje. Ko se poveže z Gmailom, Koledarjem, dokumenti, lokalnimi datotekami in finančnimi podatki, postane vprašanje zasebnosti enako pomembno kot vprašanje zmogljivosti. Uporabniki bodo morali jasno razumeti, katere aplikacije so povezane, kaj Gemini vidi, kaj shranjuje in kdaj lahko samostojno ukrepa.
Prijavi napako v članku




























