Modeli umetne inteligence v pomoč kreativnim poklicem
V Endavi, kjer razvoj umetno inteligenco ne samo spremljajo, temveč jo tudi uporabljajo, pravijo, da se bodo tako strokovnjaki lahko osredotočili na to, v čemer so najboljši – na kreativnost in reševanje problemov.
Kako bo umetna inteligenca v prihodnosti pomagala kreativnim poklicem, je na letošnjem Slovenskem oglaševalskem festivalu ponazoril dr. Boris Cergol, regijski vodja podatkovne discipline v Endavi. S pomočjo modelov umetne inteligence je namreč v manj kot desetih minutah generiral idejo za inovativen namišljeni produkt, njegov ciljni segment kupcev, ime in slogan produkta, korporativne vrednote podjetja, prodajno ponudbo za potencialne investitorje in besedilo za TV oglas.
Evolucija modelov umetne inteligence
Modeli iz družine generativnih modelov, ki omogočajo generiranje kreativne vsebine, so v tem trenutku sposobni na podlagi navodil v naravnem jeziku generirati pisne vsebine, kot so eseji, novice, pesmi, prepričljive slikovne vsebine, pa tudi programsko kodo. V bližnji prihodnosti lahko torej pričakujemo preboj na področju video in avdio vsebin.
Najbolj prepoznaven pionir na tem področju je zagotovo podjetje OpenAI, ki je leta 2018 predstavilo svoj prvi jezikovni model serije GPT (Generative Pre-Trained Transformer), katerega cilj je iz dane iztočnice nadaljevati besedilo na karseda smiseln način. Za ilustracijo, iz dane iztočnice »Nekega dne je za sedmimi gorami in sedmimi vodami kuža Piki srečal lisičko z zlomljeno tačko«, je model v trenutni fazi razvoja sposoben generirati pravljico poljubne dolžine. Sledili so naslednji modeli in ostala podjetja, kot so Google, DeepMind in Meta. Vidimo lahko sama velika tehnološka imena, kar sovpada z dejstvom, da učenje tovrstnih modelov lahko traja tudi po več tednov, to pa prinaša visoke stroške razvoja. Poleg generiranja besedil veliki jezikovni modeli zmorejo tudi prevajanja, odgovarjanja na vprašanja, razlage ter sumarizacije besedil, v zadnjem času pa se pojavljajo tudi modeli, zmožni logičnega pojasnjevanja.
Kako se generativni modeli učijo?
Gre za družino modelov nenadzorovanega učenja, kar pomeni, da za učenje ne potrebujejo označene učne množice. Učijo se namreč tako, da v vsakem stavku ogromnega korpusa prosto dostopnega besedila skušajo napovedati naslednjo besedo. Rezultat tovrstnega načina učenja je njihova sposobnost, da dano iztočnico dopolnijo s karseda naravnim nadaljevanjem. Ti modeli posedujejo enormno količino informacij, saj so bili naučeni na ogromnih korpusih besedil – GPT-3 je bil na primer naučen na osnovi 45 TB besedila, med drugimi tudi na celotni platformi Wikipedia, večjemu korpusu knjig ter naključnih internetnih straneh. Kljub temu da tovrstni modeli vedo marsikaj, pa moramo do informacij, ki nam jih postrežejo, biti previdni. Velikokrat se namreč zgodi, da se model kratkomalo kaj izmisli.
Prihodnost v pisanju programske kode in generiranju vizualnih vsebin
V učno množico jezikovnih modelov so njihovi razvijalci poleg korpusov naravnega jezika nedavno dodali tudi večje količine programske kode, za primer omenimo celotno platformo GitHub, in jim s tem dodali tudi neverjetno sposobnost generiranja programske kode. Čeprav so modeli, ki so sposobni pisanja programske kode, trenutno še v povojih, se na trgu že pojavljajo razširitve razvojnih okolij, kot je na primer GitHub Copilot, ki razvijalcem omogoča nadaljevanja programske kode iz dane iztočnice, generiranje kode iz komentarjev v naravnem jeziku ter tako imenovane »docstringe«, generiranje enotskih (angl. unit) testov iz dane kode in/ali specifikacij, prestrukturiranje in razlage dane kode ter iskanje ranljivosti v programski opremi.
V zadnjem času pa se je fokus iz generiranja samega teksta prestavil tudi na generiranje prepričljivih, realnih, namišljenih ali abstraktnih vizualnih vsebin iz navodil, podanih v naravnem jeziku, kjer so pravo revolucijo nedavno povzročili v podjetju Stability AI. V nasprotju s prevladujočo prakso so namreč svoj model za generiranje slikovnega materiala iz teksta, Stable Diffusion, v javnost sprostili s permisivno licenco.
Za konec pa še vprašanje – bi lahko uganili, ali je pričujoči tekst napisan s strani človeka ali umetne inteligence?
Več informacij na spletni strani www.endava.com.
Prijavi napako v članku