Dr. Ivan Bratko: Bodo vse odločitve kmalu v rokah umetne inteligence?

Dr. Ivan Bratko je na področju umetne inteligence oral ledino takrat, ko so le redki verjeli, da bodo računalniki kdaj diagnosticirali raka ali pisali sodne odločbe. Z umirjeno distanco oriše razvoj tehnologije, ki je iz eksperimentalne igre v jeziku Pascal prerasla v globalno družbeno silo.
Vi se že zelo dolgo ukvarjate z umetno inteligenco. Kako so izgledali ti začetki v 80. letih preteklega stoletja?
Na to imam zelo lepe spomine. Že pred letom 1980 sem vzpostavil stike z Univerzo v Edinburghu z našim zelo slavnim kolegom Donaldom Michiejem, ki je bil takrat med desetimi najbolj znanimi začetniki področja umetne inteligence. Dogovoril sem se za gostovanje pri njem. Tam je bil na daljšem obisku tudi Ross Quinlan, Avstralec, ki je napisal enega izmed prvih programov za strojno učenje, ID3. Takrat je bilo strojno učenje zelo neznano področje in Ross mi je dal svoj program, da sem se z njim »igral«. Ta program, nekaj strani kode v programskem jeziku Pascal, sem nato uporabil pri programiranju šaha, kar je bilo takrat zelo popularno eksperimentalno področje za razvoj metod umetne inteligence. Uspelo mi je rešiti nekatere težave s programiranjem in bil sem navdušen. Presenetila pa me je reakcija Donalda Michieja, ki ni delil mojega navdušenja, češ da je to znanstvena fantastika in da so oni resen laboratorij, ki se ukvarja z resnimi stvarmi.
Vas njegova reakcija ni dotolkla?
Bil sem kar poparjen, saj se mi je zdel moj dosežek fantastičen. Michie pa je rekel, da zdaj ni pravi čas za to, in poskuse s strojnim učenjem sem nadaljeval sam. Res pa se je kakšno leto kasneje nad strojnim učenjem navdušil tudi Michie in tudi postal njegov protagonist. Ko sem se vrnil v Ljubljano, sem izvedel za kolega Milana Sokliča, ki je sodeloval z nekim onkologom iz kliničnega centra. Soklič mi je z veseljem dal na razpolago medicinske podatke iz limfografske preiskave, kar je bil verjetno prvi poskus strojnega učenja na realnih medicinskih podatkih. Slučajno sem imel takrat stike s študentom Petrom Mulcem, ki je iskal temo za diplomsko nalogo. On je izvedel bolj podrobne poskuse in tako omenjeni onkolog kot tudi moj prijatelj, slavni onkolog dr. Matjaž Zwitter, sta rezultate ocenila kot zanimive. Z Mulcem sva leta 1980 objavila članek v reviji Informatica, verjetno prvi na svetu o uporabi strojnega učenja v medicini, a ni imel nobenega odmeva.
Zgodba s programom ID3 pa se je nadaljevala …
Tehnično je bil program zelo primitiven, zato smo v Ljubljani začeli razvijati izboljšave. Ugotovili smo veliko slabih točk in sami razvijali ideje, kako ga narediti bolj učinkovitega. V nekaj letih smo imeli inovacije, ki so kasneje zaživele na področju strojnega učenja. Moj takratni študent in kasneje profesor računalništva, Igor Kononenko, je za diplomsko nalogo implementiral izboljšave algoritma ID3 in ustvaril program Assistant 86, ki je v svetu postal znan kot referenca za te tehnične novosti. Z vsako novostjo smo opazili, da je bolje deloval tudi v medicinskih domenah, kot so napovedovanje ponovitve raka dojke, lociranje primarnega tumorja in napovedovanje uspešnosti operacij kolka. Leta 1987 smo v objavi zbrali vse tehnične novosti in pregled poskusov. Rezultati so bili navdušujoči, saj so zdravniki sami videli, da deluje bolje kot specialisti – točnost je bila boljša, programi pa so se učili iz znanih primerov iz preteklosti. Ta objava iz leta 1987 je bila zelo odmevna in je še danes pogosto citirana.
Kako daleč je takrat, reciva med letoma 1980 in 1990, segal pogled glede moči in vpliva umetne inteligence v prihodnosti?
Predvideti je bilo težko, ampak razmišljalo se je veliko. Zgodovina umetne inteligence je šla v valovih, z obdobji razcveta in upada zanimanja. Slednje imenujemo »AI winters« (zime umetne inteligence), ko je umetna inteligenca v medijih in financiranju izgubila ugled zaradi nerealnih obljub. V 70. letih so obljubljali, da bo v naslednjih 10 letih umetna inteligenca sposobna prevajati med jeziki. Ko je minilo 10 let, so novinarji ugotovili, da so rezultati smešno slabi. Govorili so, da je to področje, ki veliko obljublja, a nima resnih rezultatov. Nihče ni več verjel, da bo strojno prevajanje kdaj uspešno.
Seveda so bila tudi sijajna obdobja, ko so se vlade spraševale, kako bi lahko čim več investirale v umetno inteligenco. Ta nihanja so se dogajala do približno leta 2000, od takrat naprej pa ni bilo več t.i. zime umetne inteligence.
Mnoge preseneti, da se je nekdo s tem ukvarjal že leta 1980 …
Da. Še pred koncem 80. let smo v Ljubljani imeli še en zanimiv projekt, poimenovan KARDIO, ki je uporabil kvalitativno modeliranje za diagnosticiranje EKG signalov. Sredi 80. let smo imeli prebojne rezultate, ki so vodili do povabila založbe MIT Press (op.a., akademska založba, povezana z uglednim ameriškim inštitutom MIT – Massachusetts Institute of Technology) za objavo knjige o projektu KARDIO, kar je bila zelo prestižna objava. Glavna sodelavca sta bila Nada Lavrač in Igor Mozetič.
Z znanstvenega vidika je torej umetna inteligenca že precej dolga zgodba. Zanimivo orodje za množice pa je postala s ChatGPT-jem. Kakšno je vaše mnenje o tem?
Umetna inteligenca je postala zanimivo orodje že dolgo časa nazaj, na primer z rezultati v medicinski diagnostiki, vendar to ni bilo orodje, ki bi ga uporabljale množice. »Orodje za množice« na način, na kakršnega zdaj vsi uporabljajo velike jezikovne modele (LLM), je res postala šele v zadnjih letih.
Zanimivo je tudi, da mnogi tehnični prispevki k strojnemu učenju v njegovem zgodnjem obdobju niso prišli iz Amerike, ampak iz evropskih in avstralskih skupin. Razmerje moči v znanosti je zelo odvisno od tega, kdo je trenutno vodilni. In če ne sodelujejo Američani, polovica sveta domneva, da to ne more biti nič posebnega. Na konferencah smo imeli dolgoletni konflikt zaradi ameriškega stališča, da je strojno učenje zanimivo, a za resno uporabo znanstvena fantastika – kljub temu, da smo imeli v tistem času realne rezultate. Takrat je bil preostali svet na področju strojnega učenja pred Ameriko. Potem je naša struja končno prevladala. Splošna javnost se pogosto ozira samo na to, kaj rečejo ameriški znanstveniki, to je naša realnost.
Zdaj pa vsi pravijo, da je umetna inteligenca »fantazija«. Z njo pa prihajajo zelo pomembne spremembe v družbi.
Katere so danes po vašem mnenju najbolj pomembne spremembe ter vprašanja, povezana z umetno inteligenco?
Razvoj, ki je privedel do velikih jezikovnih modelov, je presenetil tudi nas same. Pričakoval sem, da bo strojno učenje vedno bolj uporabno, vseeno pa ne takega preboja v tako kratkem času. Veliki jezikovni modeli so zelo koristni za povečanje učinkovitosti, premagovanje jezikovnih ovir, torej prevajanje in pomoč pri pisanju. V zadnjih petih letih je resnično prišlo do prebojnih rezultatov, ki so popolnoma spremenili situacijo. Moj nekdanji študent, Blaž Zupan, ki se je kot srednješolec pridružil mednarodni šoli za avtomatično sintezo ekspertnega znanja ISSEK in se nad tem navdušil, je eden tistih, ki premika meje. Je tudi glavni avtor programskega sistema Orange.
Kaj je Orange?
Zupan je na začetku študija, med sodelovanjem na naših delavnicah v okviru ISSEK dobil idejo, da bi ustvaril splošno platformo za strojno učenje, ki bi združevala različne oblike le-tega. To je realiziral v sistemu Orange, ki je splošna platforma za strojno učenje in je že pred letom 2000 postala eno izmed najbolj priljubljenih in prosto dostopnih orodij na svetu – z milijoni uporabnikov. To štejem za enega izmed naših največjih uspehov.
Zupan je pred kratkim s sodelavci izvedel zelo zanimiv eksperiment. Ugotovil je, da lahko veliki jezikovni modeli ocenjujejo študentske izdelke (domače naloge, ki vključujejo programiranje, analizo in poročanje) s podobno natančnostjo kot človeški ocenjevalci, vključno z numeričnimi ocenami in pisnimi povratnimi informacijami. In to celo do te mere, da tudi študenti sami niso mogli razpoznati, kdo je ocenil njihove izdelke. To drastično spreminja procese v izobraževanju, saj se ocenjevanje lahko avtomatizira. Prav tako lahko študenti velike jezikovne modele uporabljajo za individualno učenje. Študenti sami tudi množično uporabljajo ta orodja za pisanje svojih izdelkov, vendar se zdi, da je odnos univerz do tega še nedorečen. Vse univerze spodbujajo uporabo teh orodij za večjo učinkovitost, a to pomeni, da se študenti ne bodo nujno naučili pisati in se izražati. Zdaj se moramo odločiti, ali je sposobnost izražanja sploh še pomembna. Jaz ne bi rad videl sveta, kjer se ljudje ne znajo več izražati.
Dotakniva se še bolj kočljivih razmišljanj. Jezikovni modeli zdaj bolje delujejo na skoraj vseh področjih, vključno s pisanjem dokumentov v sodstvu. Imam prijatelje pravnike, ki so opazili, da so pravniški dokumenti v zadnjem letu napisani drugače, kot so bili prej, so bistveno daljši, obsegajo tudi po več kot tisoč strani. Pred kratkim sem bil na slovenski konferenci o umetni inteligenci, kjer je nastopil vrhovni sodnik, ki je prav tako opazil te spremembe. To je popolnoma neobvladljivo.
Seveda, če UI rečeš, naj ti napiše 1000 strani, jih napiše.
Natančno tako. Vrhovni sodnik je razmišljal o uvedbi pravila, ki bi omejilo dovoljeno dolžino pravniških dokumentov. Rekel sem, da to ni samo dobra ideja, ampak nuja, saj če omejitve ni, bo tožbe in vloge ne le pisal temveč tudi presojal ChatGPT. Zelo se bojim, da se bo vse odločanje popolnoma oddaljilo od človeka. Mnogi vodilni strokovnjaki, kot sta Geoffrey Hinton in Yoshua Bengio, delijo to skrb, da bo umetna inteligenca prevzela odločanje – ne s silo, ampak s tem, da bodo ljudje sami prepustili vse pomembne odločitve jezikovnim modelom.
Kakor koli – slaba stran tega scenarija je, da poti nazaj ni. Ko bodo ti sistemi delovali samostojno, ne bo več možnosti vrnitve.
Sistemi umetne inteligence bodo sami optimizirali svoje cilje, ki jih imajo za cilje človeštva, in zavirali vse druge možne spremembe, saj ima vse niti v svojih rokah tisti, ki piše zakone in spremlja sodne odločitve – in to bo po takem scenariju umetna inteligenca.
Kaj vas najbolj navdušuje in kaj najbolj skrbi pri umetni inteligenci?
Kljub povedanemu me ogromno stvari še vedno navdušuje. Korenito bi se lahko spremenila razmerja v zdravstvu, saj bi generativna umetna inteligenca lahko na primer rešila problem pomanjkanja zdravnikov in delala manj napak kot človeški strokovnjaki.
Glede regulacije pa se tudi strokovnjaki, kot so Hinton, Bengio in Stuart Russell strinjajo o njeni nujnosti. Evropska pot k regulaciji (AI Act) je po mnenju mnogih, ne glede na to, od kod prihajajo, ocenjena kot najboljša na svetu in bi morala biti zgled za Ameriko.
Skrbi me tudi, ker danes mnogi celo znanstvene članke pišejo z velikimi jezikovnimi modeli, kjer ni čisto jasno, kaj je napisal človek in kaj LLM. To mi ni všeč in zelo naporno je, ko izgubiš tri ure, da ugotoviš, da je bistvo članka napisala umetna inteligenca. Ob tem res ne veš, kaj bi si mislil.
Prav tako mi ni všeč, da zaradi možnosti pisanja besedil z umetno inteligenco prihaja do ogromnega onesnaženja oziroma hiperprodukcije besedil. Bralcev bo preprosto zmanjkalo in večina besedil bo napisanih, ne da bi jih kdo kdaj prebral. Gre za nezdravo informacijsko deformacijo.
Tudi v znanosti, kjer je pomembna odmevnost, ki se kaže v citiranju, je to zdaj zamegljeno, ker o tem, kdo bo koga citiral, odločajo tudi veliki jezikovni modeli.
Premike vidim tudi v umetnosti. Na primer, umetna inteligenca je sposobna slikanja v stilu impresionistov ali Van Gogha. Nekdaj smo umetniška dela cenili tudi zato, ker so bila rezultat človeške kreativnosti, ki pa se jo da danes replicirati za drobec nekdanje cene.
Tu je nujna transparentnost – da bi lahko preverili, kaj je naredila UI in kaj človek …
Za nič več ne moreš biti prepričan, čigavo delo je. Recimo, v delovni skupini organizacije GPAI (Global Partnership on AI) sem zadnja tri leta precej pogosto sodeloval z Yoshuo Bengiom. Ena stvar, o kateri smo se strinjali je, da bi moral bralec vedno imeti možnost preveriti, kdo je napisal besedilo – človek ali jezikovni model. To bo urejal tudi evropski akt o umetni inteligenci.
Ne vem pa, kako bi to lahko bilo tehnično realizirano. Imel sem študentko pravnico, ki je za projekt preučevala tehnične možnosti izvedbe te zahteve. Zgrožen sem bil, ko je predstavila, kako zelo zapleteno in razvejano je, ko pride do sodelovanja med človekom in umetno inteligenco – človek nekaj napiše, UI model doda, popravi, človek spet popravi – in se vse tako zamegli, da je težko reči, čigavo delo je to.
Za konec omeniva še simpozij ASEF, ki bo potekal 23. junija v Ljubljani.
Na simpoziju ne bom med govorci, vendar sem tutor za računalništvo v okviru programa ASEF (Ameriško-slovenska izobraževalna fundacija), ki podpira nadarjene študente in jim omogoča raziskovalne obiske pri vrhunskih strokovnjakih v tujini. Poleg tega ti isti študenti opravljajo ASEF tutorstvo v skupinah za posamezna področja. Vsaka tutorska skupina ima možnost, da preko svojega predstavnika predstavi svoje delo.
Vsako leto si prizadevam, da najdemo temo za konkreten projekt, kjer bi poskusili rešiti specifičen problem z metodami umetne inteligence.
Eno leto smo se osredotočili na preskrbo z vodo in ustvarili sistem za upravljanje z vodarno, ki skrbi za oskrbo območja s kakovostno vodo in za njeno skladiščenje – da je ne zmanjka ob suši in da ni onesnažena ob nevihtah. S pomočjo umetne inteligence smo se naučili napovedovati vremenske pojave, in ko jih poznaš, lahko avtomatično upravljaš z vodo in kemičnimi procesi čiščenja. To je bil zanimiv projekt.
Lani smo razvili napovedovanje poplavljanj slovenskih rek z umetno inteligenco. Eno leto smo imeli temo uravnoteženja distribucije koles v sistemu BicikeLJ v Ljubljani, kjer smo napovedovali povpraševanje po kolesih, na podlagi česar bi lahko servisna služba zelo učinkovito prepeljala presežke koles na mesta, kjer jih primanjkuje. Ta objava je dobila nagrado za najboljši prispevek na konferenci, žal pa ljubljanska občina našega sistema ni nikoli realizirala.
V našem letošnjem ASEF tutorskem projektu razvijamo s strojnim učenjem čebelarsko aplikacijo za kontrolo kvalitete medu. Sistem se iz vzorcev medu uči razpoznavati vrste cvetnega prahu v vzorcu. Pri tem projektu sodeluje tudi čebelarska zveza Slovenije. Veselijo nas prvi odzivi, po katerih sklepamo, da bo ta projekt zaživel v čebelarski praksi.
Moje izkušnje z ASEF so izredno pozitivne, saj so študenti računalništva, katerih tutor sem, skoraj vsi pa se ukvarjajo z umetno inteligenco, sposobni v kratkem času narediti izredno pomembne stvari.
Kaj je o priložnosti sodelovanja z ASEF povedal Frenk Dragar, štipendist ASEF generacije 2023
V okviru ASEF štipendijskega programa sem v jeseni 2023 obiskal San Francisco Bay Area in raziskovalno sodeloval s profesorjem dr. Gašperjem Begušem na Univerzi v Kaliforniji, Berkeley. V raziskovalnem delu sem se osredotočil na področje žigosanja (watermarking) generativnih govornih in jezikovnih modelov, z namenom zaznavanja umetno generiranih vsebin in obvladovanja njihove zlorabe. Poleg raziskovanja sem obiskal dogodke, kot je TechCrunch Disrupt, in se povezal s študenti, raziskovalci in podjetniki iz širše regije. V spomin se mi je vtisnila predvsem ambicija tamkajšnjih ljudi, z intenzivnim prepletanjem raziskovanja in uporabe v praksi, kar je vplivalo tudi na mojo kasnejšo odločitev za ustanovitev podjetja, kjer se ukvarjamo z uporabo umetne inteligence v izobraževanju.
ASEF ima poleg samih raziskovalnih obiskov še nekaj drugih aktivnosti. Sodeloval sem tudi pri ASEF podcastu, kjer ustvarjamo vsebine o vlogi Slovencev v globalnem znanstvenem prostoru, ter v tutorskem programu ASEF pod mentorstvom prof. dr. Ivana Bratka. Projekt, na katerem smo delali napovedovanje ekstremnih vremenskih pojavov, se je začel v okviru šole Generativna UI in pravo. Na tej osnovi smo v manjši interdisciplinarni skupini ASEF štipendistov razvijali modele za napovedovanje pojavov, zlasti poplav, pri čemer smo sodelovali z Agencijo RS za okolje (ARSO). Dr. Sašo Petan nam je omogočil dostop do relevantnih vremenskih podatkov in strokovne podpore pri oblikovanju napovednih modelov. To je bila odlična priložnost za interdisciplinarno delo na družbeno relevantnem projektu.
Prijavi napako v članku