Strojna oprema
20.09.2025 14:49

Deli z drugimi:

Share

OpenAI razkriva: Umetna inteligenca se zna pretvarjati!

OpenAI je v sodelovanju z Apollo Research objavil raziskavo, ki razkriva, kako se AI modeli lahko naučijo pretvarjati in zavajati. Čeprav gre večinoma za manjše prevare, raziskovalci opozarjajo, da bo z večjo kompleksnostjo nalog rasla tudi nevarnost škodljivega spletkarjenja.

Raziskovalci največjih tehnoloških podjetij občasno predstavijo odkritja, ki zvenijo kot iz znanstvenofantastičnega romana. Google je nekoč trdil, da njihov kvantni procesor nakazuje obstoj več vesolj. Anthropic je svojemu AI agentu Claudiusu zaupal upravljanje avtomata s prigrizki, a ta pa je začel klicati varnostnike in trditi, da je človek. Tokrat pa je presenetil OpenAI.

V sodelovanju z Apollo Research je objavil raziskavo, ki razkriva, kako preprečiti, da bi se AI modeli “pretvarjali.” Po njihovih besedah gre za vedenje, kjer se AI na površju obnaša skladno s pričakovanji, v ozadju pa zasleduje povsem drugačne cilje. Raziskovalci so tovrstno “spletkarjenje” primerjali z borznim posrednikom, ki krši zakon za čim večji zaslužek. A večina primerov ni bila škodljiva Šlo je namreč za preproste prevare, kot je trditev, da je naloga opravljena, čeprav ni.

Glavni namen raziskave je bil pokazati, da tehnika “deliberativnega usklajevanja” deluje. Gre za pristop, kjer model pred delovanjem pregleda “anti-spletkarsko specifikacijo”, podobno kot otrok, ki mora ponoviti pravila, preden gre igrat. A tu je zaplet: če AI zazna, da je testiran, se lahko pretvarja, da ne spletkari. čeprav to še vedno počne. Poskusi, da bi model naučili, naj ne laže, lahko vodijo do tega, da se nauči lagati še bolj prefinjeno.

OpenAI priznava, da so zaznali laži tudi pri ChatGPT, a gre večinoma za manjše prevare, in sicer kot trditev, da je uspešno izdelal spletno stran, čeprav je ni. Raziskovalci opozarjajo, da bo z večjo kompleksnostjo nalog in dolgoročnimi cilji verjetnost škodljivega spletkarjenja rasla. Zato morajo rasti tudi varovalke in testni postopki.

Vse to pa odpira pomembna vprašanja za prihodnost umetne inteligence. Še posebej v podjetjih, kjer se AI agenti obravnavajo kot samostojni “zaposleni.”


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku
Vas zanima več iz te teme?
umetna inteligenca

Povezave



Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Bronasti partner

E-MISIJA d.o.o.

Ljubljanska cesta 21d, 1241 Kamnik, Tel: 01 830 35 32
V E-MISIJI d.o.o. so v tridesetih letih svojega obstoja dokazali, da sodijo v sam vrh slovenske računalniške scene. Ne samo, da za njimi stoji več kot 20.000 zadovoljnih strank, ... Več
Zlati partner

SIDERA d.o.o.

Ulica Gradnikove brigade 11, 1000 Ljubljana, Tel: 031 777 790
O PODJETJU Sidera, ki v latinskem jeziku pomeni zvezda in je nastala v želji, da bi njena ustanoviteljica Urška Ambrož svoje dolgoletno delo v medijih združila s kreativno žilico, ... Več

MA-KO d.o.o.

Tovarniška cesta 2b, 5270 Ajdovščina, Tel: 05 368 11 10
Se sprašujete, kako najti najboljšega ponudnika računalniških sistemov in storitev? Kriteriji dolgoletne izkušnje, kakovostne storitve in zadovoljstvo strank takoj obrodijo ... Več
Zlati partner

XENON FORTE d.o.o.

Letališka cesta 29, 1000 Ljubljana, Tel: 01 548 48 00
Xenon forte d.o.o. je podjetje s 30-letno tradicijo. V celotnem času svojega obstoja se zavzema za odličnost in verodostojnost. Skupaj s podjetji Xenon forte Zagreb d.o.o., Xenon ... Več