Domov Računalništvo, telefonija Strojna oprema OpenAI razkriva: Umetna inteligenca se zna pretvarjati!

Strojna oprema

20.09.2025 14:49

Deli z drugimi:

OpenAI razkriva: Umetna inteligenca se zna pretvarjati!

OpenAI je v sodelovanju z Apollo Research objavil raziskavo, ki razkriva, kako se AI modeli lahko naučijo pretvarjati in zavajati. Čeprav gre večinoma za manjše prevare, raziskovalci opozarjajo, da bo z večjo kompleksnostjo nalog rasla tudi nevarnost škodljivega spletkarjenja.

Raziskovalci največjih tehnoloških podjetij občasno predstavijo odkritja, ki zvenijo kot iz znanstvenofantastičnega romana. Google je nekoč trdil, da njihov kvantni procesor nakazuje obstoj več vesolj. Anthropic je svojemu AI agentu Claudiusu zaupal upravljanje avtomata s prigrizki, a ta pa je začel klicati varnostnike in trditi, da je človek. Tokrat pa je presenetil OpenAI.

V sodelovanju z Apollo Research je objavil raziskavo, ki razkriva, kako preprečiti, da bi se AI modeli “pretvarjali.” Po njihovih besedah gre za vedenje, kjer se AI na površju obnaša skladno s pričakovanji, v ozadju pa zasleduje povsem drugačne cilje. Raziskovalci so tovrstno “spletkarjenje” primerjali z borznim posrednikom, ki krši zakon za čim večji zaslužek. A večina primerov ni bila škodljiva Šlo je namreč za preproste prevare, kot je trditev, da je naloga opravljena, čeprav ni.

Glavni namen raziskave je bil pokazati, da tehnika “deliberativnega usklajevanja” deluje. Gre za pristop, kjer model pred delovanjem pregleda “anti-spletkarsko specifikacijo”, podobno kot otrok, ki mora ponoviti pravila, preden gre igrat. A tu je zaplet: če AI zazna, da je testiran, se lahko pretvarja, da ne spletkari. čeprav to še vedno počne. Poskusi, da bi model naučili, naj ne laže, lahko vodijo do tega, da se nauči lagati še bolj prefinjeno.

OpenAI priznava, da so zaznali laži tudi pri ChatGPT, a gre večinoma za manjše prevare, in sicer kot trditev, da je uspešno izdelal spletno stran, čeprav je ni. Raziskovalci opozarjajo, da bo z večjo kompleksnostjo nalog in dolgoročnimi cilji verjetnost škodljivega spletkarjenja rasla. Zato morajo rasti tudi varovalke in testni postopki.

Vse to pa odpira pomembna vprašanja za prihodnost umetne inteligence. Še posebej v podjetjih, kjer se AI agenti obravnavajo kot samostojni “zaposleni.”

Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Prijavi napako v članku

Vas zanima več iz te teme?

umetna inteligenca

Povezave

OpenAI

Sorodne novice

Nova drzna prevara na Amazonu

Prvi Neuralinkov pacient po 100 dneh presegel vse meje

Kaj se skriva v novi pametni Lego kocki?

Foto: Sam Kriegman/Northwestern University

Umetna inteligenca ustvarila neuničljivega robota

Prva kvantna baterija na svetu

Izdelajte si pametno uro, ki je tudi osebni pomočnik ...

Kaj berejo drugi?

Manj je več: zakaj minimizacija podatkov ščiti uporabnike in podjetja

Je Proscenic P20 OnePass dovolj močan za sesanje čisto vsake umazanije?

Test Proscenic P20 OnePass – ali lahko upokoji klasični kabelski sesalnik?

Odlične RPG igre, ko boste končali Clair Obscur: Expedition 33

»Velikost podjetja ni več zaščita«

Digitalni ključi vašega podjetja: Kako z Delineo ustaviti vdore in prihraniti čas

3D tiskalnik FlashForge Creator 4-A na DRAŽBI – profesionalni model z dvema glavama – izklicna cena 1 €

Izpostavljeno

Vaše podjetje pod budnim očesom strokovnjakov: zakaj ...

Kako pirati zlomijo zaščito Netflixa in ostalih?

Otok, ki drži dom skupaj

Bo Samsung Galaxy S26 Ultra kraljeval ali je postal podložnik kitajskim rivalom?

Test Samsung Galaxy S26 Ultra – stari znanci, nove ...

Napaka pri projektiranju kontrole pristopa vas lahko ...

Najbolj brano

Umetna inteligenca ustvarila neuničljivega robota

Prva kvantna baterija na svetu

Baterija za električne avtomobile, ki se napolni v ...

Zaposlitveni oglasi

Vodja projektov implementacije Odoo (M/Ž) – proizvodnja in skladiščno poslovanje

Več

Arhitekt rešitev / Solutions Architect (m/ž)

Ljubljana Več

Najnovejši mali oglasi

40,00 €

Litija

ASUS GeForce GT1030 Low Profile grafična karica, 2GB GDDR5

250,00 €

Ajdovščina

Google Pixel 8 128GB

30,00 €

Kranj

CUBOT NOVA Dual SIM NERABLJEN telefon

550,00 €

Novo mesto

Lenovo Legion Go 1TB

Dell XPS 15 9570 (i9-8950HK, 16GB, 4K UHD, GTX 1050 Ti Max-Q)

300,00 €

Ljubljana

Dell XPS 15 9570 (i9-8950HK, 16GB, 4K UHD, GTX 1050 Ti Max-Q)

600,00 €

Bled

4070Super

Dogodki

Mar

Dnevi industrijske robotike 2026

Apr

Mednarodni logistični kongres

Vsi dogodki

Dražbe / Licitacije Prikaži vse

Trenutna cena 67,⁰⁰€

Bluetooth zvočnik SBOX BT-60 TANGO – BEL – IZKLICNA CENA 1 €!

Trenutna cena 550,⁰⁰€

Klimatska naprava SAMSUNG WindFree™ Avant 2,5kW – IZKLICNA CENA 1 €!

Trenutna cena 180,⁰⁰€

Pametna tekaška steza Kingsmith WalkingPad C2 – TESTNI MODEL – IZKLICNA CENA 1 €!

Trenutna cena 40,⁰⁰€

Skiro RollJet City + šolska torba D-bag (motiv Math) – IZKLICNA CENA 1 €!

Partnerji Računalniških novic Prikaži vse

ARCHUS.SI d.o.o.

Cankarjeva ulica 9c, 6000 Koper/capodistria, Tel: 070 890 096

O podjetju Archus.si ARCHUS.SI d.o.o. je podjetje iz Kopra. Kot prvi v Sloveniji so leta 2008 oz. 2009 začeli ponujati nekaj aktualnih in zanimivih produktov nove tehnologije, kot ... Več

Zlati partner