Izobraževanje
28.09.2025 05:43

Deli z drugimi:

Share

Kako blizu je umetna inteligenca človeškim strokovnjakom?

OpenAI je razvil GDPval, testni standard za oceno zmogljivosti AI v primerjavi s človeškimi strokovnjaki v ključnih industrijah. GPT-5-high in Claude Opus sta pokazala visoko stopnjo uspešnosti, kar nakazuje hitro približevanje AI realnim delovnim nalogam.

OpenAI je predstavil nov testni standard z imenom GDPval, ki ocenjuje, kako se njegovi AI modeli primerjajo s človeškimi strokovnjaki v ključnih industrijah. Test je del širše misije podjetja za razvoj umetne splošne inteligence (AGI), ki bi lahko opravljala gospodarsko pomembna dela.

GDPval se osredotoča na devet glavnih sektorjev, ki prispevajo k ameriškemu BDP, vključno z zdravstvo, financami, proizvodnjo in javnim sektorjem. Ocenjuje zmogljivost AI v 44 poklicih tako, da strokovnjaki primerjajo poročila, ki jih je ustvaril AI, s tistimi, ki jih je pripravil človek.

V prvi različici GDPval-v0 je OpenAI ugotovil, da je GPT-5-high, zmogljivejša različica GPT-5, dosegel ali presegel raven strokovnjakov v 40,6 odstotkov nalog. Claude Opus 4.1 podjetja Anthropic je dosegel še višjo oceno, 49 odstotkov, čeprav OpenAI del uspeha pripisuje vizualno privlačnim izhodom.

Čeprav test trenutno ocenjuje le naloge pisanja poročil, OpenAI načrtuje širitev na bolj interaktivne in raznolike delovne tokove. Podjetje vidi GDPval kot obetaven korak k temu, da strokovnjaki prenesejo rutinska opravila na AI in se osredotočijo na naloge z večjo dodano vrednostjo.

GPT-4o je pred 15 meseci dosegel le 13,7 odstotkov, kar kaže na hiter napredek. Ker tradicionalni testi, kot sta AIME in GPQA, dosegajo zasičenost, bi lahko GDPval postal ključno orodje za merjenje zmogljivosti AI v resničnem svetu.


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku
Vas zanima več iz te teme?
umetna inteligenca

Povezave



Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

ATELJE HERTIŠ d.o.o.

Laznica 63, 2341 Limbuš, Tel: 02 663 30 03
Se trudite povečati prodajo in privabiti nove stranke? Zakaj ne bi kar izkoristili promet, ki gre mimo vašega podjetja? Ali pa enostavno pritegnili obiskovalce določenega dogodka? ... Več
Zlati partner

MIKROCOP d.o.o.

Ulica Ambrožiča Novljana 7, 1000 Ljubljana, Tel: 01 587 42 80
Mikrocop je vodilni ponudnik celovitih IT rešitev in storitev za digitalno poslovanje. S povečevanjem učinkovitosti in zagotavljanjem zakonske skladnosti podpira podjetja na ... Več
Zlati partner

BROTHER CEE GmbH

Glavna cesta 46, 4202 Naklo, Tel: 030 600 474
Dejavni so v 28 državah, Brotherjevi izdelki pa so na voljo v več kot 100 državah.  Od ustanovitve korporacije leta 1934 si prizadevajo, da bi ideje prenesli v prakso z ustvarjanjem ... Več
Zlati partner

INFO-KOD d.o.o.

Cesta v Gorice 34a, 1000 Ljubljana, Tel: 01 256 24 99
Skupina INFO-KOD že dvajset let ponuja rešitve na področju avtomatske identifikacije, ki je podlaga za računalniško izmenjavo podatkov. INFO-KOD d.o.o. je eden izmed glavnih distributerjev ... Več