Izobraževanje
28.09.2025 05:43

Deli z drugimi:

Share

Kako blizu je umetna inteligenca človeškim strokovnjakom?

OpenAI je razvil GDPval, testni standard za oceno zmogljivosti AI v primerjavi s človeškimi strokovnjaki v ključnih industrijah. GPT-5-high in Claude Opus sta pokazala visoko stopnjo uspešnosti, kar nakazuje hitro približevanje AI realnim delovnim nalogam.

OpenAI je predstavil nov testni standard z imenom GDPval, ki ocenjuje, kako se njegovi AI modeli primerjajo s človeškimi strokovnjaki v ključnih industrijah. Test je del širše misije podjetja za razvoj umetne splošne inteligence (AGI), ki bi lahko opravljala gospodarsko pomembna dela.

GDPval se osredotoča na devet glavnih sektorjev, ki prispevajo k ameriškemu BDP, vključno z zdravstvo, financami, proizvodnjo in javnim sektorjem. Ocenjuje zmogljivost AI v 44 poklicih tako, da strokovnjaki primerjajo poročila, ki jih je ustvaril AI, s tistimi, ki jih je pripravil človek.

V prvi različici GDPval-v0 je OpenAI ugotovil, da je GPT-5-high, zmogljivejša različica GPT-5, dosegel ali presegel raven strokovnjakov v 40,6 odstotkov nalog. Claude Opus 4.1 podjetja Anthropic je dosegel še višjo oceno, 49 odstotkov, čeprav OpenAI del uspeha pripisuje vizualno privlačnim izhodom.

Čeprav test trenutno ocenjuje le naloge pisanja poročil, OpenAI načrtuje širitev na bolj interaktivne in raznolike delovne tokove. Podjetje vidi GDPval kot obetaven korak k temu, da strokovnjaki prenesejo rutinska opravila na AI in se osredotočijo na naloge z večjo dodano vrednostjo.

GPT-4o je pred 15 meseci dosegel le 13,7 odstotkov, kar kaže na hiter napredek. Ker tradicionalni testi, kot sta AIME in GPQA, dosegajo zasičenost, bi lahko GDPval postal ključno orodje za merjenje zmogljivosti AI v resničnem svetu.


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku
Vas zanima več iz te teme?
umetna inteligenca

Povezave



Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

M-SISTEM d.o.o.

Pot na Drenikov vrh 12, 1000 Ljubljana, Tel: 041 693 934
Nov IT sistem, bodisi strojni ali programski, je lahko velika naložba. Da bi jo karseda najbolje izkoristili, je pomembno, da izberete pravega IT dobavitelja in ponudnika programskih ... Več

RETTRO d.o.o., vaš partner v razvoju IT-rešitev

Šlandrova 4b, 1000 Ljubljana, Tel: 031 313 312
Mikro podjetje Rettro d.o.o. je specializirano za razvoj različnih informacijskih sistemov z najnovejšimi tehnologijami po meri naročnika. Znanje in izkušnje Rettrovih strokovnjakov ... Več
Zlati partner

ELKOTEX d.o.o.

Magistrova ulica 1, 1000 Ljubljana, Tel: 01 583 79 10
Elkotex, d. o. o., je grosistično podjetje za nadaljnjo prodajo podjetjem, fizičnim in spletnim trgovinam ter trgovskim verigam. So distributer IT opreme in uporabne elektronike, ... Več

MITS d.o.o.

Butari 20a, 6272 Gračišče, Tel: 040 895 342
Bodite pozorni pri izbiri pravega ponudnika programskih rešitev za gostinstvo, hotelirstvo in druge storitvene dejavnosti. Večina ponuja le generične oblike rešitev, ki ne zadostujejo ... Več