Domov Življenjski slog Izobraževanje Kako blizu je umetna inteligenca človeškim strokovnjakom?

Izobraževanje

28.09.2025 05:43

Deli z drugimi:

Kako blizu je umetna inteligenca človeškim strokovnjakom?

OpenAI je razvil GDPval, testni standard za oceno zmogljivosti AI v primerjavi s človeškimi strokovnjaki v ključnih industrijah. GPT-5-high in Claude Opus sta pokazala visoko stopnjo uspešnosti, kar nakazuje hitro približevanje AI realnim delovnim nalogam.

OpenAI je predstavil nov testni standard z imenom GDPval, ki ocenjuje, kako se njegovi AI modeli primerjajo s človeškimi strokovnjaki v ključnih industrijah. Test je del širše misije podjetja za razvoj umetne splošne inteligence (AGI), ki bi lahko opravljala gospodarsko pomembna dela.

GDPval se osredotoča na devet glavnih sektorjev, ki prispevajo k ameriškemu BDP, vključno z zdravstvo, financami, proizvodnjo in javnim sektorjem. Ocenjuje zmogljivost AI v 44 poklicih tako, da strokovnjaki primerjajo poročila, ki jih je ustvaril AI, s tistimi, ki jih je pripravil človek.

V prvi različici GDPval-v0 je OpenAI ugotovil, da je GPT-5-high, zmogljivejša različica GPT-5, dosegel ali presegel raven strokovnjakov v 40,6 odstotkov nalog. Claude Opus 4.1 podjetja Anthropic je dosegel še višjo oceno, 49 odstotkov, čeprav OpenAI del uspeha pripisuje vizualno privlačnim izhodom.

Čeprav test trenutno ocenjuje le naloge pisanja poročil, OpenAI načrtuje širitev na bolj interaktivne in raznolike delovne tokove. Podjetje vidi GDPval kot obetaven korak k temu, da strokovnjaki prenesejo rutinska opravila na AI in se osredotočijo na naloge z večjo dodano vrednostjo.

GPT-4o je pred 15 meseci dosegel le 13,7 odstotkov, kar kaže na hiter napredek. Ker tradicionalni testi, kot sta AIME in GPQA, dosegajo zasičenost, bi lahko GDPval postal ključno orodje za merjenje zmogljivosti AI v resničnem svetu.

Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Prijavi napako v članku

Vas zanima več iz te teme?

umetna inteligenca

Povezave

OpenAI

Sorodne novice

Odprti dostop do znanosti: kako povečati vidnost in ...

»Vpisal se bom na Vegovo«

Odkrij svojo prihodnost na Fakulteti za varnostne vede ...

Je 100 milijard za OpenAI sploh smiselnih?

Evropske raziskovalne priložnosti prihajajo v Novo ...

Kako razmišlja generacija Z: dijaki na Telemachovem ...

Kaj berejo drugi?

Test Xiaomi 17 – ali je njegova posebnost samo velikost?

UI ali avtomatizacija: kaj vaše podjetje v resnici potrebuje

Ali sploh še potrebujemo letalski način?

Test Huawei FreeBuds 5 Pro – dobra nadgradnja lanskoletnih

3D tiskalnik FlashForge Creator 4-A na DRAŽBI – profesionalni model z dvema glavama – izklicna cena 1 €

Marec je čas za mega prihranke na GeekBuying

Izpostavljeno

Kako piratske skupine pripravijo »crack« za igre?

Pozabljene klasike, ki si zaslužijo predelavo

Kako varen je v resnici vaš dom?

Moj vodič za Linux, ki vsebuje vse, kar sem se doslej naučil (Linux uporabljam nekaj mesecev), najpogostejše težave in še več. Foto: ChatGPT

Kako uporabljati Linux: od osnovnih ukazov do iskanja ...

Test Huawei MatePad 12X: papirnati zaslon, ki deluje ...

Najbolj brano

Evropa dobila odprtokodno alternativo za Microsoft ...

Prvi električni avtomobil z natrij-ionsko baterijo

Bluetooth dobiva največjo nadgradnjo doslej

Zaposlitveni oglasi

Vodja spletnih projektov (M/Ž) – ecommerce, B2B & web

Več

Vodja projektov implementacije Odoo (M/Ž) – proizvodnja in skladiščno poslovanje

Več

Najnovejši mali oglasi

260,00 €

Kočevje

Prodam nosilec za tri kolesa Thule

15,00 €

Trzin

HP 65 W napajalnik za prenosnike

145,00 €

Maribor

Realme 9 Pro 5G

400,00 €

GeForce RTX 4060 Ti, 8 GB DDR6

15,00 €

Ljubljana

Telefon Sony Xperia F3111

130,00 €

Ljubljana

Samsung s22

Dogodki

Mar

SEJEM DOM

Mar

CIO SUMMIT 2026

Vsi dogodki

Dražbe / Licitacije Prikaži vse

Trenutna cena 42,⁰⁰€

Pametna ura Joyroom Classic Series JR-FC2 Pro – IZKLICNA CENA 1 €!

Trenutna cena 350,⁰⁰€

Pametna tekaška steza Kingsmith WalkingPad C2 – TESTNI MODEL – IZKLICNA CENA 1 €!

Trenutna cena 27,⁰⁰€

Bluetooth zvočnik SBOX BT-60 TANGO – BEL – IZKLICNA CENA 1 €!

Trenutna cena 91,²⁷€

Gaming stol White Shark Monza – IZKLICNA CENA 1 €!

Partnerji Računalniških novic Prikaži vse

Nova Vizija, informacijski inženiring in svetovanje, d.d.

Celjska cesta 9, 3310 Žalec, Tel: 03 71 21 800

Odločitev, v katero informacijsko tehnologijo bi moralo vlagati vaše podjetje in v katere ne, je težka. Po eni strani želite biti tisti, ki je odgovoren za inovacije in rast ... Več

DEMAR d.o.o.

Gmajna 10, 1236 Trzin, Tel: 05 907 40 61

Drzne rešitve za spletne predstavitve z dušo Obstaja agencija, ki ponuja rešitve za podjetja, organizacije, znamke in posameznike. Za vse, ki pogrešajo sodobnost, kreativnost ... Več

Zlati partner