Računalništvo, telefonija
18.04.2025 09:30
Posodobljeno 2 meseca nazaj.

Deli z drugimi:

Share

Wikipedia z drugačno taktiko za preprečevanje strganja podatkov

Wikipedia poskuša odvrniti razvijalce umetne inteligence od strganja (angl. scraping) svoje platforme, in sicer z izdajo nabora podatkov, ki je posebej optimiziran za usposabljanje modelov umetne inteligence.

Fundacija Wikimedia je objavila, da se je povezala s Kaggleom, platformo skupnosti podatkovnih znanosti v lasti Googla, ki gosti podatke za strojno učenje, da bi objavila beta nabor podatkov »strukturirane vsebine Wikipedie v angleščini in francoščini«.

Wikimedia pravi, da je nabor podatkov, ki ga gosti Kaggle, »zasnovan z mislijo na delovne tokove strojnega učenja«, kar razvijalcem umetne inteligence lajša dostop do strojno berljivih podatkov člankov za modeliranje, fino nastavitev, primerjalno analizo, usklajevanje in analizo. Vsebina v naboru podatkov je odprto licencirana in od 15. aprila vključuje povzetke raziskav, kratke opise, povezave do slik, podatke iz infoboxov in razdelke člankov.

»Dobro strukturirane JSON reprezentacije vsebine Wikipedie«, ki so na voljo uporabnikom Kagglea, bi morale biti privlačnejša alternativa »strganju ali razčlenjevanju surovega besedila člankov”, trdi Wikimedia. To je težava, ki trenutno obremenjuje strežnike Wikipedie, saj avtomatizirani boti umetne inteligence neusmiljeno porabljajo pasovno širino platforme. Wikimedia že ima dogovore o deljenju vsebine z Googlom in platformo Internet Archive, vendar bi moralo partnerstvo s Kaggleom te podatke narediti bolj dostopne manjšim podjetjem in neodvisnim podatkovnim znanstvenikom.

»Kot mesto, kamor prihaja skupnost strojnega učenja po orodja in teste, je Kaggle izjemno navdušen, da bo gostitelj podatkov Fundacije Wikimedia,« je dejala Brenda Flynn, vodja partnerstev pri Kaggleu. »Kaggle z veseljem prispeva k temu, da bodo ti podatki ostali dostopni, na voljo in uporabni.«


Prijavi napako v članku


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Računalniške storitve mITch, Mitja Mihelič s.p.

Čolnarska ulica 3, 1310 Ribnica, Tel: 05 125 8575, 051 258 575
Ali vaše podjetje potrebuje oddelek za IT? Nekoč dostopne le za velike korporacije, danes so IT funkcije na voljo podjetjem vseh velikosti po zaslugi računalništva v oblaku in ... Več

NGN MEDIA

Ulica 15. maja 10b, 6000 Koper/capodistria, Tel: 041 694 668
Ste na spletu? Če niste, ne obstajate. To je resnica digitalne dobe. Potrošniki iščejo najhitrejšo pot do izdelka ali storitve. Na vas je, da jim to omogočite, bodisi prek spletne ... Več

NJORKA d.o.o.

Tovarniška cesta 4c, 5270 Ajdovščina, Tel: 05 901 21 22
Podjetja se srečujejo z vse več podatki, za njihovo učinkovito obravnavo pa potrebujejo številne programe in aplikacije, kar sčasoma vodi v administracijsko zmešnjavo in posledično ... Več

COPIA BIRO d.o.o.

Koprska ulica 106b, 1000 Ljubljana, Tel: 01 242 58 00
Podjetje Copia biro d.o.o. je bilo ustanovljeno leta 2012. Od leta 1980 do leta 2012 je delovalo kot sektor v okviru podjetja Copia d.o.o. Leta 2013 so se preselili v poslovne prostore ... Več