Računalništvo, telefonija
18.04.2025 09:30
Posodobljeno 9 mesecev nazaj.

Deli z drugimi:

Share

Wikipedia z drugačno taktiko za preprečevanje strganja podatkov

Wikipedia poskuša odvrniti razvijalce umetne inteligence od strganja (angl. scraping) svoje platforme, in sicer z izdajo nabora podatkov, ki je posebej optimiziran za usposabljanje modelov umetne inteligence.

Fundacija Wikimedia je objavila, da se je povezala s Kaggleom, platformo skupnosti podatkovnih znanosti v lasti Googla, ki gosti podatke za strojno učenje, da bi objavila beta nabor podatkov »strukturirane vsebine Wikipedie v angleščini in francoščini«.

Wikimedia pravi, da je nabor podatkov, ki ga gosti Kaggle, »zasnovan z mislijo na delovne tokove strojnega učenja«, kar razvijalcem umetne inteligence lajša dostop do strojno berljivih podatkov člankov za modeliranje, fino nastavitev, primerjalno analizo, usklajevanje in analizo. Vsebina v naboru podatkov je odprto licencirana in od 15. aprila vključuje povzetke raziskav, kratke opise, povezave do slik, podatke iz infoboxov in razdelke člankov.

»Dobro strukturirane JSON reprezentacije vsebine Wikipedie«, ki so na voljo uporabnikom Kagglea, bi morale biti privlačnejša alternativa »strganju ali razčlenjevanju surovega besedila člankov”, trdi Wikimedia. To je težava, ki trenutno obremenjuje strežnike Wikipedie, saj avtomatizirani boti umetne inteligence neusmiljeno porabljajo pasovno širino platforme. Wikimedia že ima dogovore o deljenju vsebine z Googlom in platformo Internet Archive, vendar bi moralo partnerstvo s Kaggleom te podatke narediti bolj dostopne manjšim podjetjem in neodvisnim podatkovnim znanstvenikom.

»Kot mesto, kamor prihaja skupnost strojnega učenja po orodja in teste, je Kaggle izjemno navdušen, da bo gostitelj podatkov Fundacije Wikimedia,« je dejala Brenda Flynn, vodja partnerstev pri Kaggleu. »Kaggle z veseljem prispeva k temu, da bodo ti podatki ostali dostopni, na voljo in uporabni.«


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Bronasti partner

Agencija POTI – Z znanjem do cilja!

Stegne 7, 1000 Ljubljana, Tel: 01 511 39 21
Agencija POTI – Z znanjem do cilja! Agencija POTI, izobraževalna, svetovalna in založniška družba, si je v več kot 20. letih delovanja, pridobila obilico znanja in izkušenj ... Več
Bronasti partner

BIROMATIK NT d.o.o.

Ulica Staneta Severja 18, 2000 Maribor, Tel: 02 300 03 60
Storitve podjetja Biromatik NT Prednosti BIROMATIK-a so v izdelavi »butičnih programskih produktov«. To so specialne rešitve po želji uporabnikov. Vsaka stranka, ne glede ... Več

MVM SERVIS d.o.o.

Na trgu 28, 3330 Mozirje, Tel: 031 611 116
MVM SERVIS, spletne in grafične storitve, d. o. o. je podjetje, specializirano za celovito ponudbo kreativnih grafičnih rešitev na ključ. Od konkurence jih ločuje popolnoma lastna ... Več

MORDICOM d.o.o.

Šolska ulica 40, 5250 Solkan, Tel: 05 330 03 60
Skoraj nemogoče je preceniti vpliv rešitev za načrtovanje virov podjetja (ERP) v sodobnem poslovnem svetu. ERP sistemi so nadomestili nepovezane delovne tokove in nezdružljiva ... Več