Računalništvo, telefonija
13.05.2025 07:00

Deli z drugimi:

Share

Wikipedia v nov boj proti umetni inteligenci

Boti umetne inteligence obremenjujejo pasovno širino Wikipedije, vendar je fundacija Wikimedia predstavila potencialno rešitev.

Boti pogosto povzročajo več težav kot povprečen človeški uporabnik, saj je večja verjetnost, da bodo preiskali tudi najbolj skrite kotičke Wikipedije. Pasovna širina za prenos večpredstavnosti se je na primer od januarja lani povečala za več kot 50%. Vendar promet ne prihaja od človeških bralcev, temveč od avtomatiziranih programov, ki nenehno prenašajo slike z odprto licenco, da bi jih posredovali modelom umetne inteligence.

Da bi rešili težavo, se je fundacija združila s podjetjem Kaggle, ki je v lasti Googla, da bi ustvarili vsebino Wikipedije »v razvijalcem prijazni, strojno berljivi obliki« v angleščini in francoščini.

»Namesto prebiranja ali razčlenjevanja surovega besedila člankov lahko uporabniki Kaggle neposredno delajo z dobro strukturiranimi JSON predstavitvami vsebine Wikipedije – zaradi česar je to idealno za modele učenja, gradnjo funkcij in testiranje obdelave naravnega jezika,« so zapisali v izjavi za javnost.

Podjetje Kaggle pa pravi, da je ponudba, ki je trenutno v beta različici, »takoj uporabna za modeliranje, primerjalno analizo, poravnavo, natančno nastavitev in raziskovalno analizo«.

Razvijalci umetne inteligence, ki bodo uporabljali nabor podatkov, bodo dobili »visoko uporabne elemente«, vključno z izvlečki člankov, kratkimi opisi, podatki o ključih in vrednostih v slogu t.i. “infoboxa”; povezavami do slik in jasno segmentiranimi razdelki člankov.

Vsa vsebina izhaja iz Wikipedije in je prosto licencirana pod dvema odprtokodnima licencama: Creative Commons priznanje avtorstva – deljenje pod enakimi pogoji 4.0 in GNU Free Documentation License (GFDL), čeprav se v nekaterih primerih lahko uporabljajo licence javne domene ali alternativne licence.

Videli smo, da organizacije uporabljajo manj sodelovalne pristope za spopadanje z grožnjo botov umetne inteligence. Reddit je uvedel vse strožje kontrole, da bi preprečil botom dostop do platforme, potem ko je leta 2023 uvedel kontroverzno spremembo svojih pravilnikov API-ja, ki je razvijalce prisilila k plačilu.

Številne druge organizacije, kot je The New York Times, so podjetja, ki se ukvarjajo z umetno inteligenco tožile zaradi botov, ki jih uporabljajo, čeprav je njihova motivacija bolj finančna kot povezana z učinkovitostjo. Tožba trdi, da je izdelovalec ChatGPT OpenAI odgovoren za milijardne odškodnine, ker je brez dovoljenja prebiral njihove članke za učenje svojih modelov umetne inteligence.


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku
Vas zanima več iz te teme?
Wikipedia


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

ARCHUS.SI d.o.o.

Cankarjeva ulica 9c, 6000 Koper/capodistria, Tel: 070 890 096
O podjetju Archus.si  ARCHUS.SI d.o.o. je podjetje iz Kopra. Kot prvi v Sloveniji so leta 2008 oz. 2009 začeli ponujati nekaj aktualnih in zanimivih produktov nove tehnologije, kot ... Več
Zlati partner

RITTAL d.o.o.

Letališka cesta 16, 1000 Ljubljana, Tel: 01 546 63 70
Rittal spodbuja inovacije in živi svoje vrednote To je Rittal. Globalni igralec, vodilni inovator, družinsko podjetje in zgleden delodajalec. Rittal zgodba Prihodnost Rittala se je ... Več
Zlati partner

MOJA ZAPOSLITEV d.o.o., Optius.com

Borovec 2, 1236 Trzin, Tel: 01 810 02 00
Optius.com - Karierni portal za nove čase Karierni portal Optius.com je zaposlitveni portal, namenjen tistim, ki iščejo zaposlitev in tistim, ki iščejo nov kader. ... Več
Bronasti partner

AKREDON d.o.o., Toner123.si

Moste 30, 4274 Žirovnica, Tel: 051 392 793
Spletna trgovina Toner123.si V spletni trgovini Toner123.si lahko izbirate med bogato ponudbo originalnih in kakovostnih kompatibilnih tonerjev ali kartuš za tiskalnike svetovno znanih ... Več