Telekom Slovenije sodeluje v evropskem projektu LLMs4EU za izgradnjo evropskega velikega jezikovnega modela LLM

Nekaterim evropskim jezikom namreč grozi, da bodo zaradi pomanjkanja virov za učenje jezikovnih modelov ostali ob strani pri razvoju generativne umetne inteligence. Projekt združuje gospodarske in akademske akterje, da bi evropskim, zlasti malim in srednje velikim podjetjem zagotovil dostop do orodij in virov, s katerimi bodo lahko postala konkurenčna na področju jezikovnih tehnologij, zlasti velikih jezikovnih modelov. Telekom Slovenije s sodelovanjem v projektu izkazuje svojo naprednost in družbeno odgovornost, saj skrbi za aktivno vključevanje slovenskega jezika v rešitve prihodnosti, ki temeljijo na generativni umetni inteligenci.
Cilj projekta je, da bodo LLM in vsa orodja, potrebna za njihovo uporabo, na voljo v vseh jezikih EU na odprt način. To bo doseženo z izkoriščanjem obstoječih evropskih programov in kompetenc. Orodja bodo dostopna evropskim podjetjem in bodo zajemala vse korake od treniranja LLM do zagotavljanja njihove skladnosti z evropsko zakonodajo, kot sta Akt o umetni inteligenci (AI Act) in Splošna uredba o varstvu podatkov (GDPR).
Vesna Prodnik, članica uprave Telekoma Slovenije, je pri tem izpostavila: »V Telekomu Slovenije vračamo družbi, iz katere izhajamo, spoštujemo lokalno okolje in cenimo slovenski jezik. S sodelovanjem v projektu aktivno delujemo na tem, da je slovenski jezik enakovredno zastopan skupaj z ostalimi svetovnimi jeziki pri razvoju tehnoloških rešitev, ki temeljijo na generativni umetni inteligenci. Te rešitve bodo močno poenostavile različna opravila in procese ter bodo v prihodnje postale vse bolj nepogrešljiv del našega vsakdana – doma, v prostem času in pri delu. Zato je izjemno pomembno, da bo slovenski jezik v digitalnem okolju ustrezno zastopan, slovenski jezik pa bo pri uvedbi tehnoloških inovacij namesto ovire predstavljal kulturno raznolikost in kakovostno uporabniško izkušnjo za domače uporabnike.«
Konzorcij, ustanovljen okoli koordinatorja projekta Alliance for Language Technologies (ALT-EDIC), vključuje organizacije, ki delujejo v več kot 19 državah, kar zagotavlja dobro geografsko in jezikovno pokritost. V okviru projekta se bodo razvili različni primeri uporabe, da se dokaže sposobnost evropskih akterjev za sodelovanje pri ustvarjanju prilagojenih orodij za različne gospodarske sektorje, projekt pa se še posebej osredotoča na pet področij: energetika, telekomunikacije, turizem, javne storitve in znanost. Pokritost vseh jezikov EU bo zagotovljena z ustvarjanjem in pridobivanjem potrebnih podatkovnih nizov v okviru projekta.
Telekom Slovenije bo skupaj z drugimi evropskimi telekomi, kot so Orange, KPN in Tiscali, pripravil potrebne scenarije in podatke za učenje modela s področja telekomunikacij. Poleg Telekoma Slovenije na projektu sodelujejo tudi slovenski partnerji Institut Jožef Stefan (IJS), Univerza v Ljubljani, Arctur, Xlab in Event registry.
Projekt je financiran iz programa za digitalno Evropo in bo trajal tri leta. Zagonski (t. i. kick-off) sestanek projekta je potekal konec meseca marca 2025 v Parizu.
Prijavi napako v članku