Računalništvo, telefonija
Digitalizacija
Aplikacije in dodatni programi
26.01.2026 11:26
Posodobljeno 13 minut nazaj.

Deli z drugimi:

Share

Poznate velike jezikovne modele za slovenščino?

Razvoj umetne inteligence in digitalnih orodij ne spreminja le načina dela in komunikacije, temveč tudi vlogo jezika v sodobni družbi.

Veliki jezikovni modeli, ki smo jih v preteklih letih spoznali s porastom umetne inteligence in njeno uporabo v vsakdanjem življenju in delu, so postali pomembni za vsak jezik, tudi za slovenščino.

Da slovenščina ostaja enakovredno prisotna v digitalnem okolju, pa so ključne jezikovne tehnologije, ki povezujejo računalništvo, jezikoslovje in podatkovno znanost. Na tem področju ima pomembno vlogo Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT UL), ki deluje v tesni povezavi s Fakulteto za računalništvo in informatiko (FRI).

Na nedavni predstavitvi raziskovalnih dosežkov so na FRI pokazali, kako se lahko sodobne računalniške metode uporabijo za razvoj slovenščine in njeno uporabo v digitalnih storitvah, izobraževanju in raziskavah.

Veliki jezikovni modeli za slovenščino

Med osrednjimi dosežki je nova različica velikega jezikovnega modela za slovenščino GaMS 3. Nadgradnja omogoča obdelavo daljših besedil in predstavlja pomemben korak k zmogljivejšim jezikovnim orodjem v slovenskem prostoru. Model nastaja v okviru raziskovalnih projektov in je namenjen tako razvoju aplikacij kot tudi znanstvenim analizam jezika.

Ob tem raziskovalci spodbujajo tudi sodelovanje širše javnosti. Slovenska pogovorna arena uporabnikom omogoča primerjavo odgovorov različnih jezikovnih modelov, s čimer prispeva k njihovemu izboljševanju in prilagajanju slovenščini.


Modele in korpuse na povezavah lahko preizkusite.


Korpusi s skoraj dvema milijardama besed kot temelj jezikovnih raziskav

Razvoj jezikovnih tehnologij temelji na kakovostnih podatkih. Če teh ni, je vse učenje jezikovnega modela zaman. Najnovejša različica referenčnega korpusa pisne slovenščine Gigafida 2.2 s tem nima težav, saj vključuje skoraj 800 milijonov besed in predstavlja eno ključnih zbirk za raziskovanje sodobnega jezika.

Poleg korpusa Gigafida 2.2 deluje tudi spremljevalni korpus Trendi, ki zajema besedila s številnih slovenskih medijskih portalov in omogoča vpogled v aktualno rabo jezika. Njegov obseg že presega milijardo besed.

Takšne zbirke niso pomembne le za jezikoslovce, temveč tudi za razvoj orodij za samodejno analizo besedil, prevajanje in umetno inteligenco.

Digitalni slovarji in sodelovanje uporabnikov

CJVT razvija in vzdržuje več digitalnih slovarjev, ki so namenjeni različnim skupinam uporabnikov – od govorcev slovenščine kot tujega jezika do prevajalcev in raziskovalcev. Med njimi so kolokacijski slovar, slovar sopomenk ter slovensko-madžarski slovar. Posebnost nekaterih slovarjev je aktivno vključevanje uporabnikov, katerih predlogi se strokovno pregledajo in postopno vključujejo v slovarske baze.

Jezikovne tehnologije v izobraževanju

Pomemben praktičen prispevek predstavlja tudi orodje Online Notes, ki omogoča sprotno strojno prevajanje predavanj v tuje jezike. Orodje olajša spremljanje študija tujim študentom in študentom z različnimi oviranostmi, hkrati pa podpira rabo slovenščine v visokošolskem prostoru.

Jezik uporabnikom približujejo tudi igriva orodja. Na portalu CJVT Igre so na voljo nove jezikovne igre (Kombinator in Ugibanka), ki na dostopen način spodbujajo učenje besedišča, sopomenk in kolokacij.

Umetna inteligenca kot orodje za analizo jezika in literature

Raziskave na CJVT kažejo, da se veliki jezikovni modeli lahko uporabljajo tudi za analizo literarnih besedil. Primer študije pravljic o Pepelki ponazarja, kako lahko umetna inteligenca pomaga pri prepoznavanju motivov in vzorcev ter dopolnjuje klasične raziskovalne pristope.

Računalništvo in jezik z roko v roki

Dosežki na področju jezikoslovja potrjujejo, da je danes prihodnost razvoja jezika tesno povezana z računalniško izobrazbo. Jezikovne tehnologije so primer področja, kjer se znanja programiranja, umetne inteligence in obdelave podatkov neposredno povezujejo z družbenimi in kulturnimi vprašanji. Prav takšne interdisciplinarne povezave študentom in raziskovalcem na Univerzi v Ljubljani odpirajo nove priložnosti za ustvarjanje, raziskovanje in razvoj rešitev za digitalno družbo.

Več informacij o dejavnostih in orodjih je na voljo na spletni strani fri.uni-lj.si in cjvt.si.


Vam je bila novica zanimiva?

Povejte prijateljem, da ste novico prebrali na Računalniških novicah.

Share
Prijavi napako v članku
Vas zanima več iz te teme?
umetna inteligenca

Članek je pripravljen v sodelovanju s partnerjem UL FRI
Za več informacij so vam na voljo pri UL FRI
Ob kontaktu povejte, da ste objavo zasledili v Računalniških novicah.

Želite biti obveščeni o novostih, ki jih pripravljamo s partnerjem UL FRI? Vpišite svoj e-mail in se prijavite na BREZPLAČNE e-novice, od katerih se lahko kadarkoli odjavite.




Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Zlati partner

INFO-KOD d.o.o.

Cesta v Gorice 34a, 1000 Ljubljana, Tel: 01 256 24 99
Skupina INFO-KOD že dvajset let ponuja rešitve na področju avtomatske identifikacije, ki je podlaga za računalniško izmenjavo podatkov. INFO-KOD d.o.o. je eden izmed glavnih distributerjev ... Več
Zlati partner

DATALAB SI d.o.o.

Hajdrihova 28c, 1000 Ljubljana, Tel: 01 252 89 00
Datalab tehnologije Podjetje Datalab Tehnologije d.d. se ukvarja z razvojem poslovne programske opreme za vodenje podjetij. S poslovnim informacijskim sistemom PANTHEON povečate učinkovitost ... Več

VideoExpert.eu – trgovina s profesionalno video opremo

Gunceljska cesta 14, 1210 Ljubljana Šentvid, Tel: 01 512 22 11
Spletna trgovina VideoExpert.eu Spletna trgovina videoexpert.eu je vodilna slovenska trgovina s profesionalno video, cinema in broadcast opremo. Njihovo vodilo je nuditi najprimernejše ... Več
Diamantni partner

OptiCyber3 d.o.o.

Ulica Jožeta Jame 14, 1210 Ljubljana Šentvid, Tel: 070 420 063
OptiCyber3 poskrbi za zanesljivo zaščito vašega računalniškega sistema Kako poskrbeti za zanesljivo zaščito računalniških sistemov? Za ustrezno varnostno zaščito in kar ... Več