Aplikacije in dodatni programi
17.10.2020 16:56
Posodobljeno 3 leta nazaj.

Deli z drugimi:

Share

Prva aplikacija za oceno težavnosti besedila v slovenskem jeziku

Prva aplikacija za oceno težavnosti besedila v slovenskem jeziku
Prva aplikacija za oceno težavnosti besedila v slovenskem jeziku

V okviru projekta Za kakovost slovenskih učbenikov (KaUč – https://kauc.splet.arnes.si/) je nastala prva aplikacija za oceno težavnosti besedil v slovenskem jeziku (https://orodja.cjvt.si/berljivost). Aplikacija je brezplačno dostopna javnosti, še zlasti je namenjena učiteljem, urednikom, novinarjem in drugim uporabnikom, ki se pri svojem delu srečujejo z oblikovanjem besedil za različne ciljne skupine. Aplikacija omogoča preverjanje in preurejanje besedil v obsegu do 5.000 znakov.

Kako deluje aplikacija?

Spletna aplikacija omogoča uporabniku, da vanjo prilepi svoje besedilo, ki ga aplikacija analizira in opozori na potencialne slabosti, ki bi lahko prispevale k manjši berljivosti besedila. Aplikacija uporablja v svetu pogosto uporabljene formule berljivosti, nekaj statistik vnesenega besedila in v svetu povsem nov pristop, ki temelji na zadnji generaciji metod umetne inteligence za razumevanje naravnega jezika. Večina uporabljenih formul za merjenje berljivosti je bila zasnovana za besedila v angleškem jeziku, na katerih je tudi umerjeno njihovo delovanje.

V projektu so za slovenščino prilagodili deset v svetu najpogosteje uporabljanih mer berljivosti (npr. avtomatski indeks berljivosti ARI, LIX, indeks Coleman-Liau, mero Gobbledygook, Fleschova enostavnost branja itd.). Uspešnost desetih mer berljivosti ter osmih dodatnih kriterijev berljivosti so prilagodili slovenščini tako, da so jih najprej ocenili na veliki količini besedil iz petih skupin: otroških revijah, splošnih revijah, časopisih, tehničnih revijah in zapisnikih sej državnega zbora. Te skupine besedil imajo različne ciljne publike, zaradi česar uporabljajo različne stile pisanja, ki jih formule in kriteriji berljivosti zaznajo in ločijo. Dodatno so mere in kriterije berljivosti umerili tudi na zbirki besedil iz več kot stotih trenutno veljavnih učbenikov in beril ter učbeniških gradiv iz korpusa Gigafida.

Razvili so tudi več povsem novih mer berljivosti, ki temeljijo na zadnji generaciji globokih nevronskih mrež. Te so najprej naučene na ogromnih množicah besedil (več milijard besed, npr. celotna Wikipedija in besedila s spleta). Prednost nekaterih od razvitih metod je, da ne potrebujejo ročno pripravljenih množic za njihovo umerjanje, ampak delujejo tudi v jezikih z manj jezikovnimi viri, kjer takšne množice ne obstajajo. Na angleščini in slovenščini so pokazali, da novo razvite mere v povprečju delujejo boljše od vseh obstoječih in da jih je enostavno prilagajati za nove jezike. Testirali so več lastnosti novo razvitih mer in pokazali prednosti pred obstoječimi metodami. Predlagan pristop je povsem nov in je v postopku objave v kakovostni znanstveni reviji, istočasno pa je tudi že objavljen na prosto dostopnem portalu znanstvenih predobjav ArXiv.

Kje dostopati do aplikacije?

Razvito orodje za analizo berljivosti je prosto dostopno na strežniku Centra za jezikovne vire in tehnologije Univerze v Ljubljani na naslovu https://orodja.cjvt.si/berljivost. V nadaljevanju projekta bodo aplikacijo, glede na povratne informacije uporabnikov, še dopolnjevali in prilagajali potrebam in izsledkom novih raziskav.

Kdo je razvil aplikacijo?

Pri pripravi aplikacije je sodelovala interdisciplinarna skupina strokovnjakov iz Univerze v Ljubljani (Fakultete za računalništvo in informatiko, Pedagoške fakultete, Center za jezikovne viri in tehnologije), Inštituta Jožef Stefan in Univerze v Mariboru (Pedagoške fakultete). Razvoj aplikacije je vodil prof. dr. Marko Robnik-Šikonja s Fakultete za računalništvo in informatiko Univerze v Ljubljani.


Prijavi napako v članku
Vas zanima več iz te teme?
aplikacije za telefone Android aplikacije


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Zlati partner

TEHNOLOŠKI PARK LJUBLJANA d.o.o.

Tehnološki park 19, 1000 Ljubljana, Tel: 01 620 34 01
Tehnološki park Ljubljana (TP LJ) kot mednarodni tehnološki hub, kjer se stikajo vrhunske tehnologije, srečujejo najboljša razvojna podjetja in nastajajo nove tehnološke zgodbe. ... Več
Zlati partner

UL FRI

Večna pot 113, 1000 Ljubljana, Tel: 01 479 81 03
Spoznali smo že, da so računalniki neverjetni stroji, za katere se zdi, da ni meja, da so sposobni narediti vse, kar si človek zamisli in tudi tisto, kar si danes večina ljudi še ... Več
Zlati partner

SMART COM d.o.o.

Brnčičeva ulica 45, 1000 Ljubljana, Tel: 01 5611 606
Smart Com udejanja vaše vizije Težko je slediti razvoju informacijskega sveta. Rešimo en problem in že se pojavita dva nova. Kako ohraniti stik z razvojem tehnologije? Odgovor na ... Več
Zlati partner

INFO-KOD d.o.o.

Cesta v Gorice 34a, 1000 Ljubljana, Tel: 01 256 24 99
Skupina INFO-KOD že dvajset let ponuja rešitve na področju avtomatske identifikacije, ki je podlaga za računalniško izmenjavo podatkov. INFO-KOD d.o.o. je eden izmed glavnih distributerjev ... Več