Aplikacije in dodatni programi
17.10.2020 16:56
Posodobljeno 4 leta nazaj.

Deli z drugimi:

Share

Prva aplikacija za oceno težavnosti besedila v slovenskem jeziku

Prva aplikacija za oceno težavnosti besedila v slovenskem jeziku
Prva aplikacija za oceno težavnosti besedila v slovenskem jeziku

V okviru projekta Za kakovost slovenskih učbenikov (KaUč – https://kauc.splet.arnes.si/) je nastala prva aplikacija za oceno težavnosti besedil v slovenskem jeziku (https://orodja.cjvt.si/berljivost). Aplikacija je brezplačno dostopna javnosti, še zlasti je namenjena učiteljem, urednikom, novinarjem in drugim uporabnikom, ki se pri svojem delu srečujejo z oblikovanjem besedil za različne ciljne skupine. Aplikacija omogoča preverjanje in preurejanje besedil v obsegu do 5.000 znakov.

Kako deluje aplikacija?

Spletna aplikacija omogoča uporabniku, da vanjo prilepi svoje besedilo, ki ga aplikacija analizira in opozori na potencialne slabosti, ki bi lahko prispevale k manjši berljivosti besedila. Aplikacija uporablja v svetu pogosto uporabljene formule berljivosti, nekaj statistik vnesenega besedila in v svetu povsem nov pristop, ki temelji na zadnji generaciji metod umetne inteligence za razumevanje naravnega jezika. Večina uporabljenih formul za merjenje berljivosti je bila zasnovana za besedila v angleškem jeziku, na katerih je tudi umerjeno njihovo delovanje.

V projektu so za slovenščino prilagodili deset v svetu najpogosteje uporabljanih mer berljivosti (npr. avtomatski indeks berljivosti ARI, LIX, indeks Coleman-Liau, mero Gobbledygook, Fleschova enostavnost branja itd.). Uspešnost desetih mer berljivosti ter osmih dodatnih kriterijev berljivosti so prilagodili slovenščini tako, da so jih najprej ocenili na veliki količini besedil iz petih skupin: otroških revijah, splošnih revijah, časopisih, tehničnih revijah in zapisnikih sej državnega zbora. Te skupine besedil imajo različne ciljne publike, zaradi česar uporabljajo različne stile pisanja, ki jih formule in kriteriji berljivosti zaznajo in ločijo. Dodatno so mere in kriterije berljivosti umerili tudi na zbirki besedil iz več kot stotih trenutno veljavnih učbenikov in beril ter učbeniških gradiv iz korpusa Gigafida.

Razvili so tudi več povsem novih mer berljivosti, ki temeljijo na zadnji generaciji globokih nevronskih mrež. Te so najprej naučene na ogromnih množicah besedil (več milijard besed, npr. celotna Wikipedija in besedila s spleta). Prednost nekaterih od razvitih metod je, da ne potrebujejo ročno pripravljenih množic za njihovo umerjanje, ampak delujejo tudi v jezikih z manj jezikovnimi viri, kjer takšne množice ne obstajajo. Na angleščini in slovenščini so pokazali, da novo razvite mere v povprečju delujejo boljše od vseh obstoječih in da jih je enostavno prilagajati za nove jezike. Testirali so več lastnosti novo razvitih mer in pokazali prednosti pred obstoječimi metodami. Predlagan pristop je povsem nov in je v postopku objave v kakovostni znanstveni reviji, istočasno pa je tudi že objavljen na prosto dostopnem portalu znanstvenih predobjav ArXiv.

Kje dostopati do aplikacije?

Razvito orodje za analizo berljivosti je prosto dostopno na strežniku Centra za jezikovne vire in tehnologije Univerze v Ljubljani na naslovu https://orodja.cjvt.si/berljivost. V nadaljevanju projekta bodo aplikacijo, glede na povratne informacije uporabnikov, še dopolnjevali in prilagajali potrebam in izsledkom novih raziskav.

Kdo je razvil aplikacijo?

Pri pripravi aplikacije je sodelovala interdisciplinarna skupina strokovnjakov iz Univerze v Ljubljani (Fakultete za računalništvo in informatiko, Pedagoške fakultete, Center za jezikovne viri in tehnologije), Inštituta Jožef Stefan in Univerze v Mariboru (Pedagoške fakultete). Razvoj aplikacije je vodil prof. dr. Marko Robnik-Šikonja s Fakultete za računalništvo in informatiko Univerze v Ljubljani.


Prijavi napako v članku
Vas zanima več iz te teme?
aplikacije za telefone Android aplikacije


Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

CARPEDIEM d.o.o.

Soška cesta 17, 5250 Solkan, Tel: 05 330 00 50
Če ni na spletu, ne obstaja. To je vodilo potrošnikov, ko iščejo in se odločajo za nakup določenega izdelka ali storitev. Identiteta podjetja je neposredno povezana s spletno ... Več
Zlati partner

GERI COMPUTER d.o.o., Notesniki.si

Titova cesta 49, 2000 Maribor, Tel: 051 444 252
Iščete odlično računalniško trgovino, ki vas lahko postreže tako osebno kot tudi na spletu? Računalniško trgovino, ki se lahko pohvali s portfeljem (namiznih in prenosnih) ... Več

InfoQ d.o.o., informacijske rešitve

Cankarjeva cesta 6a, 8330 Metlika, Tel: 041 630 449
Podjetje InfoQ d.o.o. razvija programske rešitve za proizvodna podjetja, ki potrebujejo SCADA (Supervisory Control and Data Acquisition) in MES (Manufacturing Execution System) skupaj ... Več
Bronasti partner

Agencija POTI – Z znanjem do cilja!

Stegne 7, 1000 Ljubljana, Tel: 01 511 39 21
Agencija POTI – Z znanjem do cilja! Agencija POTI, izobraževalna, svetovalna in založniška družba, si je v več kot 20. letih delovanja, pridobila obilico znanja in izkušenj ... Več