25.11.2012 09:24
Posodobljeno 10 let nazaj.

Deli z drugimi:

Share

4 brezplačna orodja za optično prepoznavanje znakov – OCR

Verjeli ali ne, nekateri ljudje še vedno dokumente tiskajo na fizični kos papirja. Prav zaradi tega smo se potrudili in na enem mestu zbrali nekatera najboljša brezplačna OCR orodja.
OnlineOCR je prav gotovo najboljše brezplačno orodje za prepoznavanje znakov.
OnlineOCR je prav gotovo najboljše brezplačno orodje za prepoznavanje znakov.

Programska oprema za optično prepoznavanje znakov (angl. Optical Character Recognition – OCR) pretvarja papirne dokumente in datoteke PDF v elektronsko obliko. Programe OCR uporabljamo v povezavi z računalnikom in optičnim bralnikom (skenerjem). S slednjim skopiramo natisnjeno besedilo na računalnik, kjer ga lahko v elektronski obliki shranimo ali denimo preberemo in povečamo z ustrezno programsko opremo. Slepi in slabovidni lahko s pomočjo naprednejših programov OCR berejo tiskane vsebine, na primer knjige, revije, dopise in druge tiskovine. Programi OCR lahko rešujejo tudi težave pri učenju, denimo v primerih, ko učeči težko berejo ali pa ko imajo zaradi gibalnih in fizičnih prizadetosti omejene možnosti rokovanja s tiskanim materialom.

Kako deluje OCR?

Knjigo ali drugo tiskovino vložimo v optični bralnik, povezan z računalnikom. Bralnik posname sliko dokumenta in jo v elektronski obliki posreduje računalniku. Program OCR nato pretvori informacije s slike v besedilo, to pa lahko nato prebere bralnik besedila, ki prav tako teče na računalniku. Programi OCR praviloma ne zmorejo brati rokopisa. Optično prepoznavanje znakov se je sprva uporabljalo na področju umetne inteligence in pri raziskovanju strojnega vida. Nobeno OCR orodje seveda ni popolno, zato boste morali po pretvorbi slike v besedilo določene napake popraviti ročno. Vsekakor je uporaba OCR orodja veliko hitrejša metoda kot ročno prepisovanje celotnega besedila. Vsako od naslednjih brezplačnih OCR orodji ima svoje prednosti in slabosti, rezultat vseh pa bo na koncu precej podoben.

Google Drive (goo.gl/7ESpw)

Storitev Google Drive uporabnikom nudi tudi podporo za prepoznavanje znakov. Uporablja povsem identično OCR orodje, ki ga Google koristi za pretvorbo knjig v PDF datoteke. Za začetek boste morali obiskati vstopno stran Google Driva in prenesti želene datoteke. Poskenirane dokumente lahko na Google Drive naložite v oblike slikovnega formata ali v PDF datoteki. Najprej kliknite na ikono za prenos datotek. Ko bo dokument prenesen, kliknite na nastavitve in izberite opcijo Pretvori tekst iz prenesenih PDF in slikovnih datotek. Vaš dokument boste lahko nato shranili na disk in ga urejali v izbranem urejevalniku besedil.

FreeOCR (goo.gl/oFkZk)

Free OCR je brezplačna spletna OCR storitev, ki pretvori katero koli slikovno datoteko v besedilno datoteko, ki jo lahko urejate v Wordu ali kakšnem drugem urejevalniku besedil. Ta za svoje delovanje koristi kodo Tesseract, ki je bila razvita v HP-jevih laboratorijih med letoma 1985 in 1995. Spletno mesto podpira BMP, GIF, JPEG, TIFF in PDF datoteke. Čeprav bo trenutno moč pretvoriti le prvo stran PDF dokumenta, ustvarjalci obljubljajo, da bo omejitev odpravljena že v bližnji prihodnosti. Največja velikost datoteke, ki jo je moč pretvoriti, znaša 2 MB, s priporočeno resolucijo najmanj 150 dpi. Prav tako se boste za zdaj morali odreči močno razdelanim dokumentom: Prosti OCR še ne podpira stolpcev in podobnih zadev. Kakovost pretvorbe bo tako na prvem mestu odvisna od narave in ločljivosti slike. Kljub temu naj bi storitev opravila dokaj impresivno delo. Orodje se je na našem testu izkazalo za precej dobro. Poleg tega ima zelo enostaven grafični vmesnik, ki uporabniku pretvorbo omogoča že v nekaj preprostih korakih.

OnlineOCR (goo.gl/wXeWv)

Je odlično spletno orodje, ki bo prepoznalo tekst in simbole iz PDF ali slikovne datoteke ter jih pretvorilo v različne digitalne formate, vključno z Wordom in s PDF-jem. Pri tem bodo nedotaknjene ostale tudi različne forme, kot so tabele, grafične oznake, slike in podobno. Najbolj pomembno pri tem je, da boste lahko za ciljni jezik lahko izbrali tudi slovenščino. OnlineOCR je povsem brezplačno orodje, edina omejitev pri tem je le, da boste lahko na uro pretvorili le 15 dokumentov. Najprej boste morali izbrati datoteko na vašem računalniku, in sicer to storite s klikom na gumb Choose File. Zatem kliknite na gumb Upload, določite vrsto jezika (Recognition language) in izhodnega formata (Output format) in kliknite za začetek prepoznavanja znakov (Recognize). Ko bo postopek zaključen, se bo v besedilnem polju pojavil tekst iz dokumenta, ki ga lahko nato tudi v želenem formatu prenesete na vaš trdi disk.

NewOCR (goo.gl/Hr9MT)

NewOCR je brezplačno orodje za prepoznavanje znakov, ki za svoje delovanje koristi programsko kodo Tesseract. Orodje je povsem brezplačno, potrebna ni nikakršna registracija, prav tako pa je na voljo prepoznavanje slovenskega jezika. Tudi s tem orodjem boste sliko oziroma dokument brez težav pretvorili v tekst, žal pa se boste ob tem morali sprijazniti z dejstvom, da orodje ne ohranja prvotne oblike dokumenta. Ko boste na vstopni strani omenjenega orodja, kliknite na gumb Choose File in izberite jezik, v katerem želite pretvorbo dokumenta. Zatem kliknite na modri gumb Preview in počakajte, da se dokument naloži. Ko bo program prepoznal dokument, izberite del, ki ga želite spremeniti v znake, in za začetek pretvorbe kliknite na gumb OCR.

In zmagovalec je?

  1. OnlineOCR
  2. NewOCR
  3. FreeOCR
  4. Google Drive

Po našem mnenju je pri pretvorbi slike v tekst najboljše delo, kljub omejitvi 15 pretvorb na uro, opravilo orodje OnlineOCR. Poleg zgoraj naštetih OCR orodij smo preizkusili še programa OpenOCR in SimpleOCR, ki pa žal ne podpirata slovenskega jezika.


Prijavi napako v članku

Povezave



Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Zlati partner

PANASONIC SLOVENIJA

, , Tel: 080 080 799
Panasonic je ena največjih svetovnih blagovnih znamk na področju potrošniške elektronike. Že več kot stoletje uporabnike razvaja z najnovejšimi televizijskimi sprejemniki, fotoaparati, ... Več

Nova Vizija, informacijski inženiring in svetovanje, d.d.

Celjska cesta 9, 3310 Žalec, Tel: 03 71 21 800
Odločitev, v katero informacijsko tehnologijo bi moralo vlagati vaše podjetje in v katere ne, je težka. Po eni strani želite biti tisti, ki je odgovoren za inovacije in rast ... Več

UV LED TISKALNIK

Brezje pri Dobrovi 74b, 1356 Dobrova, Tel: 041 735 643
Tisk Tavčar Tisk Tavčar d.o.o. je v osnovi družinsko podjetje z 20-leti grafičnih izkušenj, pa tudi strojništvo in elektronika jim nista tuja.Predstavljajo vam UV LED tiskalnik, ... Več

OMREŽJE d.o.o.

Borovec 2, 1236 Trzin, Tel: 01 810 02 10
Združite vse na eni položnici in prihranite denar Ali še vedno plačujete storitve interneta, televizije ter fiksne in mobilne telefonije ločeno? Zagotovo ste že kdaj pomislili, ... Več