25.11.2012 09:24
Posodobljeno 11 let nazaj.

Deli z drugimi:

Share

4 brezplačna orodja za optično prepoznavanje znakov – OCR

Verjeli ali ne, nekateri ljudje še vedno dokumente tiskajo na fizični kos papirja. Prav zaradi tega smo se potrudili in na enem mestu zbrali nekatera najboljša brezplačna OCR orodja.
OnlineOCR je prav gotovo najboljše brezplačno orodje za prepoznavanje znakov.
OnlineOCR je prav gotovo najboljše brezplačno orodje za prepoznavanje znakov.

Programska oprema za optično prepoznavanje znakov (angl. Optical Character Recognition – OCR) pretvarja papirne dokumente in datoteke PDF v elektronsko obliko. Programe OCR uporabljamo v povezavi z računalnikom in optičnim bralnikom (skenerjem). S slednjim skopiramo natisnjeno besedilo na računalnik, kjer ga lahko v elektronski obliki shranimo ali denimo preberemo in povečamo z ustrezno programsko opremo. Slepi in slabovidni lahko s pomočjo naprednejših programov OCR berejo tiskane vsebine, na primer knjige, revije, dopise in druge tiskovine. Programi OCR lahko rešujejo tudi težave pri učenju, denimo v primerih, ko učeči težko berejo ali pa ko imajo zaradi gibalnih in fizičnih prizadetosti omejene možnosti rokovanja s tiskanim materialom.

Kako deluje OCR?

Knjigo ali drugo tiskovino vložimo v optični bralnik, povezan z računalnikom. Bralnik posname sliko dokumenta in jo v elektronski obliki posreduje računalniku. Program OCR nato pretvori informacije s slike v besedilo, to pa lahko nato prebere bralnik besedila, ki prav tako teče na računalniku. Programi OCR praviloma ne zmorejo brati rokopisa. Optično prepoznavanje znakov se je sprva uporabljalo na področju umetne inteligence in pri raziskovanju strojnega vida. Nobeno OCR orodje seveda ni popolno, zato boste morali po pretvorbi slike v besedilo določene napake popraviti ročno. Vsekakor je uporaba OCR orodja veliko hitrejša metoda kot ročno prepisovanje celotnega besedila. Vsako od naslednjih brezplačnih OCR orodji ima svoje prednosti in slabosti, rezultat vseh pa bo na koncu precej podoben.

Google Drive (goo.gl/7ESpw)

Storitev Google Drive uporabnikom nudi tudi podporo za prepoznavanje znakov. Uporablja povsem identično OCR orodje, ki ga Google koristi za pretvorbo knjig v PDF datoteke. Za začetek boste morali obiskati vstopno stran Google Driva in prenesti želene datoteke. Poskenirane dokumente lahko na Google Drive naložite v oblike slikovnega formata ali v PDF datoteki. Najprej kliknite na ikono za prenos datotek. Ko bo dokument prenesen, kliknite na nastavitve in izberite opcijo Pretvori tekst iz prenesenih PDF in slikovnih datotek. Vaš dokument boste lahko nato shranili na disk in ga urejali v izbranem urejevalniku besedil.

FreeOCR (goo.gl/oFkZk)

Free OCR je brezplačna spletna OCR storitev, ki pretvori katero koli slikovno datoteko v besedilno datoteko, ki jo lahko urejate v Wordu ali kakšnem drugem urejevalniku besedil. Ta za svoje delovanje koristi kodo Tesseract, ki je bila razvita v HP-jevih laboratorijih med letoma 1985 in 1995. Spletno mesto podpira BMP, GIF, JPEG, TIFF in PDF datoteke. Čeprav bo trenutno moč pretvoriti le prvo stran PDF dokumenta, ustvarjalci obljubljajo, da bo omejitev odpravljena že v bližnji prihodnosti. Največja velikost datoteke, ki jo je moč pretvoriti, znaša 2 MB, s priporočeno resolucijo najmanj 150 dpi. Prav tako se boste za zdaj morali odreči močno razdelanim dokumentom: Prosti OCR še ne podpira stolpcev in podobnih zadev. Kakovost pretvorbe bo tako na prvem mestu odvisna od narave in ločljivosti slike. Kljub temu naj bi storitev opravila dokaj impresivno delo. Orodje se je na našem testu izkazalo za precej dobro. Poleg tega ima zelo enostaven grafični vmesnik, ki uporabniku pretvorbo omogoča že v nekaj preprostih korakih.

OnlineOCR (goo.gl/wXeWv)

Je odlično spletno orodje, ki bo prepoznalo tekst in simbole iz PDF ali slikovne datoteke ter jih pretvorilo v različne digitalne formate, vključno z Wordom in s PDF-jem. Pri tem bodo nedotaknjene ostale tudi različne forme, kot so tabele, grafične oznake, slike in podobno. Najbolj pomembno pri tem je, da boste lahko za ciljni jezik lahko izbrali tudi slovenščino. OnlineOCR je povsem brezplačno orodje, edina omejitev pri tem je le, da boste lahko na uro pretvorili le 15 dokumentov. Najprej boste morali izbrati datoteko na vašem računalniku, in sicer to storite s klikom na gumb Choose File. Zatem kliknite na gumb Upload, določite vrsto jezika (Recognition language) in izhodnega formata (Output format) in kliknite za začetek prepoznavanja znakov (Recognize). Ko bo postopek zaključen, se bo v besedilnem polju pojavil tekst iz dokumenta, ki ga lahko nato tudi v želenem formatu prenesete na vaš trdi disk.

NewOCR (goo.gl/Hr9MT)

NewOCR je brezplačno orodje za prepoznavanje znakov, ki za svoje delovanje koristi programsko kodo Tesseract. Orodje je povsem brezplačno, potrebna ni nikakršna registracija, prav tako pa je na voljo prepoznavanje slovenskega jezika. Tudi s tem orodjem boste sliko oziroma dokument brez težav pretvorili v tekst, žal pa se boste ob tem morali sprijazniti z dejstvom, da orodje ne ohranja prvotne oblike dokumenta. Ko boste na vstopni strani omenjenega orodja, kliknite na gumb Choose File in izberite jezik, v katerem želite pretvorbo dokumenta. Zatem kliknite na modri gumb Preview in počakajte, da se dokument naloži. Ko bo program prepoznal dokument, izberite del, ki ga želite spremeniti v znake, in za začetek pretvorbe kliknite na gumb OCR.

In zmagovalec je?

  1. OnlineOCR
  2. NewOCR
  3. FreeOCR
  4. Google Drive

Po našem mnenju je pri pretvorbi slike v tekst najboljše delo, kljub omejitvi 15 pretvorb na uro, opravilo orodje OnlineOCR. Poleg zgoraj naštetih OCR orodij smo preizkusili še programa OpenOCR in SimpleOCR, ki pa žal ne podpirata slovenskega jezika.


Prijavi napako v članku

Povezave



Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

REDOLJUB d.o.o.

Skladišče: Pot heroja Trtnika 45, 1261 Ljubljana - Dobrunje, Tel: 070 377 577
Se sprašujete, kje lahko na enem mestu dobite pisarniške potrebščine, opremo in potrošni material? Leta 1990 je podjetje Redoljub začelo z vzdrževanjem redu v slovenskih in ... Več

STUDIO GRAFFIT d.o.o.

Podutiška cesta 92, 1000 Ljubljana, Tel: 01 510 35 70
Studio Graffit Uspešno promocijo podjetja lahko izvedemo na več načinov, preko medijev, spletne strani ali s širjenjem blagovne znamke. Obstaja tudi lažji in bolj praktični ... Več
Zlati partner

TELEMACH d.o.o.

Brnčičeva ulica 49a, 1231 Ljubljana Črnuče, Tel: 070 700 700
Telemach je eno glavnih telekomunikacijskih podjetij v Sloveniji in hkrati najhitreje rastoči mobilni operater v državi. Uporabnikom ponuja napredne televizijske storitve v ločljivostih ... Več

APPOTEKA d.o.o.

Kamniška ulica 41, 1000 Ljubljana, Tel: 030 220 500
B2B (prodaja poslovnim kupcem) poslovni svet se nenehno spreminja in v mnogih pogleda postaja bolj podoben B2C (prodaja potrošnikom) svetu. B2B partner si zdaj želi nakupno izkušnjo, ... Več