SADRŽAJ
PANEVROPSKI UNIVERZITET APEIRON FAKULTET POSLOVNE INFORMATIKE
FAKULTET POSLOVNE POSLOVNE INFORMATIKE.................................... INFORMATIKE........................................................... ................................................ ......................... .4 Smjer „Poslovna „Poslovna informatika”................................... informatika”.......................................................... .............................................. .............................................. .......................... ... .4 6.Način rada OCR-a............... OCR-a...................................... .............................................. .............................................. Redovne................................................................ studije ......................................... 15
Smjer „Poslovna informatika ”
Predmet KOMPJUTERSKA GRAFIKA I DESIGN
„OCR - Optical character recognition” (seminarski rad)
Predmetni nastavnik Doc. dr Nedim Smailović
Student
Vladimir Pavlović Index br. 121-11/RPI
Banja Luka, mart 2013.
1. Uvod
Optičko prepoznavanje znakova (eng. OCR – Optical Character Recognition), je postupak mehaničkog ili elektronskog prebacivanja rukom pisanog ili štampanog teksta koristeči skener u obilik koji računar prepoznaje i može ga mjenjati. OCR spada pod grupu istraživanja kao što je preponavanje uzoraka, umjetna intelignecija i mašinski vid. Iako se OCR još uvjek razvija i pronalaze se novi smjeroviu fokus se usmjerio na primjenu dokazanih tehnika. Optičko prepoznavanje znakova i digitalno prepoznavanje znakova su u početku smatrani različitim poljima istraživanja. Zbog činjenice da je jako malo aplikacija koje su korsitlile istinske optičke tehnike preživjelo, termin OCR danas obuhvata i tehnike digitalne obrade slika. Ranije sisteme je bilo potrebno naučiti kako čitati pojedni font. Trenutno su dostupni „inteligentni“ sistemi sa velikim stepenom tačnosti za veliku većinu fontova. Neki sistemi su sposobni reproducirati i aproksimirati format ulaznog skeniranog dokumenta koji se može sastoajti od slika, kolona i drugin netekstualnih dijelova.
4
2. Istorija razvoja OCR-a
1929. godine Gustav Tauschek OCR u Njemačkoj, a nakon njega je to isto napravio Handel u SAD-u 1933. godine. Tauscheku je odobren patent za njegovu metodi i u SAD-u. Tauschekov uređaj je bio mehanički stroj koji je korsitio šablone. Fotodetektor je bio psotavljen tako da kad su šablon i znak koji se trebalo prepoznati bili u tačno određenom položaju te ih svjetlost obasjavala ništa svjelta ne bi dolazilo do fotodetektora. 1950. Frank Rowlettje zamolio kripto analitičara Davida H. Sheparda da u suradnji s dr. Louis Tordella da svoje prijedloge za automatizovanu obradu podataka. To je uključivalo i problem pretvaranja isprintanih poruka u mašinski jezik za rašunrasku obradu. Shepard je zaključio da mora biti moguće napraviti takavu mašinu i uz pomoć prijatelja Harveya Cooka tijekom večeri i vikenda na svom tavanu napravio “Gismo”. To su objavile novine Washington Daily News 27.4.1951. godine i New York Times 26.12.1953. godine nakon što im je odobren patent U.S. Patent Number 2,663,758. Shepard tada osniva Intelligent Machines Research Corporation (IMR) kompaniju, koja je zaslužna za razvoj prvih nekoliko komercijalnih OCR sistema uopšteno u svijetu. Iako su i Gismo i prvi IMR sistemi koristili analizu slike, za razliku od uspoređivanja znakova, te su tolerirali varijaciju fontova, Gismo je bio ograničen na usko vertikalno prepoznavanje, dok su kasniji komercijalni modeli IMR skenera analizirali znakove bilo gdje u skeniranom polju što je zapravo nužnost za stvarne dokumente. 2.1. Prvi komercijalni sitemi
Prvi komercijalni sistem je instaliran u Readers Digest 1955. Isti taj sistem je kasnije doniran Smithsonianu gdje je postavljen kao eksponat. Drugi sistem su prodali Standard Oil Company iz Kalifornije koji se koristio za čitanje oznaka na kreditnim karticama. Velik broj sistema je naknadno prodan drugim naftnim kompanijama. Neki od ostalih korisnika IMR sistema kasnih 1950. godina su i Ohio Bell Telephone Company, ZrakoplovstvoSAD-a te IBM.
5
2.2. OCR-A, OCR-B
U počecima kompjuterskog OCR-a razvila se potreba za fontom koji će moći prepoznati tada spore kompjutere , ali koji će biti čitljiv i ljudima. Kao rezultat tog kompromisa se pojavio OCR-A font koji se sastojao od jednostavnih, debelih poteza koji su tvorili prepoznatljive znakove. 1968. godine American Type Founders proizvodi OCR-A, jedan od prvih oblika znakova prilagođen za optičko prepoznavanje koji je zadovoljavao kriterije ureda za standarde SAD-a (eng. U.S. Bureau of Standards). Dizajn je tako jednostavan da ga je kompjuter mogao vrlo lako pročitati, tj. prepoznati, ali je nešto nezgodniji za čitanje ljudima. OCR-B je europski pandan tom fontu. Napravio ga je Adrian Frutiger iste godine. OCR-B font je lakši ljudima za čitanje od OCR-A fonta. Postoje besplatne, ali i komercijalne inačice ovih fontova koje prodaju različite kompanije. Iako je OCR tehnologija napredovala toliko da više nema potrebe za ovim specijaliziranim fontovima oni i dalje ostaju u upotrebi.
Slika 1. Izgled OCR-A i OCR-B fontova
6
3. Trenutno stanje OCR tehnologije
Tačno prepoznavanje isprintane latinice se smatra uglavnom riješenim problemom. Tipičan postotak tačnosti prepoznavanja prekoračuje 99% iako za određene aplikacije koje zahtijevaju još veću tačnost je potrebna ljudska intervencija i pregled grešaka. Ostala područja, poput prepoznavanja rukopisa, kurziva i načina pisanja različitog od latinice (posebno onih sa vrlo velikim brojem znakova) su i dalje predmet aktivnog istraživanja. Tačnost ili preciznost može biti mjerena na nekoliko načina o kojima jako ovisi krajnji rezultat i postotak tačnosti. Npr. bez korištenja rječnika za ispravljanje pogrešaka pri čitanju 1% pogreška (99% tačnost) se moze pretvoriti u 5% pogrešku (95% tačnost). OCR se ponekad krivo poistovjećuje sa on-line character recognition. OCR je tip off-line prepoznavanja znakova, gdje sistem prepoznaje fiksne i statičke oblike znakova, dok on-line prepoznavanje znakova prepoznaje dinamičke pokrete tokom pisanja rukom. On-line prepoznavanje znakova se ponekad naziva i dinamičko prepoznavanje znakova (dynamic character recognition), prepoznavanje znakova u realnom vremenu (real-time character recognition) i inteligentno prepoznavanje znakova (Intelligent Character Recognition, ICR). 3.1. Intelligent Character Recognition (ICR)
On-line sistemi za prepoznavanje rukom ispisanog teksta u realnom vremenu (DCR, ICR) su sve češći komercijalni proizvodi posljednjih godina. Primjeri takvih proizvoda su uređaji poput digitalnih osobnih asistenata koji koriste Palm OS. Apple Newton je bio pionir ovakvih uređaja. Algoritmi koji se koriste u ovakvim uređajima iskorištavaju činjenicu da su poredak, brzina i smjer pojedinih linija i segmenata poznati. Također korisnika se može naučiti da koristi samo određene oblike slova. Ove metode se ne mogu koristiti u software-u koji skenira papirnate dokumente tako da je tačno prepoznavanje rukom pisanih dokumenata još uvijek otvoreni problem. Tačnost je između 80% i 90% za uredne, čisto rukom ispisane znakove, ali takva tačnost svejedno znači desetke grešaka po stranici što je veliko ograničenje za ovu tehnologiju i ograničava njenu primjenu. Prepoznavanje kurziva je aktivno područje istraživanja sa postotkom tačnosti prepoznavanje još manjom od onog prepoznavanja rukom pisanog teksta. Viši postotak tačnosti prepoznavanja kurziva vjerojatno neće biti moguć bez kontekstualnih ili gramatičkih informacija. Na primjer, prepoznavanje cijele riječi iz rječnika je lakše nego obraditi individualne znakove iz teksta. Poznavanje gramatike jezika u kojem je pisan tekst koji se skenira također može pomoći pri određivanju je li riječ u pitanju imenica ili glagol što omogućava veću tačnost. Oblici individualnih znakovakurziva ne sadržavaju dovoljno informacija da bi se tačno (više od 98%) prepoznao cijeli rukom pisani tekst u kurzivu. Potrebno je shvatiti da je OCR osnovna tehnologija koja se koristi u naprednim aplikacijama za skeniranje. Dakle, pojedino napredno tehnološko rješenje može biti temeljeno na osnovnoj OCR tehnologiji. 7
4. OCR u drugim namjenama
Na MIT-u su se sredinom 1970. godina radila prva istraživanja prepoznavanja muzičkih oblika na papiru. Ulagan je trud u uklanjanje muzičkih linija kako bi ostali samo simboli za prepoznavanje i obradu. Prvi komercijalni program za skeniranje muzičkih nota, MIDISCAN, je izdan 1991. godine. Trenutno postoji nekoliko proizvoda tog tipa. Jedino područje u kojem tačnost i brzina računarskog ulaza znakovnih informacija nadilazi sposobnosti ljudi je u području prepoznavanja znakova ispisanih magnetskom tintom gdje je jedna pogreška na svakih 20 do 30 tisuća provjera. 1950. Bank of America je bila prva banka koja je koristila OCR kako bi automatizirala obradu čekova koji su u sebi sadržavali takav tip znakova. 4.1. Music OCR
Za razliku od prepoznavanja teksta, gdje se riječi obrađuju jedna za drugom, muzičke oznake je potrebno obrađivati paralelno, zbog prisutnosti višestrukih glasova i drugih muzičkih oznaka. Ovdje bitnu ulogu igra razmak između nota, oznake za tempo i dinamiku te glazbene oznake. Savremeni glazbeni OCR softwareski paketi imaju preciznost koja prelazi 99% u slučaju čistog skena i ako su korištene standardne notacije. Pošto muzičke notacije koriste tačke za staccato oznake ili da bi se produžilo trajanje note, artifakti kod skeniranja mogu dovesti do problema pri prepoznavanju. PhotoScore Ultimate 5 je prvi programski paket koji je u mogućnosti prepoznavati rukom pisane note i druge glazbene oznake korištenjem 2 različita enginea za prepoznavanje. Oni koreliraju vlastite rezultate i tako postižu značajno poboljšanje preciznosti. Ime
Licenca
Operacijski sustavi
Komentari
Musitek SmartScore Pro
Komercijalna 399$ / 299$ (akademska licenca)
Windows, Mac OS X
Evolucija MIDISCAN programa.
PhotoScore Ultimate 5
Komercijalna 249$
Windows, Mac OS X
Lagan za korištenje, sa jeftinom inačicom za nezahtjevne.
Vivaldi Scan
Komercijalna 152$
Windows, Mac OS
Lagan za korištenje, brz, 99% preciznost. Dolazi s alatom za provjeru ritma.
Audiveris
GNU besplatan[5]
Windows, Mac OS, Linux, Solaris
Besplatan program pisan u JAVAi. Potpuno funkcionalan, ali ograničen na prepoznavanje tiskanih notnih zapisa.
Capella-Scan
Komercijalna Windows 199.95$ Tabela 1. Lista Music OCR software-a
Vrlo brz program.
8
9
4.2. Magnetic Ink Character Recognition (MICR)
Prepoznavanje znakova pisanih magnetskom tintom (eng. MICR=Magnetic Ink Character Recognition) je tehnologija prepoznavanja znakova koju uglavnom koristi bankovna industrija pri obradi čekova. Proces je prvi put 1956. godine prikazan organizaciji American Bankers Association, a već je 1963. godine u SAD-u bio u masovnoj upotrebi. MICR je standardiziran kao ISO 1004. Glavni MICR fontovi korišteni širom svijeta su E-13B i CMC-7. Gotovo svi čekovi koji se koriste u Indiji, SAD-u, Kanadi i Velikoj Britaniji na sebi sadrže MICR znakove pisane E13B fontom. CMC-7 MICR font se uglavnom koristi u Europi, poglavito Francuskoj.
Slika 2. Primjer u MICR E13 fontu
Slika 3. Primjer u CMC-7 fontu
MICR fontovi su jedinstvenog izgleda i printaju se magnetskom tintom ili tonerom koji obično sadržava željezni oksid. Pošto tinta kojom su znakovi isprintani u sebi sadrži čestice željeza ona se može magnetizirati te odatle naziv magnetska tinta. Znakovi su najprije magnetizirani u ravnini s papirom, a sjevernim magnetski pol se nalazi s desne strane svakog MICR znaka. Obično se čitaju pomoću MICR glave za čitanje koja je po svojoj prirodi vrlo slična glavi za čitanje klasičnih audio kaseta. Specifični oblik znakova osigurava da će svaki znak proizvesti jedinstveni zvučni oblik čime sistem za prepoznavanje znakova ima pouzdan rezultat pri prepoznavanju znakova. Magnetsko štampanje se koristi kako bi se znakovi mogli pouzdano iščitati čak ako se preko njih nešto ispiše. 10
4.3. Bar Code Reader
Barkod (eng. Bar Code) je sačinjen od vertikalnih linija i razmaka između njih. Niz linija i razmaka različitih širina predstavlja niz brojeva. Barkodovi se obično nalaze na pakiranjima. Barkod daje informacije o zemlji proizvodnje, imenu proizvođača i samom proizvodu. Čitač barkoda koristi lasersku zraku da bi pročitao kod. Laserska zraka se pomiče preko barkoda gdje ju svijetlije linije reflektiraju, a tamnije upijaju. Čitač zatim pretvara uzorak odbijenog i upijenog laserskog svijetla u digitalni kod koji je jedinstven za taj proizvod.
Slika 4. Primjer brakoda
Barkodovi su brza i pouzdana metoda unošenja podataka. Mogu se čitati čak i sa oblih površina ili ako su naopako. Sadrže i nadzor pogrešaka u obliku kontrolnog znaka.
Slika 5. Barkod čitač
11
4.4. Optical Mark Reader
Čitač optičkih oznaka je sličan čitaču barkoda, ali koristi infracrveno svjetlo da bi skenirao oznake na otprije pripremljenim formularima kao što su testovi sa višestrukim izborom ili listićima lutrije. Infracrveno svjetlo se ne odbija kad pređe preko oznake čija se pozicija zatim daje računalu. Software zatim povezuje položaj oznake sa pripadajućim informacijama ili podatcima na formularu Ovo je vrlo brza i precizna metoda za unos velikih količina podataka uz pretpostavku da su oznake točno i čisto označene.
Slika 6. OMR za prepoznavanje označenih brojeva na listićima lutrije
12
5. OCR Software
Ime
Licenca
Operacijski sustavi
ExperVision TypeReader
Komercijalna 395$
Windows,Mac X,Unix,Linux,OS/2
ABBYY FineReader OCR
Komercijalna 400$
Windows
Komercijalna 500$ Komercijalna 520$
OmniPage Readiris Cvision Technologies PDF compressor and Maestro Recognition Server Top Image Systems CompuThink ViewWise
Komercijalna (N/A) Komercijalna 8000$ BSD 129$
CuneiForm Pro GOCR Microsoft Imaging
Komercijalna 500$
Komentari OS
Windows, Mac OS Windows, Mac OS Windows Windows Windows Windows
Brz, precizan, velikih kapaciteta. Specijaliziraju za pravne dokumente. Sustav za upravljanje dokumentima. Profesionalni sustav za tvrtke, podržava više jezika, može prepoznati složene tekstualne i oblike tablica. U ranoj fazi razvoja.
HOCR
GPL Komercijalna (N/A) Komercijalna (N/A) GPL Komercijalna (N/A) GPL
InstantOCR
FreeWare
Online
OCRopus
Apache Komercijalni (N/A) Komercijalni 8550$ FreeWare/Komercijalna 300$-2500$ FreeWare
Linux
Windows, Mac OS, Linux
Web OCR usluga.
Tesseract
Apache
Windows, Mac OS, Linux, OS/2
MoreData
FreeWare
Windows
Projekt koji razvija Google. Mogućnost skeniranja jedne ili više slika te pretrage za riječima. Provjera pravopisa, podrška za 52 jezika, jednostavnost. Besplatan i jednostavan.
Office
Document
Microsoft Office One Note 2007 Ocrad Brainware
ReadSoft Scantron Cognition Pro SimpleOCR OCR Terminal
NewSoft Presto! OCR FreeOCR
Komercijalna 100$ FreeWare
Mnogi (OpenSource)
Prema nekim testovima najbrži OCR software. Za rad sa lokaliziranim verzijama potreban je addon s pripadajućim jezikom. Proizvod Nuance Communications. Postoje edicije za Aziju i Srednji Istok.
Windows, Mac OC Windows Unix, OS/2 Windows Linux
Windows Windows Windows
Windows Windows
Obrada poslovnih i profesionalnih dokumenata Hebrejski OCR Višejezični online sustav za prepoznavanje. Specijaliziran za poslovne dokumente. Za rad s lokaliziranim sučeljima potreban je odgovarajući addon. Nudi besplatan program, ali naplaćuje source code.
Tabela 2. Popis OCR software-a.
ABBYY FineReader 9 Professional - FineReader Professional je vrlo precizan i lagan za
korištenje OCR program koji u sebi sadržava dodatne mogućnosti poput OCR-a za digitalne kamere, inteligentno prepoznavanje izgleda dokumenata, poboljšavanje kvalitete slike, prepoznavanje barkoda i naredbeno linijsku integraciju. Njegova glavna funkcija je očuvanje izgleda izvornog dokumenta što značajno ubrzava konverziju i oblikovanje.
13
IRIS ReadIRIS Pro 11 - Pristupačno rješenje za poslovne ali i kućne korisnike. ReadIRIS
Pro nudi vrlo precizno OCR prepoznavanje za nisku cijenu. No bez obzira na nisku cijenu, svejedno nudi pregršt naprednih mogućnosti inače rezerviranih za mnogo skuplja profesionalna rješenja. Nuance OmniPage Pro 16 - OmniPage je prema mnogima najbrža, najpreciznija i
najsadržajnija OCR aplikacija. OmniPage 16 Professional sadrži jedinstvenu mogućnosti pretvaranja bilo kojeg tipa dokumenta u pretraživi PDF ili Word Doc format. OmniPage nema dostupnu demo verziju svoje aplikacije za download. Također ne pruža besplatnu tehničku podršku nakon prvog poziva. Sve ovo ipak nude konkurentska rješenja kompanija ABBYY i IRIS. Presto! OCR Pro 4.0 - Presto! OCR ne samo da precizno prepoznaje dokumente on i očuva
njihov izgled i izvorni oblik. Dakle sačuva izgled i pozicije kolona, tablica i slika. Moćna, ali iznenađujuće cjenovno pristupačna alternativa nekim poznatijim i skupljim OCR rješenjima. Čita i prepoznaje 52 jezika, oblikuje novi dokument prema izgledu starog, može skenirati i iz obojanih i tamnih podloga, podržava višestruku obradu dokumenata te profesionalne alate za analizu složenih izgleda dokumenata. ExperVision TypeReader - Ovaj ExperVisionov software postoji u raznim inačicama
predviđenim za osnovnu i profesionalnu upotrebu. Podržava skeniranje crno-bijelih i slika u boji, sadrži podršku za više jezika te podršku za PDF. Osim ovih aplikacija postoje još neke poput Top Image Systems , CompuThink ViewWise, Brainware, ReadSoft i drugih koji su specijalizirani za brzu obradu poslovnih dokumenata u vrlo velikim količinama te svoju namjenu i nalazt u profesionalnim okruženjima poput banaka ili srednjih i velikih tvrtki. Kao takve ove aplikacije nisu zanimljive uobičajenom korisniku. SimpleOCR - SimpleOCR je besplatna OCR aplikacija koja nudi prihvatljivu preciznost za
one koji žele pretvoriti samo par stranica i ne mogu si priuštiti neki od komercijalnih softwarea. Omogućava pretvorbu skeniranih slika u tekstualne datoteke ili Word dokumente. SimpleOCR nudi mogućnosti TWAIN skeniranja, ručnog određivanja zona sa slikama ili tekstom, nekoliko rječnika, interaktivno ispravljanje pogrešaka sa prijedlozima iz rječnika, izlazne datoteke u obliku običnog teksta ili RTF (MS Word) formatu. SimpleOCR nudi sve obično korištene OCR mogućnosti i usporedivu sposobnost prepoznavanja s komercijalnim alatima. SimpleOCR može biti jednako dobar kao i OmniPage Professional 16 ako si student ili neko kome jako rijetko zatreba pretvoriti tiskani dokument u digitalni oblik. Softi FreeOCR - FreeOCR je besplatni OCR program za Windows platformu. Ovo je vrlo
jednostavan i lak za korištenje program s jednostavnom instalacijskom procedurom. Ima podršku za višestrane tiff slike, fax dokumente i razne druge oblike kompresiranih slika. Jedini nedostatak ovog programa je njegova nemogućnost čitanja PDF dokumenata. Pošto neki PDF dokumenti imaju zaključanu mogućnost copy-paste teksta tada je od koristi OCR program. Free OCR je software otvorenog koda (eng. open source) te time freeware, odnosno besplatna aplikacija. Za razliku od nekih OCR aplikacija koje su besplatne samo za privatnu upotrebu, FreeOCR se može slobodno koristiti i u komercijalne svrhe. Besplatni OCR engine je distribuiran pod Apache v2.0 licencom što znači da će stalno imati potporu open source razvojne zajednice.
14
6. Način rada OCR-a
Software za optičko prepoznavanje znakova (Optical Character Recognition, OCR) skenira i prepoznaje tekst te ga zatim pretvara u datoteku word procesora za daljnju obradu. OCR software taj postupak čini na 3 glavna načina: prepoznavanje uzoraka (Pattern Matching), prepoznavanje posebnosti (Feature Extraction) i provjera pravopisa (Spell Checking). Najbolji programi za optičko prepoznavanje znakova koriste više od jedne ovdje navedenih metoda kako bi odredili o kojem se skeniranom znaku radi. Kombinirajući različite metode točnosti i preciznost drastično poraste. 6.1. Prepoznavanje uzoraka (Pattern Matching) Većina tekstova je u Times, Courier ili Helvetica tipu fonta, veličine između 10 i 14 tačaka. OCR programi koji koriste prepoznavanje uzoraka (Pattern Matching) imaju slike za svaki znak u svakom fontu i veličini. Uspoređujući snimljene slike koje dolaze sa OCR programom s onima skeniranih znakova program pokušava prepoznati slova. Očiti nedostatak ove metode je što je korisna samo za otprije poznate tipove i veličine fontova. 6.2. Prepoznavanje posebnosti (Feature Extraction) Umjesto da uspoređuje otprije snimljene slike znakova s onima skeniranima ova metoda pokušava prepoznati slova tako što ih pokušava rastaviti na osnovne posebnosti ili sastavne dijelove koji se zatim uspoređuju sa listom posebnosti ili sastavnih dijelova koji se nalaze u programskom kodu. Na primjer slovo "a" je sačinjeno od kruga, linije na desnoj strani i luka na sredini. Taj luk nije obavezan sastavni dio slova. Dakle, ako skenirano slovo ima te "posebnosti" OCR program bi ga tačno prepoznao kao slovo "a".
6.3. Provjera pravopisa (Spelling Check) Ni jedan OCR software ne može prepoznati 100% skeniranih znakova. Neki OCR programi koriste usporedbu uzoraka (Pattern Matching) i/ili prepoznavanje posebnosti (Feature Extraction) kako bi prepoznali što je više moguće znakova. Nakon što je obavljeno početno prepoznavanje, neprepoznati znakovi često mogu biti određeni gledajući susjedne znakove. Na primjer, ako OCR program nije mogao prepoznati slovo “i” u riječi “nj~hovo” provjerom pravopisa program može utvrditi da je slovo koje nedostaje slovo “i”. 15
6.4. Posebni simboli U upotrebi uglavnom u bankarstvu, svaki od sljedećih simbola nakon prepoznavanja nosi tačno određeno značenje važno za posebne primjene. Za prepoznavanje ovakvih znakova je potrebno koristiti neke od navedenih profesionalnih ili specijalizovanih programa za poslovne dokumente. Ime
Slika
OCR Hook OCR Chair OCR Fork OCR Inverted Fork
OCR Belt Buckle OCR Bow Tie OCR Branch Bank Identification OCR Amount of Check OCR Customer Account Number OCR Dash OCR Double Backslash Tabela 3. Posebni OCR simboli.
16
7. Zaključak
Tačno prepoznavanje isprintane latinice se smatra uglavnom riješenim problemom. Tipičan postotak tačnosti, tj. preciznosti prepoznavanja prekoračuje 99%. Postoje još problemi pri prepoznavanju rukom pisanog teksta u realnom vremenu te pogotovo onog pisanog kurzivom. Sa vremenom i kvalitetnim ulaganjem u razvoj će se vjerojatno i ti problemi savladati. Već sada OCR tehnologija nalazi svoju krucijalnu primjenu u raznim velikim korporacijama gdje štedi novac i vrijeme pri obradi velikih količina specijalizovanih dokumenata, pravnih ili vezanih za bankarske poslove. Takva rješenja su vrlo skupa i pristupačna samo financijski likvidnim korporacijama kojima se takav ulog može isplatiti. Za običnog, kućnog korisnika koji se povremeno koristi OCR tehnologijom pri sporadičnom skeniranju dokumenata postoje razna rješenja, od besplatnih pa do onih koji koštaju par stotina dolara. Ako se potreba za OCR-om ne pokazuje vrlo često ili rijetko nema potrebe za ulaganjem i plaćanjem relativno skupih rješenja kada tu mogu dovoljno dobro zadovoljiti ona besplatna poput FreeOCR ili SimpleOCR programa. Za male i srednje kompanije koje moraju obrađivati nešto veće količine dokumenata se preporučaju nešto skuplja, ali i moćnija rješenja poput ABBYY FineReader ili OmniPage. Većina ovih komercijalnih rješenja nudi i podršku za prepoznavanje barkodova ili optičkih oznaka što ih čini sveobuhvatnim programima i proširuje raspon njihove moguće primjene. U budućnosti će trend poboljšanja preciznosti, kvalitete, što samih programa što prepoznavanja, te integracije raznih dodatnih mogućnosti još više rasti. Za očekivati je da će se uskoro i pojaviti vrlo kvalitetni sistemi koji će moći prepoznati rukopis, i kvalitetno automatski rješavati klasične probleme kod skeniranja i prepoznavanja o kojima je bilo govora.
17
8. Literatura
1. http://www.am.unze.ba/pzi/2010/vektorizacija_rasterske_Benisa_Mujezinovic/historijat.h tml (20.3.2013.) 2. http://www.gloria-ferrari.com/o_asistivnim_tehnologijama_ _pomagalima/pojmovi/softver_-_program_za_prepoznavanje_teksta_ _opticko_prepoznavanje_znakova.html (20.3.2013.) 3. http://www.am.unze.ba/pzi/2011/Sabanovic_Arminka/historijat.html (20.3.2013.) 4. http://www.cvisiontech.com/reference/ocr/ocr-technology.html?lang=hrv (20.3.2013.) 5. http://www.cvisiontech.com/reference/document-automation/ocr-imaging-solution.html? lang=hrv (20.3.2013.) 6. http://www.am.unze.ba/pzi/2011/Sabanovic_Arminka/OCR%20(Optical%20Character %20Recognition).html (20.3.2013.)
18