Teksta atpazīšanas programmas
- 4223
- 993
- Roderick Satterfield DDS
Parasti, ja runa ir par skenēta teksta atpazīšanas programmām (OCR, simbolu optiskā atpazīšana), vairums lietotāju atgādina vienīgo produktu - Abbyy Finereader, kas, bez šaubām, ir līderis starp šādu programmatūru Krievijā un viens no līderiem pasaule.
Neskatoties uz to, Finereader nav vienīgais šāds risinājums: ir bezmaksas programmas teksta atpazīšanai, tiešsaistes pakalpojumiem tiem pašiem mērķiem un turklāt šādas funkcijas ir arī dažās jūsu zināmās programmās, kuras, iespējams, jau ir instalētas jūsu datorā. Es mēģināšu par visu to rakstīt šajā rakstā. Visas programmas uzskatīja par darbu Windows 7, 8 un XP.
Teksta atpazīšanas līderis - Abbyy Finereader programma
Par Finereader (izrunā kā uguns lasītāju), iespējams, vairums no jums ir dzirdējuši. Šī programma ir labākā vai viena no labākajām augstas kvalitātes teksta atpazīšanai krievu valodā. Programma tiek samaksāta, un mājas lietošanas licences cena ir nedaudz zemāka par 2000 rubļiem. Ir iespējams arī lejupielādēt naudas sodu izmēģinājuma versiju vai izmantot tiešsaistes teksta atpazīšanu vietnē Abbyy Fine Reader Online (jūs varat atpazīt vairākas lapas bez maksas, pēc tam - par maksu). Tas viss ir pieejams izstrādātāja http: // www oficiālajā vietnē.Būda.izjukt.
Finereader izmēģinājuma versijas instalēšana neradīja nekādas problēmas. PO var integrēt ar Microsoft Office un Windows diriģentu, lai padarītu to ērtāku atpazīšanas uzsākšanu. No bezmaksas izmēģinājuma versijas ierobežojumiem - 15 lietošanas dienu un spēja atpazīt ne vairāk kā 50 lappuses.
Tā kā man nav skenera, verifikācijai es izmantoju attēlu no sliktas kvalitātes tālruņa kameras, kurā man bija nedaudz rediģēts kontrasts. Kvalitāte nav laba, redzēsim, kurš var rīkoties.
Finereader var saņemt teksta grafisko attēlu tieši no skenera, no grafiskiem failiem vai kameras. Manā gadījumā ar to bija pietiekami, lai atvērtu attēla failu. Rezultāts priecājās - tikai pāris kļūdas. Man uzreiz jāsaka, ka tas ir labākais rezultāts no visām pārbaudītajām programmām, strādājot ar šo paraugu - līdzīga atzīšanas kvalitāte bija tikai bezmaksas tiešsaistes pakalpojumā Bezmaksas tiešsaistes OCR (bet šajā pārskatā mēs runājam tikai par programmatūru, nevis Tiešsaistes atzīšana).
Atklāti sakot, par kirilic tekstiem, iespējams, nav konkurentu. Programmas priekšrocības ir ne tikai teksta atpazīšanas kvalitāte, bet arī plaša funkcionalitāte, atbalsts formatēšanai, kompetents eksports uz daudziem formātiem, ieskaitot Word Docx, PDF un citas iespējas. Tādējādi, ja OCR uzdevumi ir tie, ar kuriem jūs pastāvīgi sastopaties, tad nenožēlojiet salīdzinoši nelielu naudas summu, un tas pilnībā atmaksāsies: jūs ietaupīsit milzīgu laiku, ātri iegūstot kvalitatīvu rezultātu Finereader. Starp citu, es neko nereklamēju - es tiešām domāju, ka tiem, kuriem ir jāatzīst vairāk nekā duci lappušu, būtu jādomā par tādu pirkšanu.
Cuneeform - bezmaksas teksta atpazīšanas programma
Manā vērtējumā otrā populārākā OCR programma Krievijā ir bezmaksas Cuneear, kuru var lejupielādēt no oficiālās vietnes http: // kognitive formas.ru/produkti/cuneeform/.
Programmas instalēšana ir arī ļoti vienkārša, tā nemēģina instalēt nevienu trešo daļu programmatūru (piemēram, daudz bezmaksas programmatūras). Saskarne ir kodolīga un saprotama. Dažos gadījumos vienkāršākais veids, kā izmantot kapteini, kuram ir paredzēts pirmais no izvēlnes ikonām.
Izmantojot paraugu, kuru es izmantoju FineReader, programma nevarēja tikt galā vai, precīzāk, izdeva kaut ko vāji lasītu un vārdu atgriezumus. Otrais mēģinājums tika veikts ar teksta ekrānuzņēmumu no pašas programmas vietas, kas tomēr bija jāpalielina (tai ir jānosaka ar izšķirtspēju 200dpi un augstāk, viņa nelasa ekrānuzņēmumus ar 1 biezumu 1 -2 pikseļu fontu līnijas). Šeit viņa labi tika galā (daļa teksta netika atzīta, jo tika izvēlēta tikai krievu valoda).
Tādējādi var pieņemt, ka cuneeform ir tas, kas jums vajadzētu izmēģināt, it īpaši, ja jums ir kvalitatīvi skenētas lapas un vēlaties tās atpazīt bez maksas.
Microsoft OneNote - programma, kas jums jau var būt
Microsoft Office sastāvam, sākot ar versiju 2007 un beidzot ar pašreizējo 2013. gadu, ir piezīmju glabāšanas programma - OneNote. Tas satur arī teksta atpazīšanas funkcijas. Lai to izmantotu, vienkārši ievietojiet piezīmē skenētu vai jebkuru citu teksta attēlu, noklikšķiniet uz tā labās peles atslēgas un izmantojiet konteksta izvēlni. Es atzīmēju, ka pēc noklusējuma angļu valoda ir noteikta atzīšanai.
Es nevaru teikt, ka teksts tiek atzīts perfekti, bet, cik es varu spriest, tas ir nedaudz labāks nekā Cuneiform. Programmas plus, kā jau minēts jau minēts, ir tas, ka ar ievērojamu varbūtību tā jau ir instalēta jūsu datorā. Lai gan, protams, tā lietošana, ja tas ir nepieciešams strādāt ar lielu skaitu skenētu dokumentu, maz ticams, ka tas nebūs ērts, drīzāk tas ir piemērots, lai ātri atzītu vizītkartes.
Omnipage Ultimate, Omnipage 18 - jābūt kaut kam ļoti foršam
Es nezinu, cik laba ir programma Omnipage tekstu atpazīšanai: nav izmēģinājuma versiju, es nevēlos kaut kur lejupielādēt. Bet, ja tā cena ir pamatota, un tā versijā maksās apmēram 5000 rubļu individuālai lietošanai, nevis galīgai, tad tam vajadzētu būt kaut kam iespaidīgam. Programmas lapa: http: // www.Nianse.Com/individuāli/blakusprodukts/Omnipage/indekss.HTM
Ja jūs iepazīstaties ar īpašībām un pārskatiem, ieskaitot krievu valodas publikācijas, tas norāda, ka OmniPage patiešām nodrošina augstas kvalitātes un precīzu atzīšanu, ieskaitot krievu valodu, salīdzinoši viegli izjauc visaugstākās kvalitātes skenēšanu un nodrošina papildu rīku kopumu. No trūkumiem, nevis ērtākie, īpaši iesācēju lietotājam, tiek atšķirts. Vienā vai otrā veidā Rietumu tirgus universālajā daļā ir tiešs konkurents ar Finereader un angļu valodas vērtējumiem, viņi cīnās savā starpā, un tāpēc, manuprāt, programmai vajadzētu būt cienīgai.
Tas ir tālu no visām šāda veida programmām, ir arī dažādas iespējas mazām bezmaksas programmām, taču, eksperimentējot ar tām, es tām atradu divus galvenos trūkumus: kirilica alfabēta atbalsta trūkums vai atšķirīgs, ne pārāk noderīgs ziņā instalācijas un tāpēc nolēma tos šeit neminēt.