Reklāma
Ja vēlaties pārveidot jebkuru izdrukātu tekstu digitālā tekstā, kuru varat kopēt, ielīmēt, rediģēt un meklēt, jums būs jāizmanto optiskās rakstzīmju atpazīšanas (OCR) skeneri.
Izvēloties skenēt vai fotografēt dokumentu, tas tiks saglabāts tādā formātā kā JPEG vai PDF. OCR programmatūra pēc tam var atpazīt burtus un ciparus šajos dokumentos un pārveidot tos par meklējams PDF 4 metodes, kā bez maksas izveidot un rediģēt PDF failusNo visiem izplatītajiem failu veidiem, kas atrodami mūsu skaitļošanas pasaulē, PDF, iespējams, ir viens no visierobežojošākajiem, tajā pašā laikā tas ir pieejams visiem, lai tos izmantotu (galvenokārt lasīšanai) ... Lasīt vairāk vai failā, kuru var rediģēt tādās programmās kā Microsoft Word.
Problēma ir tā, ka daži OCR skeneri darbojas daudz labāk nekā citi, un vislabākais ir diezgan smags makā.
Piemēram, Omnipage18 maksā 150 USD, bet ir īpaši labs dažādu valodu atpazīšanai. Adobe Acrobat Pro DC maksā acu dzirdināšanu 400 USD, taču tai ir neticami precīza precizitāte.
ABBYY FineReader maksā 150 ASV dolārus, taču fantastiski spēj pārveidot dokumentus, piemēram, žurnālus un brošūras, meklējamā tekstā. Vēlāk šajā rakstā mēs pārbaudīsim ABBYY tiešsaistes piedāvājumu.Tomēr, ja jūs meklējat bezmaksas alternatīvas, kuras varat lejupielādēt un izmantot operētājsistēmā Windows vai OS X, jums vajadzētu izmēģiniet šos OCR rīkus 5 labākie OCR rīki teksta iegūšanai no attēliemKad jums ir papīri, kā jūs visu izdrukāto tekstu pārveidojat par kaut ko tādu, ko digitālā programma spēs atpazīt un indeksēt? Netālu glabājiet labu OCR programmatūru. Lasīt vairāk . Bet, ja jūs labprātāk izmantotu bezmaksas, tiešsaistē OCR rīks turpiniet lasīt, jo esam izmēģinājuši dažus labākos, un rezultāti ir zemāk.
Pārbaude
Šķiet, ka vairums cilvēku tagad izmanto savus viedtālruņi, lai tos pārbaudītu Skenējiet un pārvaldiet savus ieņēmumus, ietaupiet vietu, papīru un laikuPapīra kvītis ir viegli pazaudētas, un tās ir grūti atrast, kad tās jums visvairāk vajadzīgas. Par laimi, digitālā režīma izmantošana atrisina abas šīs problēmas. Lasīt vairāk , Es nolēmu izmantot Lietotne Evernote skenējama (Bezmaksas operētājsistēmā iOS un Android). Es ieskenēju Ričarda Davkina pirmo lapu Alpīnisma kalns nav iespējams, lai redzētu, kādus rezultātus mēs varētu iegūt, izmantojot ļoti vienkāršu formatējumu. Es arī ieskenēju Tima Ferisa teikto Četru stundu šefpavārs izmēģināt skenerus ar nedaudz sarežģītāku formatējumu. Katru no šiem failiem es saglabāju kā PDF failu.
Pēc tam šie dokumenti tika palaisti caur dažiem šķietami labākajiem tiešsaistes OCR rīkiem, lai redzētu, cik labi viņi izturējušies.
Bezmaksas tiešsaistes OCR [vairs nav pieejams]
Par laimi, lai izmantotu bezmaksas tiešsaistes OCR, nav nepieciešama reģistrācija. Un es biju divreiz pārsteigts, kad redzēju viņu prasību saglabāt mana dokumenta formatējumu un izkārtojumu.
Vietne apgalvo, ka tā var atbalstīt PDF, GIF, BMP, JPEG, TIFF un PNG. Izejas var būt DOC, PDF teksta dokuments, RTF un TXT. Diemžēl es nevarēju uzzināt, vai viņiem ir faila lieluma ierobežojums.
Pamatdokuments uz PDF
Pārvērsts absolūti perfekti. Nav daudz ko teikt! Mēs dodamies uz a ļoti labs sākums.
Pamatdokuments DOC
Faktiski vārdi, šķiet, ir pārveidoti nevainojami, izņemot “ount” no “Rushmore kalna”, kaut kā dodoties AWOL. Tomēr formatējums ir atšķirīgs stāsts. Daudzi komati tika aizstāti ar pasvītrojumiem, un visa dokumenta punktos tika ievietoti nejauši atstarpes. Kad vēlāk redzēsit, kā šajā testā izturējās ar izcilāko programmatūru, tas nav nekas slikts pavisam.
Sarežģīts dokuments uz PDF
Dokumenta konvertēšana prasīja milzīgas 120 sekundes! Kad tas bija pabeigts, viss teksts tika pārveidots ar aptuveni 95% precizitāti, lai gan teksts atsevišķā lodziņā lapas augšējā labajā stūrī nebija meklējams. Arī dažas citas rakstzīmes visā PDF failā bija nepareizas.
Sarežģīts dokuments DOC
Šoreiz konvertēšana notika tikai 10 sekundes, tekstu atkal konvertējot ar aptuveni 95% precizitāti. Radās dažas dīvainas atstarpes problēmas, un programmatūrai bija grūtības konvertēt fontu dokumenta augšējā labajā stūrī, un tā izlaida dažas rakstzīmes šur un tur.
Spriedums
Ja vēlaties konvertēt vienkārši formatētus dokumentus uz PDF, tas ir fantastisks rīks. Pārejot uz DOC, rezultātiem nebija par ko rakstīt mājās.
i2OCR izvirza dažas iespaidīgas pretenzijas. Rīks atpazīst vairāk nekā 60 valodas, var apstrādāt vairāku kolonnu izkārtojumus (noņemot formatējumu), tam nav faila lieluma ierobežojumu, var konvertēt augšupielādētos failus un no vietrāžiem URL. Un arī jums nav jāreģistrējas, lai izmantotu šo rīku.
Pakalpojums darbojas, vienkārši iegūstot tekstu no jūsu attēla, pēc tam izvadot neformatētu tekstu. Pirms teksta kopēšanas uz citām programmām vai lejupielādi kā DOC, PDF vai HTML var ātri novērst kļūdas blakusskatā.
Piezīme: kad es mēģināju augšupielādēt savus PDF dokumentus, i2OCR tos noraidīja, tāpēc man vajadzēja tos konvertēt uz JPEG (uzņemot no tiem ekrānuzņēmumu, pēc tam augšupielādējot failus).
Pamatdokuments uz vienkārša teksta
Šī rīka darbības dēļ viss formatējums tiek zaudēts, lai gan attēla pārvēršana tekstā bija gandrīz nevainojama. Bija dažas nelielas kļūdas, piemēram, rindkopu atstarpe, un daži komati tika aizstāti ar periodiem, bet tie ir mazi niggles.
Sarežģīts dokuments vienkāršā tekstā
Lielākā teksta daļa tika pārveidota bez pārāk daudz kļūdu, izņemot virsrakstu un recepti augšējā labajā stūrī, kas nebija lasāms šim rīkam. Veids, kā kolonnas tika pārveidotas par vienkāršu tekstu, nebija tālu no ideāla. Ja vēlaties, lai šī pārvēršana būtu praktiska, līniju pārkārtošanai saskaņotos teikumos būtu nepieciešams daudz laika.
Spriedums
Pamata dokumentiem i2OCR darbojas lieliski. Ļoti jauks ir arī spēja rediģēt tekstu pirms lejupielādes. Sarežģītākiem dokumentiem konvertācija tomēr ir diezgan precīza, taču teksta izvades veids jūsu dzīvi daudz neatvieglos.
Tiešsaistes OCR pašlaik atbalsta 46 dažādas valodas un var konvertēt PDF, JPG, BMP, TIFF un GIF Word, Excel vai vienkāršā teksta formātā. Vietne apgalvo, ka “konvertētie dokumenti izskatās tieši tāpat kā oriģināli - tabulas, kolonnas un grafika”.
Versija, kuru varat izmantot bez reģistrēšanās, ļauj konvertēt līdz 15 attēliem stundā (5mb ierobežojums). Ja reģistrējaties kontam, pārsniedzot šo ierobežojumu, varat iegādāties vairāk lapu, vienlaikus arī konvertējot vairāku lapu dokumentus un ZIP arhīvus.
Pamatdokuments DOC
Pamatdokuments ir pārveidots nevainojami, izņemot romiešu ciparu Es netiek uzņemts. Kā vietne solīja, formatējums bija tieši tāds, kāds tas bija grāmatā. Kudos uz šo rīku.
Sarežģīts dokuments DOC
Pēc tam, kad biju sarūgtināts par iepriekšējiem OCR rīkiem, pārveidojot sarežģīto dokumentu, mani lielā mērā pārsteidza tiešsaistes OCR. Kā redzat iepriekš, izkārtojums bija gandrīz ideāls. Lai arī vēlreiz, recepte netika izvēlēta pārāk labi, bet citas mazākas kļūdas bija niecīgas.
Spriedums
Absolūti fantastiski tiešsaistes OCR rezultāti. Vienīgais negatīvais aspekts, ko es redzu, nav tas, ka konvertētos dokumentus nevar lejupielādēt kā PDF failus, jo pieminētajos izvades formātos ir tikai DOCX, XLSX un TXT.
Kā jau minēts iepriekš, ABBYY ir viens no OCR programmatūras tirgus līderiem, kas par pilnu, lejupielādējamu programmu maksā apmēram 150 USD. Viņi piedāvā 10 lappušu bezmaksas izmēģinājums tomēr viņu tiešsaistes rīkam (nepieciešama reģistrācija). Viņu tiešsaistes rīks, kas abonē USD 5, ļaus katru mēnesi konvertēt 200 lapas.
Pieņemtie faili var būt līdz 100 MB, jebkurā no šiem formātiem: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP un PNG. ABBYY atpazīst arī gandrīz 200 valodas. Izejas ir īpaši iespaidīgas, ar izvēli starp DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 un EPUB.
Jūs pat izmēģinājuma laikā varat izmēģināt pāris BETA funkcijas. Pirmais ir iespēja tulkot dokumentu citā valodā. Otrs ir eksportēt konvertēto dokumentu uz mākoņa krātuves kontu neatkarīgi no tā, vai tas ir Dropbox, Google Drive, Evernote, Microsoft OneDrive vai Box.
Pamatdokuments uz DOCX
Kopējie rezultāti bija labi, taču nav pārsteidzoši, ņemot vērā, ka tas ir premium klases produkts. Tika apmainīti vairāki komati un periodi, vairāki apgriezti komati tika aizstāti ar zvaigznīti, trūka pāris lielo burtu un viens vārds (literāte) tika uzrakstīts nepareizi.
Sarežģīts dokuments DOCX
Pēc konvertēšanas dokumentā bija ļoti maz teksta kļūdu (izņemot OCR, kas atkal cīnās ar šīs receptes fontu!), Taču formatēšana atstāja daudz vēlama.
Trīs kolonnas kaut kā aizņēma divas lappuses ar centrālo kolonnu tikai parādās otrajā lapā. Ja jūs patiešām gribētu darīt kaut kas ar šo pārveidoto dokumentu jūs galu galā izvilktu matus.
Pamatdokuments uz PDF
Pārskatot konvertēto PDF failu, es vispār nevarēju atrast kļūdu. Varbūt mēs esam atraduši, kur ABBYY izceļas. Fantastiski rezultāti.
Sarežģīts dokuments uz PDF
Atkal es nevarēju atrast kļūdas šajā pārveidotajā failā. Acīmredzami ABBYY zina, kā ārkārtīgi labi pārveidot par PDF.
Spriedums
Ja priecājaties samaksāt dažus dolārus, šķiet, ka konvertēšana uz PDF fenomenāli labi darbojas ar šo pakalpojumu un ir iespēja sinhronizēt konvertētos failus uz mākoņa krātuvi ir īpaši noderīga, ja skenējat lielu apjomu dokumenti. Tāpat kā citas iespējas, arī ABBYY joprojām nav izdomājis, kā nevainojami pārveidot dokumentus DOC, lai tos ērti rediģētu.
Galīgais rezultāts
Ja, tāpat kā vairumam cilvēku, jūs vienkārši meklējat ieskenēt dažus žurnālu rakstus un dažus mājsaimniecības rēķinus, jums šie dokumenti nav jārediģē. Tādēļ tieša konvertēšana uz PDF būs jums piemērota, jo jūs joprojām varēsit meklēt šajos dokumentos. Tam bezmaksas tiešsaistes OCR noteikti bija labākais bezmaksas rīks, kuru pārbaudījām. Tomēr, ja esat gatavs maksāt USD 5 mēnesī par gandrīz pilnību, ABBYY FineReader tiešsaistē bija nedaudz precīzāks.
Runājot par dokumentu konvertēšanu uz DOC, mums neizdevās atrast ideālu risinājumu, taču līdz šim labākie rezultāti bija no Tiešsaistes OCR. Pārveidošana nebija pilnīga, bet formatējuma integritāte lielākoties tika saglabāta neskarta, un kļūdas bija nenozīmīgas. Salīdzinot šos rezultātus ar “premium” piedāvājumu no ABBYY, jūs nevarat palīdzēt, bet būt milzīgam pārsteigumam.
Mēs neiekļāvām Google diska OCR iespējas šajā amatā; mazliet par Google izpratni, bet vairāk par to, ka mēs vēlējāmies izmēģināt dažus citus bezmaksas OCR pakalpojumus tiešsaistē.
Pār jums: kādus citus tiešsaistes OCR rīkus jūs ieteiktu mūsu lasītājiem? Un ko jūs esat mēģinājis, ka jūs nekad vairs neizmantojat?
Robs Nightingale ir ieguvis grādu filozofijā Jorkas universitātē, Lielbritānijā. Viņš ir strādājis par sociālo mediju vadītāju un konsultantu vairāk nekā piecus gadus, vienlaikus vadot seminārus vairākās valstīs. Iepriekšējos divus gadus Robs ir bijis arī rakstnieks tehnoloģiju jomā un ir MakeUseOf sociālā medija vadītājs un biļetenu redaktors. Parasti jūs viņu atradīsit ceļojumā…