Mhux dejjem possibbli li t-test jiġi estratt minn fajl PDF bl-użu ta 'kkupjar konvenzjonali. Spiss il-paġni ta ’dawn id-dokumenti huma l-kontenut skannjat tal-verżjonijiet stampati tagħhom. Biex dawn il-fajls jiġu konvertiti f'dejta ta 'test li tista' tiġi editjata kompletament, jintużaw programmi speċjali bil-funzjoni ta 'Rikonoxximent ta' Karattru ottiku (OCR).
Tali soluzzjonijiet huma diffiċli ħafna biex jiġu implimentati u, għalhekk, jiswew ħafna flus. Jekk ikollok bżonn tirrikonoxxi t-test bil-PDF regolarment, huwa rakkomandabbli li tixtri l-programm xieraq. Għal każijiet rari, ikun iktar loġiku li jintuża wieħed mis-servizzi online disponibbli b'funzjonijiet simili.
Kif tirrikonoxxi test minn PDF online
Ovvjament, is-sett ta 'fatturi tas-servizzi onlajn tal-OCR huwa aktar limitat meta mqabbel ma' soluzzjonijiet ta 'desktop sħiħ. Iżda tista 'taħdem ma' riżorsi bħal dawn jew b'xejn, jew bi ħlas nominali. Il-ħaġa prinċipali hija li l-applikazzjonijiet tal-web korrispondenti jlaħħqu mal-kompitu ewlieni tagħhom, jiġifieri r-rikonoxximent tat-test, ukoll.
Metodu 1: ABBYY FineReader Online
Il-kumpanija għall-iżvilupp tas-servizz hija waħda mill-mexxejja fil-qasam tar-rikonoxximent tad-dokument ottiku. ABBYY FineReader għall-Windows u l-Mac hija soluzzjoni qawwija għall-konverżjoni tal-PDF għat-test u biex taħdem magħha.
Naturalment, il-kontroparti tal-programm tal-web hija inferjuri għaliha fil-funzjonalità. Madankollu, is-servizz jista 'jagħraf test minn skans u ritratti f'aktar minn 190 lingwa. Jappoġġja l-konverżjoni tal-fajls PDF f'dokumenti Word, Excel, eċċ.
ABBYY FineReader Online servizz onlajn
- Qabel tibda taħdem ma 'l-għodda, ħu kont fuq is-sit jew illoggja billi tuża l-kont Facebook, Google jew Microsoft.
Biex tmur fit-tieqa tal-login, ikklikkja fuq il-buttuna. "Login" fil-bar tal-menu ta ’fuq. - Ladarba tkun illoggjat, importa d-dokument PDF mixtieq fil-FineReader billi tuża l-buttuna "Ibgħat Fajls".
Imbagħad ikklikkja "Agħżel in-numri tal-paġna" u speċifika l-medda mixtieqa għar-rikonoxximent tat-test. - Sussegwentement, agħżel il-lingwi preżenti fid-dokument, il-format tal-fajl li jirriżulta u kklikkja fuq il-buttuna "Irrikonoxxi".
- Wara l-ipproċessar, li t-tul ta 'żmien tiegħu jiddependi kompletament fuq id-daqs tad-dokument, tista' tniżżel il-fajl lest bid-data tat-test sempliċement billi tikklikkja fuq isimha.
Jew tesportaha lejn waħda mis-servizzi tal-cloud disponibbli.
Is-servizz huwa distint, probabbilment, mill-iktar algoritmi ta 'għarfien tat-test preċiżi fl-istampi u fil-fajls PDF. Iżda, sfortunatament, l-użu ħieles tiegħu huwa limitat għal ħames paġni pproċessati kull xahar. Biex taħdem ma 'aktar dokumenti voluminużi, trid tixtri abbonament ta' sena.
Madankollu, jekk il-funzjoni tal-OCR hija meħtieġa rari ħafna, ABBYY FineReader Online hija għażla kbira għall-estrazzjoni tat-test minn fajls PDF żgħar.
Metodu 2: OCR b'xejn onlajn
Servizz sempliċi u konvenjenti għad-diġitizzazzjoni tat-test. Mingħajr il-ħtieġa ta 'reġistrazzjoni, ir-riżorsa tippermettilek tirrikonoxxi 15-il paġna sħiħa PDF fis-siegħa. OCR Free Online jaħdem bis-sħiħ ma 'dokumenti f'46 lingwa u mingħajr awtorizzazzjoni jappoġġja tliet formati ta' esportazzjoni ta 'testi - DOCX, XLSX u TXT.
Meta jirreġistra, l-utent ikun kapaċi jipproċessa dokumenti b'ħafna paġni, iżda n-numru ħieles ta 'dawn il-paġni huwa limitat għal 50 unità.
Servizz onlajn ta 'OCR b'xejn
- Biex tirrikonoxxi t-test mill-PDF bħala “mistieden”, mingħajr awtorizzazzjoni fuq ir-riżorsa, uża l-formola xierqa fil-paġna ewlenija tas-sit.
Agħżel id-dokument mixtieq billi tuża l-buttuna "Fajl", speċifika l-lingwa prinċipali tat-test, il-format tal-ħruġ, imbagħad stenna li l-fajl jitgħabba u kklikkja "Ikkonverti". - Fl-aħħar tal-proċess tad-diġitizzazzjoni, ikklikkja “Niżżel il-Fajl Output” biex isalva d-dokument lest bit-test fuq il-kompjuter.
Għal utenti awtorizzati, is-sekwenza tal-azzjonijiet hija kemmxejn differenti.
- Uża l-buttuna "Reġistrazzjoni" jew "Login" fil-bar tal-menu ta 'fuq biex, rispettivament, toħloq kont Free Online OCR jew mur fiha.
- Wara l-awtorizzazzjoni fil-panel ta 'għarfien, żomm iċ-ċavetta "CTRL", agħżel sa żewġ lingwi tad-dokument tas-sors mil-lista pprovduta.
- Speċifika aktar għażliet għall-estrazzjoni tat-test mill-PDF u kklikkja l-buttuna. "Agħżel Fajl" biex tgħabbi d-dokument fis-servizz.
Imbagħad, biex tibda r-rikonoxximent, ikklikkja "Ikkonverti". - Wara li tipproċessa d-dokument, ikklikkja fuq il-link bl-isem tal-fajl tal-produzzjoni fil-kolonna korrispondenti.
Ir-riżultat tar-rikonoxximent jinħażen minnufih fil-memorja tal-kompjuter tiegħek.
Jekk għandek bżonn tiġbed it-test minn dokument PDF żgħir, tista ’tuża l-għodda deskritta hawn fuq mingħajr periklu. Biex taħdem ma 'fajls kbar, ikollok bżonn tixtri simboli addizzjonali f'Xejn Online OCR jew tirrikorri għal soluzzjoni oħra.
Metodu 3: NewOCR
Servizz OCR b'xejn kompletament li jippermettilek tiġbed test minn kważi kull dokument grafiku u elettroniku bħal DjVu u PDF. Ir-riżorsa ma timponix restrizzjonijiet fuq id-daqs u n-numru ta 'fajls rikonoxxibbli, ma teħtieġx reġistrazzjoni, u toffri firxa wiesgħa ta' funzjonijiet relatati.
NewOCR jappoġġja 106 lingwa u kapaċi jimmaniġġja korrettament anki skans ta ’dokumenti ta’ kwalità baxxa. Huwa possibbli li tagħżel manwalment iż-żona għar-rikonoxximent tat-test fil-paġna tal-fajl.
Servizz onlajn NewOCR
- Għalhekk, tista 'tibda taħdem mar-riżors immedjatament, mingħajr il-bżonn li twettaq azzjonijiet mhux meħtieġa.
Fuq il-paġna ewlenija hemm formola għall-importazzjoni tad-dokument fuq is-sit. Biex ittella fajl lil NewOCR, uża l-buttuna "Agħżel il-fajl" fit-taqsima "Agħżel il-fajl tiegħek". Imbagħad fil-qasam "Lingwa (i) ta 'rikonoxximent" agħżel lingwa waħda jew iktar tad-dokument tas-sors, imbagħad ikklikkja “Tella '+ OCR”. - Issettja l-issettjar tar-rikonoxximent preferut tiegħek, agħżel il-paġna mixtieqa biex tieħu t-test, u kklikkja l-buttuna. "OCR".
- Skrollja 'l isfel ftit u sib il-buttuna. Niżżel.
Ikklikkja fuqha u fil-lista drop-down agħżel il-format meħtieġ tad-dokument għat-tniżżil. Wara dan, il-fajl lest bit-test estratt jitniżżel fil-kompjuter tiegħek.
L-għodda hija konvenjenti u tirrikonoxxi l-karattri kollha ta 'kwalità għolja biżżejjed. Madankollu, l-ipproċessar ta 'kull paġna tad-dokument PDF importat għandu jitnieda b'mod indipendenti u muri f'fajl separat. Tista ', ovvjament, tikkopja immedjatament ir-riżultati tar-rikonoxximent fil-clipboard u tgħaqqadhom ma' oħrajn.
Madankollu, minħabba l-influwenza ta 'hawn fuq, ammonti kbar ta' test bl-użu ta 'NewOCR huma diffiċli ħafna biex jiġu estratti. Bl-istess fajls żgħar servizz jaħdem "bi bang."
Metodu 4: OCR.Space
Riżorsa sempliċi u li tinftiehem għad-diġitizzazzjoni tat-test jippermettilek tirrikonoxxi dokumenti PDF u toħroġ ir-riżultat f'fajl TXT. M'hemm l-ebda limitu fuq in-numru ta 'paġni. L-unika limitazzjoni hija li d-daqs tad-dokument tal-input m'għandux jaqbeż il-5 megabytes.
OCR.Servizz onlajn tal-ispazju
- Reġistru biex taħdem ma 'l-għodda mhux meħtieġ.
Ikklikkja fuq il-link ta ’hawn fuq u ittella d-dokument PDF fuq il-websajt mill-kompjuter tiegħek billi tuża l-buttuna "Agħżel il-fajl" jew min-netwerk - b'referenza. - Fil-lista dropdown "Agħżel il-lingwa OCR" agħżel il-lingwa tad-dokument importat.
Imbagħad ibda l-proċess ta 'għarfien tat-test billi tikklikkja fuq il-buttuna. "Ibda l-OCR!". - Fi tmiem l - ipproċessar tal - fajl, ara r - riżultat fl - "Riżultat ta 'l-OCR" u kklikkja Niżżelbiex tniżżel id-dokument lest tat-TXT.
Jekk għandek bżonn biss tiġbed it-test mill-PDF u l-ifformattjar finali mhuwiex importanti għal kollox, OCR.Space huwa għażla tajba. L-uniku dokument irid ikun "monolingwali", billi r-rikonoxximent ta 'żewġ lingwi jew aktar fl-istess ħin fis-servizz mhuwiex provdut.
Ara wkoll: Analogi ħielsa FineReader
Meta tevalwa l-għodod onlajn ippreżentati fl-artiklu, ta 'min jinnota li l-FineReader Online minn ABBYY tittratta l-funzjoni ta' l-OCR bl-iktar mod preċiż u preċiż. Jekk l-akkuratezza massima tar-rikonoxximent tat-test hija importanti għalik, huwa aħjar li tikkunsidra speċifikament din l-għażla. Iżda biex tħallas għaliha, x'aktarx, iridu wkoll.
Jekk għandek bżonn iddiġitizza d-dokumenti żgħar u inti lest li tikkoreġi l-iżbalji fis-servizz innifsek, huwa rakkomandabbli li tuża NewOCR, OCR.Space jew Free Online OCR.