Leitanlegt PDF

Umbreyta skönnuðu PDF í leitanlegt PDF

Eftirfarandi niðurstöður sem ekki er hlaðið niður eru tiltækar:


    

Þín skoðun er okkur mikilvæg

Almennt séð, ertu ánægður með vinnu umsóknarinnar og niðurstöðu vinnunnar?

Skrár eru hlaðið upp...

Senda niðurstöðu til:

Slepptu skrám

Eða velja skrá á tölvunni

Leitanleg PDF-skrá, einnig þekkt sem OCR (Optical Character Recognition) PDF, er stafrænt skjal sem inniheldur bæði skannaðar myndir af síðum upprunalega skjalsins og viðurkenndan texta sem fæst úr þeim skönnunum. Þetta viðurkenningarferli gerir þér kleift að leita og auðkenna texta í PDF-skjali eins og þú myndir gera í venjulegu textaskjali.

Svona virkar það venjulega:

Skönnun: Í fyrsta lagi er PDF skjalið skannað í stafrænt myndsnið. Þessi skannaða mynd er í meginatriðum skjalasíðumynd.

Optical Character Recognition (OCR): Næst er OCR hugbúnaður notaður til að greina skönnuðu myndirnar og þekkja textastafi sem birtast í þeim. Þessi hugbúnaður auðkennir einstaka stafi eða orð og breytir þeim í véllesanlegan texta.

Textalagi bætt við: Þekktum texta er síðan bætt við sem falið textalag við PDF skjalið. Þetta textalag er áfram ósýnilegt fyrir áhorfandann en er aðgengilegt leitarvélum og textavalsverkfærum.

Sameina texta og myndir: OCR-unninn texti er sameinaður upprunalegum skönnuðum myndum til að búa til leitarhæfa PDF-skrá sem inniheldur bæði sjónræna framsetningu á skjalinu og undirliggjandi textagögnum.

Kostir leitarhæfra PDF-skjala: leitarmöguleiki, aðgengi fyrir fólk með sjónskerðingu,

textaflokkun leitarvéla og annarra.

gagnaútdráttur: Fyrirtæki geta dregið út skipulögð gögn úr skjölum eins og reikningum eða eyðublöðum til að gera sjálfvirkan gagnafærsluferli.

Það er mikilvægt að hafa í huga að OCR gæði og nákvæmni textagreiningar geta verið mismunandi eftir þáttum eins og gæðum upprunalega skjalsins, OCR hugbúnaðinum sem notaður er og tungumáli textans. Háþróaður OCR hugbúnaður getur séð um mörg tungumál og bætt nákvæmni með því að nota vélanámstækni, sem gerir leitanleg PDF skjöl að dýrmætu tæki fyrir skjalastjórnun og upplýsingaleit.

Athugaðu að ef síðunum þínum er snúið, mælum við með því að þú snúir þeim í rétta stefnu fyrir betri textagreiningu. Þú getur gert þetta með því að nota PDF síðu snúninginn.

Velkomin í vefforritið okkar til að umbreyta skönnuðum PDF skjölum í leitanleg! Hvort sem þú ert að nota tölvu eða farsíma, þá býður þægilegur vettvangur okkar upp á leitarhæfa PDF-viðskipti í öllum stýrikerfum.

Ókeypis vefhugbúnaðurinn okkar án skráningar og án kóðastaðfestingar styður textagreiningu á allt að 32 tungumálum.

Ímyndaðu þér skilvirkni þess að umbreyta allt að 10 skrám í einni umferð! Við skiljum mikilvægi auðlindastjórnunar, þess vegna er vefforritið okkar með heildarskráarstærðartakmörk upp á 32 MB á hverri ferð. Þetta tryggir að þú getur umbreytt miklu magni af gögnum á sama tíma og þú heldur hámarksframmistöðu. Það getur tekið nokkrar klukkustundir að umbreyta stórum PDF-skjölum sem hægt er að leita að, svo við höfum sett fram framvindustiku til að láta þig vita hversu lengi þú þarft að bíða eftir að umbreytingunni lýkur.

Þó að skrárnar þínar séu geymdar á þjóninum okkar í 24 klukkustundir, metum við friðhelgi þína, svo við leyfum þér að eyða skrám strax eftir vinnslu.

Upplifðu þægindin við forritið okkar, sem er fáanlegt ókeypis og er fáanlegt á hvaða tölvu- eða farsímastýrikerfi sem er.

Þú getur líka borið kennsl á texta í rastermyndum með OCR textagreiningunni okkar.

Hvernig það virkar

1

Veldu skrár

Þú getur valið skrár úr skráarkerfinu, Dropbox og Google Drive.

2

Ýttu á hnappinn “Umbreyta”

til að hlaða inn skrám til vinnslu.

3

Bíddu eftir því að ljúka

Það mun taka frá 10 sekúndum til nokkurra mínútna eftir fjölda og stærð skráanna.

ALGENGAR SPURNINGAR

Hvað er leitanlegt PDF?

Leitanlegt PDF, einnig þekkt sem OCR (Optical Character Recognition) PDF, er tegund skjals sem inniheldur bæði skannaðar myndir og véllæsanlegan texta. Þetta gerir notendum mögulegt að leita að og velja texta innan skjalsins, afrita hann og framkvæma textatengdar aðgerðir. Þar af leiðandi verður innihald PDF-myndarinnar leitanlegt og breytt.

Hvernig eru PDF skjöl sem hægt er að leita til?

Leitanleg PDF skjöl eru búin til með Optical Character Recognition (OCR) tækni. OCR hugbúnaðurinn skannar textann í skjali, þekkir stafina og fellir þennan texta ósýnilega inn í PDF skrána, samhliða skönnuðum myndum. Þetta falda textalag er notað til að leita og val á texta.

Get ég leitað að tilteknum orðum eða orðasamböndum í leitanlegu PDF?

Já, einn helsti kosturinn við leitanlegt PDF er hæfileikinn til að leita að tilteknum orðum eða setningum. Þú getur notað tólið okkar til að leita að orðum.

Eru einhverjar takmarkanir á PDF skjölum sem hægt er að leita?

Þó að PDF skjöl sem hægt er að leita séu mjög gagnleg, hafa þau nokkrar takmarkanir: OCR nákvæmni: Gæði OCR niðurstaðna geta verið mismunandi eftir hugbúnaði og gæðum skanna skjalsins. Skráarstærð: Leitanleg PDF skjöl eru oft stærri í skráarstærð samanborið við þær sem ekki eru leitaðar vegna innfellds texta. Formatning: OCR kann ekki að varðveita flókið snið, letur eða skipulag nákvæmlega.