Փնտրվող PDF

Վերափոխեք սկանավորված PDF- ը որոնելի PDF- ի

Հետևյալ չներբեռնված արդյունքները հասանելի են.


    

Ձեր կարծիքը կարևոր է մեզ համար

Ընդհանուր առմամբ, գո՞հ եք հավելվածի աշխատանքից և աշխատանքի արդյունքից։

Ֆայլերի վերբեռնում...

Ուղարկել արդյունքը հետևյալ հասցեին՝

Թողնել ֆայլերը

Կամ ընտրեք ֆայլը համակարգչում

Որոնվող PDF ֆայլը, որը նաև հայտնի է որպես OCR (Optical Character Recognition) PDF, թվային փաստաթուղթ է, որը պարունակում է ինչպես սկզբնական փաստաթղթի էջերի սկանավորված պատկերները, այնպես էլ այդ սկանավորումներից ստացված ճանաչված տեքստը: Ճանաչման այս գործընթացը թույլ է տալիս որոնել և ընդգծել տեքստը PDF ֆայլում, ճիշտ այնպես, ինչպես սովորական տեքստային փաստաթղթում:

Ահա թե ինչպես է այն սովորաբար աշխատում.

Սկանավորում. Նախ, PDF փաստաթուղթը սկանավորվում է թվային պատկերի ձևաչափով: Այս սկանավորված պատկերն ըստ էության փաստաթղթի էջի պատկեր է:

Նիշերի օպտիկական ճանաչում (OCR). Այնուհետև OCR ծրագրակազմն օգտագործվում է սկանավորված պատկերները վերլուծելու և դրանցում հայտնված տեքստային նշանները ճանաչելու համար: Այս ծրագիրը նույնականացնում է առանձին նիշերը կամ բառերը և դրանք փոխակերպում մեքենայաընթեռնելի տեքստի:

Տեքստի շերտի ավելացում. ճանաչված տեքստն այնուհետև ավելացվում է որպես թաքնված տեքստի շերտ PDF փաստաթղթում: Այս տեքստային շերտը մնում է անտեսանելի դիտողի համար, սակայն հասանելի է որոնման համակարգերին և տեքստի ընտրության գործիքներին:

Տեքստի և պատկերների համադրում. OCR-ով մշակված տեքստը համակցվում է բնօրինակ սկանավորված պատկերների հետ՝ ստեղծելով որոնելի PDF ֆայլ, որը պարունակում է և՛ փաստաթղթի տեսողական ներկայացում, և՛ հիմքում ընկած տեքստային տվյալներ:

Որոնվող PDF ֆայլերի առավելությունները՝ որոնելիություն, հասանելիություն տեսողության խանգարումներ ունեցող մարդկանց համար,

տեքստի ինդեքսավորում որոնման համակարգերի և այլոց կողմից:

տվյալների արդյունահանում. Ընկերությունները կարող են կառուցվածքային տվյալներ հանել փաստաթղթերից, ինչպիսիք են հաշիվ-ապրանքագրերը կամ ձևաթղթերը՝ տվյալների մուտքագրման գործընթացները ավտոմատացնելու համար:

Կարևոր է նշել, որ OCR որակը և տեքստի ճանաչման ճշգրտությունը կարող են տարբեր լինել՝ կախված այնպիսի գործոններից, ինչպիսիք են բնօրինակ փաստաթղթի որակը, օգտագործվող OCR ծրագրակազմը և տեքստի լեզուն: Ընդլայնված OCR ծրագրակազմը կարող է մշակել բազմաթիվ լեզուներ և բարելավել ճշգրտությունը՝ օգտագործելով մեքենայական ուսուցման տեխնիկան՝ որոնելի PDF-ները դարձնելով արժեքավոր գործիք փաստաթղթերի կառավարման և տեղեկատվության որոնման համար:

Ուշադրություն դարձրեք, եթե ձեր էջերը պտտվում են, խորհուրդ ենք տալիս դրանք պտտել ճիշտ կողմնորոշման վրա՝ տեքստի ավելի լավ ճանաչման համար: Դուք կարող եք դա անել՝ օգտագործելով մեր PDF էջի պտույտը:

Բարի գալուստ մեր վեբ հավելված՝ սկանավորված PDF ֆայլերը որոնելիի փոխարկելու համար: Անկախ նրանից՝ դուք օգտագործում եք համակարգիչ կամ շարժական սարք, մեր հարմար հարթակը ապահովում է PDF-ի որոնելի փոխակերպում բոլոր օպերացիոն համակարգերում:

Մեր անվճար վեբ ծրագրաշարը՝ առանց գրանցման և առանց կոդերի հաստատման, ապահովում է տեքստի ճանաչում մինչև 32 լեզուներով:

Պատկերացրեք մեկ անցումով մինչև 10 ֆայլ փոխարկելու արդյունավետությունը: Մենք հասկանում ենք ռեսուրսների կառավարման կարևորությունը, այդ իսկ պատճառով մեր վեբ հավելվածն ունի ֆայլի ընդհանուր չափի սահմանաչափ 32 ՄԲ յուրաքանչյուր անցումի համար: Սա ապահովում է, որ դուք կարող եք փոխարկել մեծ քանակությամբ տվյալներ՝ պահպանելով օպտիմալ կատարումը: Խոշոր որոնելի PDF ֆայլերի փոխակերպումը կարող է տևել մի քանի ժամ, ուստի մենք ներառել ենք առաջընթացի սանդղակը, որպեսզի իմանաք, թե որքան ժամանակ պետք է սպասեք փոխակերպման ավարտին:

Չնայած ձեր ֆայլերը պահվում են մեր սերվերում 24 ժամ, մենք կարևորում ենք ձեր գաղտնիությունը, ուստի թույլ ենք տալիս ջնջել ֆայլերը մշակումից անմիջապես հետո:

Զգացեք մեր հավելվածի հարմարավետությունը, որը հասանելի է անվճար և հասանելի է ցանկացած աշխատասեղանի կամ բջջային օպերացիոն համակարգում:

Դուք կարող եք նաև ճանաչել տեքստը ռաստերային պատկերներում՝ օգտագործելով մեր OCR տեքստային ճանաչիչը:

Ինչպես է այն աշխատում

1

Ընտրեք ֆայլեր

Դուք կարող եք ընտրել ֆայլեր ֆայլային համակարգից, Dropbox- ից եւ Google Drive- ից:

2

Սեղմեք կոճակը “Փոխակերպել”

վերամշակման համար ֆայլեր վերբեռնելու համար:

3

Սպասեք ավարտին

Այն կտեւի 10 վայրկյանից մինչեւ մի քանի րոպե կախված ֆայլերի քանակից եւ չափից:

ՀՏՀ

Ի՞նչ է որոնելի PDF- ը:

Որոնվող PDF- ը, որը հայտնի է նաև որպես OCR (օպտիկական նիշերի ճանաչում) PDF, փաստաթղթի տեսակ է, որը պարունակում է ինչպես սկանավորված պատկերներ, այնպես էլ մեքենայորեն ընթեռնելի տեքստ: Սա հնարավորություն է տալիս օգտվողներին որոնել և ընտրել տեքստ փաստաթղթում, պատճենել այն և կատարել տեքստի վրա հիմնված գործառույթներ։ Արդյունքում, PDF- ի բովանդակությունը դառնում է որոնելի և խմբագրելի:

Ինչպե՞ս են ստեղծվում որոնելի PDF- ները:

Փնտրվող PDF- ները ստեղծվում են նիշերի օպտիկական ճանաչման (OCR) տեխնոլոգիայի միջոցով: OCR ծրագրաշարը սկանավորում է փաստաթղթի տեքստը, ճանաչում նիշերը և անտեսանելի կերպով ներդնում է այս տեքստը PDF ֆայլում ՝ սկանավորված պատկերների կողքին: Այս թաքնված տեքստի շերտը օգտագործվում է որոնման եւ տեքստի ընտրության համար:

Կարո՞ղ եմ փնտրել կոնկրետ բառեր կամ արտահայտություններ որոնելի PDF- ում:

Այո, որոնելի PDF- ի առաջնային առավելություններից մեկը կոնկրետ բառեր կամ արտահայտություններ որոնելու ունակությունն է: Դուք կարող եք օգտագործել մեր գործիքը բառերի որոնման համար:

Որոնվող PDF ֆայլերի սահմանափակումներ կա՞ն:

Թեև որոնելի PDF- ները շատ օգտակար են, դրանք ունեն որոշ սահմանափակումներ. OCR ճշգրտություն: Որակը OCR արդյունքների կարող է տարբեր լինել կախված ծրագրային ապահովման եւ որակի սկանավորված փաստաթղթի. Ֆայլի չափը. Որոնվող PDF- ները հաճախ ավելի մեծ են ֆայլի չափերով, համեմատած ոչ որոնելիների հետ՝ ներդրված տեքստի պատճառով: Ֆորմատավորում. OCR- ը կարող է ճշգրիտ չպահպանել բարդ ձևաչափումը, տառատեսակները կամ դասավորությունը: