Ocr în fișiere DjVu - o nouă abordare a Oportunități vechi

OCR în fișiere DjVu - o nouă abordare a caracteristicilor vechi.

Pe TFR este o mulțime de materiale cu privire la aplicarea DjVu, deoarece formatul devine din ce în ce mai popular, devine necesar să se completeze informațiile deja disponibile.

Cu privire la posibilitatea de OCR (Recunoaștere optică a caracterelor - Recunoașterea optică a caracterelor, de obicei text) în DjVu fost mult timp cunoscute, dar instrumentul numai pentru acest lucru nu a fost liber și nu software-ul ieftine din Lizard, dar chiar și el nu are și nu este de așteptat chirilic. În România, au existat încercări de a dezvolta un software care vă permite să depășească acest neajuns, dar a ajuns la bibliotecile tehnice, cel puțin, aceste informații pot fi găsite pe Internet vorbitori de limbă rusă.

Astăzi putem spune cu certitudine că OCR în fișiere DjVu a primit o nouă viață! Datorită eforturilor bulgare programator Gencho set de utilitare concepute pentru a permite de a primi fișiere DjVu cu textul, care permite plugin pentru Internet Explorer pentru a copia text în clipboard, și cel mai important - pentru a putea căuta documentul. Exact această caracteristică este cheia. De ce? Să presupunem că ați scanat și otkonvertili în referința tehnică DjVu, în cazul în care cu schemele de masă, formule, și alte lucruri care este practic imposibil de OCR. Nu există nici o șansă ca cineva vreodată de fapt face pe deplin retipariti cartea, nu este ficțiune, care constă în cea mai mare parte din numai text. Se pare că această carte este, dar găsirea în ea informațiile necesare în text este imposibilă, deoarece DjVu nu „curat“ pdf, în cazul în care textul de căutare stabilit implicit. În plus, OCR nu și nu poate garanta transmisia fără erori a informațiilor originale. Nici un program nu este capabil să identifice toate erorile după OCR, se poate face doar cu un om, dar este corectorul munca grea. Dacă textul simplu este încă posibil de a găsi și de a corecta anumite erori tipografice, în literatura de specialitate, care ar necesita un astfel de efort, care este puțin probabil acolo entuziast care pot testa pe deplin fiecare semn în fiecare formulă, și chiar re-colecta toate formulele dintr-un software special.

Toate informațiile necesare cu privire la utilizarea fișierelor DjVu OCR conținute în pachet. Primul pachet de a recunoaște ca atare, iar al doilea indexare recunoscut deja text.
Desigur, pentru aceste operațiuni, în plus față de DjVu encoder, trebuie să aveți cincea FaynRider sau versiunea 7-a, pot fi adăugate la această listă și versiunea 6-a.

În concluzie, aș dori să-i mulțumesc în numele radioamatori Gencho pentru activitatea sa privind crearea unui program gratuit pentru oricine care utilizează formatul DjVu.

Eroare în parametrii trecut