Citiți on-line cum să curățați scanari de cărți și de a face un autor de carte Storozhev Ivan kpnemo - rulit -
Există 2 moduri:
După scanarea cărților ei este de așteptat să se răspândească în rețea (sau stocate pe disc).
1) Este posibil să se recunoască scanează în programul OCR, cum ar fi FineReader (FR).
În cazul în care calitatea originalului este bun, cum ar fi imprimarea pe lazernike cu dimensiunea fontului 12pt, FR recunoaște perfect, fără măsuri suplimentare. Dar dacă trebuie să recunoască cartea veche pe hârtie galben dur, murdar și așa mai departe. N ... Aici pre-tratament creste in mod dramatic calitatea de recunoaștere, ceea ce înseamnă că mult mai puțin timp de lucru și se va lua pentru a corecta, și anume corectarea manuală a erorilor. Trebuie să spun că agenții de curățare a imaginii FR încorporate destul de primitive, scanari zgomotoase atât de rău că se descurcă contează.
2) Puteți stoca nedetectate, ca un bitmap, într-o formă sau alta: DjVu, PDF, TIFF.
Pentru a curăța imaginea este folosit in mai multe metode și programe diferite, uneori în valoare de zeci de mii de dolari. Voi descrie un mod simplu și accesibil, deosebit de valoros în care armele vor trebui să lucreze cu o singură pagină a cărții, iar restul pot fi prelucrate în mod automat, pe baza parametrilor stocate.
Etapa 1: Scan
Scanarea unei cărți este necesară modul în tonuri de gri (gri). Notă: modul de scanare b / w (alb-negru) nu poate fi! În modul b / w, prelucrarea ulterioară nu este posibilă.
Puteți scana în imagine reală (full color), dar va încetini procesarea, crește dimensiunea fișierelor și de a câștiga speciale nu vor. Excepția este atunci când paginile au pete de culoare de murdărie, apoi de lucru cu culoare poate ajuta foarte mult.
Unele scanere vă permit să selectați unul dintre canalele de culoare (roșu, verde, albastru), care va fi folosit la scanarea în gri, există alte setări, și pot, de asemenea, poftă de mâncare. Dar nu te dus departe, cele mai multe dintre caracteristicile de procesare a imaginii scanerului doar șoferul. Același lucru se poate face in Photoshop, doar mult mai bine.
Încercați diferite opțiuni, alege pe cel care aveți nevoie, în cazul în care contrastul imaginii, literele sunt mai clare. În cazul în care zgomotele mici (de exemplu, textura hârtiei) va fi, în limite rezonabile, și mai mult - nu contează, apoi îndepărtați.
Pe de altă parte, în cazul în care hârtia are o mare, dimensiune litere 2-3 și mai mari pete, atunci ar trebui să încercați să alegeți setările scanerului, astfel încât aceste pete erau palide în comparație cu literele, deși la costul de contrast mai puțin în comparație cu alte variante de litere .
Pur și simplu pune, configurați scanerul:
1) În cazul în care nu există pete mari, cel mai important lucru pentru a face scrisori clare, dar zgomotul nu este arata deosebit.
2) Dacă există patch-uri mari, cele mai importante din profiturile lor, chiar dacă scrisorile nu sunt atât de clare.
În orice caz, nu trebuie să exagerați, ghidat de experiență și de bun simț.
Dacă utilizați pentru a scana FR, apoi debifați opțiunile pentru a scana „Clear Image“, „elimina denaturarea linii“, „Împărtășește inversări.“ Tot ce faci acest lucru, atunci când scanează curate și să le retragă înapoi la FR. În această etapă, orice prelucrare a imaginii în FR doar lent de scanare și curățare de imagine programe afecteaza de mai potrivite.
Pentru a selecta rezoluția scanării.
De obicei, cărți cu text scanate cu o rezoluție de 300dpi. Aceasta este o valoare bună pentru un text curat, de imprimare de calitate decentă și nu font prea mic, pe scurt un alt best-seller ca „Blind vs Blind“. Dar, în acest caz, va fi necesară și de curățare. Atunci când o imagine zgomotos, amenda de imprimare trebuie să scanați la o rezoluție de 600 dpi. Acest lucru va facilita în mare măsură curățarea și calitatea fișierului finale, dacă nu recunosc cartea, și păstrați-l într-un bitmap comprimat. Nu vă faceți griji cu privire la dimensiunea fișierului final. Ei bine, carte periat cu o rezoluție de 600 dpi în timpul comprimării în fișier DjVu dă un pic mai mare decât o rezolutie de 300dpi.
forma de stocare Raster de cărți cel mai des utilizate pentru cărți cu formule. În acest caz, rezoluția de scanare de 600 dpi este necesară pentru a fi altfel dificil să dezasambleze indicii în formule pentru a distinge caractere similare, cum ar fi „omega“ și w. Dar, în matematică indici frecvent sub (index). Există scanare de 300 dpi este, în general dificil de a face din nimic, mai ales de imprimare. Uita-te: