Cum pentru a curăța scanari de cărți și de a face cartea citit on-line, kpnemo (ivanstorogev)

Există 2 moduri:

După scanarea cărților ei este de așteptat să se răspândească în rețea (sau stocate pe disc).

1) Este posibil să se recunoască scanează în programul OCR, cum ar fi FineReader (FR).

În cazul în care calitatea originalului este bun, cum ar fi imprimarea pe lazernike cu dimensiunea fontului 12pt, FR recunoaște perfect, fără măsuri suplimentare. Dar dacă trebuie să recunoască cartea veche pe hârtie galben dur, murdar și așa mai departe. N ... Aici pre-tratament creste in mod dramatic calitatea de recunoaștere, ceea ce înseamnă că mult mai puțin timp de lucru și se va lua pentru a corecta, și anume corectarea manuală a erorilor. Trebuie să spun că agenții de curățare a imaginii FR încorporate destul de primitive, scanari zgomotoase atât de rău că se descurcă contează.

2) Puteți stoca nedetectate, ca un bitmap, într-o formă sau alta: DjVu, PDF, TIFF.

Pentru a curăța imaginea este folosit in mai multe metode și programe diferite, uneori în valoare de zeci de mii de dolari. Voi descrie un mod simplu și accesibil, deosebit de valoros în care armele vor trebui să lucreze cu o singură pagină a cărții, iar restul pot fi prelucrate în mod automat, pe baza parametrilor stocate.

Scanarea unei cărți este necesară modul în tonuri de gri (gri). Notă: modul de scanare b / w (alb-negru) nu poate fi! În modul b / w, prelucrarea ulterioară nu este posibilă.

Puteți scana în imagine reală (full color), dar va încetini procesarea, crește dimensiunea fișierelor și de a câștiga speciale nu vor. Excepția este atunci când paginile au pete de culoare de murdărie, apoi de lucru cu culoare poate ajuta foarte mult.

Unele scanere vă permit să selectați unul dintre canalele de culoare (roșu, verde, albastru), care va fi folosit la scanarea în gri, există alte setări, și pot, de asemenea, poftă de mâncare. Dar nu te dus departe, cele mai multe dintre caracteristicile de procesare a imaginii scanerului doar șoferul. Același lucru se poate face in Photoshop, doar mult mai bine.

Încercați diferite opțiuni, alege pe cel care aveți nevoie, în cazul în care contrastul imaginii, literele sunt mai clare. În cazul în care zgomotele mici (de exemplu, textura hârtiei) va fi, în limite rezonabile, și mai mult - nu contează, apoi îndepărtați.

Pe de altă parte, în cazul în care hârtia are o mare, dimensiune litere 2-3 și mai mari pete, atunci ar trebui să încercați să alegeți setările scanerului, astfel încât aceste pete erau palide în comparație cu literele, deși la costul de contrast mai puțin în comparație cu alte variante de litere .

Pur și simplu pune, configurați scanerul:

1) În cazul în care nu există pete mari, cel mai important lucru pentru a face scrisori clare, dar zgomotul nu este arata deosebit.

2) Dacă există patch-uri mari, cele mai importante din profiturile lor, chiar dacă scrisorile nu sunt atât de clare.

În orice caz, nu trebuie să exagerați, ghidat de experiență și de bun simț.

Dacă utilizați pentru a scana FR, apoi debifați opțiunile pentru a scana „Clear Image“, „elimina denaturarea linii“, „Împărtășește inversări.“ Tot ce faci acest lucru, atunci când scanează curate și să le retragă înapoi la FR. În această etapă, orice prelucrare a imaginii în FR doar lent de scanare și curățare de imagine programe afecteaza de mai potrivite.

Pentru a selecta rezoluția scanării.

De obicei, cărți cu text scanate cu o rezoluție de 300dpi. Aceasta este o valoare bună pentru un text curat, de imprimare de calitate decentă și nu font prea mic, pe scurt un alt best-seller ca „Blind vs Blind“. Dar, în acest caz, va fi necesară și de curățare. Atunci când o imagine zgomotos, amenda de imprimare trebuie să scanați la o rezoluție de 600 dpi. Acest lucru va facilita în mare măsură curățarea și calitatea fișierului finale, dacă nu recunosc cartea, și păstrați-l într-un bitmap comprimat. Nu vă faceți griji cu privire la dimensiunea fișierului final. Ei bine, carte periat cu o rezoluție de 600 dpi în timpul comprimării în fișier DjVu dă un pic mai mare decât o rezolutie de 300dpi.

forma de stocare Raster de cărți cel mai des utilizate pentru cărți cu formule. În acest caz, rezoluția de scanare de 600 dpi este necesară pentru a fi altfel dificil să dezasambleze indicii în formule pentru a distinge caractere similare, cum ar fi „omega“ și w. Dar, în matematică indici frecvent sub (index). Există scanare de 300 dpi este, în general dificil de a face din nimic, mai ales de imprimare. Uita-te:

Scrisori i și j în imaginea din stânga este dificil să se distingă unele de altele. Dar nu scanează, și tipări într-un fișier. La scanarea totul va fi mult mai rău - un punct mic pe hârtie și totul, și 2 puncte la examen!

Scanare pentru scopurile noastre au nevoie de o 600dpi!

Într-un caz extrem, 400dpi.

Acum trebuie să selectați pagina demo pentru a configura software-ul de procesare pentru a procesa restul în mod automat, în modul de lot. Selectați pagina normală, tipică poate fi un pic mai murdar decât media.

Vezi toate paginile otskanennye ale cărții, pot exista unele nevoie pereskanit.

Toate puternic poluat, distorsionat, cu un font mai mic decât restul, cu pete foarte mari, cu desene ale întregului sau aproape întreaga pagină, etc. imediat pus într-un dosar separat. Ele sunt mai ușor de manipulat separat, unul câte unul. De obicei, astfel de un pic.

Apoi se procedează la prelucrarea scanări secvențial în programul NeatImagePro +, apoi în Photoshop. Să începem cu prima.

Vom avea nevoie de program + NeatImagePro (NI +), ea are multe caracteristici unice, cum ar fi aceasta poate ajuta pentru a face imagini minunat „plin de farmec“ de nuditate. Aici este site-ul ei: neatimage.com. Dar nu avem nevoie să, acolo nu se distribuie în mod liber. Din fericire, mi-au, și noi toți Rapidshare:

Neat Image Pro + v5.0.5.0 Edition

Acest lucru nu este cea mai recentă versiune, dar cu medicamentul și este de lucru.

NI + funcționează după cum urmează: o parte caracteristică a imaginii se distinge de zgomot, dar fără imaginea dorită. Programul evalueaza site-ul și „scădere“ zgomotul întregii imagini.

Am citat „subtracts“, pentru că nu este cu adevărat „scãderi“ și se multiplică, și zgomotul de imagine, și reprezentarea lor bidimensional spectrale. De asemenea, nu se multiplică dacă într-un sens școală ... Dar suntem în junglă nu este :-) util.

Fereastra principală a programului este organizat în file:

1) Tab: Intrare Imagine

Despre cum să încărcați un fișier în program, nu voi spune, voi nota doar că NI + nu dorește să deschidă un TIFF 8 biți, în cazul în care este salvat, de exemplu, de la Photoshop ca o paletă de 8-biți indexată cu, dar se deschide în mod normal, atunci când TIFF salvați-l ca tonuri de gri.

2) Tab: Dispozitiv de zgomot Profil

În această etapă, trebuie să aleagă stația de scanare, în cazul în care nu există scrisori și imagini, dar există zgomote caracteristice. Notă: benzile întunecate în jurul coloanei vertebrale sau pe margini, de asemenea, nu ar trebui să intre în alegerea noastră. Pe zona selectată indicată de săgeata din Fig. 1:

După ce vom selecta un loc corespunzător, este necesar să faceți clic pe „Rough NoiseAnalyzer“ de pe panoul din stânga în figura 1 este evidențiat în galben. Cu ceva timp observa bara albastră ... și în panoul din stânga, sub butonul de spus, vor exista setări suplimentare (Fig. 2).

Cel mai simplu mod de a apăsa butonul „Auto reglează fin“ (evidențiat în galben), și mergeți la fila 3:

3) Tab: Setări filtru de zgomot

Aici vom configura filtrul astfel încât să fie cât mai clar posibil litera și ucide zgomotul. Înainte de a seta filtrul este necesar să se selecteze un teren adecvat de teren cu o imagine utilă și măriți-l la ecran complet. selectarea site-ului ar trebui să fie ghidate de următoarele considerente:

1) Ia necesitatea de strâns posibil porțiune de zgomot;

2) Concomitent cu acest site ar trebui elementele cele mai mici imagini utile, cum ar fi un tip mic.

Din moment ce nu procesăm pisica fotografie pentru animale de companie și textul, naturalețea imaginii nu ne pasă. Principalul lucru pe care scrisorile au fost pochetche, și mai puțin zgomot. Deci, nu ezitați să se mute glisoarele de pe partea stângă a panoului și a vedea ce se întâmplă. Fii atent la micile detalii ale literelor: ponytails, de exemplu, compara „C“ și „G“; porțiunile interioare ale literelor, cum ar fi pe partea de sus a paginii.

Navigare rapidă înapoi: Ctrl + ←, transmite Ctrl + →

Textul cărții este prezentat doar cu scop informativ.