Cum de a organiza apărarea site-ului parsare

De la 1 punctul care nu are fonduri suficiente pentru a proteja împotriva Derivatoare.
Singura întrebare este, cât de mult sunteți dispus și pot face viața dificilă pentru parser.
Și este necesar? Poți - „Evazivi Joe“?
Tot ceea ce se poate citi și să recunoască oamenii (care este ceea ce se face pentru oameni și site-ul?) Poate fi reprodus. Partea în care parsing pot fi automatizate, acesta va fi automatizat.
Acum, există Derivatoare puternice Yandex și Google. Dacă acestea sunt site-ul dvs. nu va fi capabil să înțeleagă, și nu va indexa, apoi informații utile ajunge la utilizatorul final.
Și cel care vrea să-l copieze, în cazul în care este foarte necesară informația. Chiar dacă prezintă un mozaic de imagini și piese, chiar dacă le criptați, dar informațiile de pe ecran ar trebui să fie în continuare ușor de citit, printskrin atât de simplu și de recunoaștere în FineReader va fi mai rapid decât a scrie o protecție de la el.

Arunca această activitate!

Nu există nici o protecție creat de om, care nu este posibil să se rupă în jos, o chestiune de timp.
Singurul mod în care această cheie de criptare cu eliberarea clientului. Dar clientul - persoana nu este de încredere, iar informațiile plutească departe, problema de preț!

Și încă o dată-l arunc afară!

M-am gândit prea o dată despre el, dar ceea ce nu a venit. Fiecare protecție complică sistemul și crește numărul de erori. Utilizatorul du-te repede departe de site-ul dvs., doar din cauza unei erori în script-ul nu primește date utile.

Ultima sfat: plasați-l!

Singurul lucru care te poate ajuta, aceasta nu dezvăluie pe deplin toate informațiile despre acest subiect, sau împărțit în mai multe părți, dar nu ar trebui să fie un inconvenient pentru vizitatori. De exemplu, ascunde „numărul de dinți în treptele de viteză“ orice informații cheie, fără de care „avionul nu va zbura.“

Și dacă vrei să joci, apoi a venit cu ideea de a combina un anumit algoritm de text, care este apoi restaurat, aplicând stiluri pentru a ascunde cuvintele „false“ sau fraze. De exemplu, setați stilul, care ascunde orice altă propoziție sau cuvânt. Dar, din păcate, se rupe cu un bang! Dar aduce bucurie hackeri :-)

Ne pare rău pentru atât de mult confuzie!

1. interogări dinamice. Ei bine, dă niște dureri de cap pentru atacator, dar nu este la fel de dificil pe cât pare.

2. Aspect. Nu știu despre interdicția de la motoarele de căutare, dar, de asemenea, descompune. Doar ia etichetele și toate. Doar parser adăugat filtru „inteligent“. Puteți cu siguranță, undeva în imaginea de fundal înlocui, sau o imagine a textului, dar este posibil să se facă parserul.

3. Blocarea de IP nu este o plimbare, pentru că ei pot răni oameni reali, suficient pentru a utiliza un IP dinamic.

În general, puteți pune problema într-un alt mod: „Alinierea capcane pentru parserul“ Asta este de a prinde pe ceea ce oamenii obișnuiți și browsere nu vor face. De exemplu, pentru a umple „câmpul ascuns parolă.“ capcane de succes vă va oferi o oportunitate de a identifica coajă, dar este mai bine să faci câteva verificări, și este posibil și utilizator real interzis. Și nu ar interzice, și să fuzioneze vechi ușor modificate sau parțial. Acest Infa ar putea deveni un marker pentru a identifica persoana care vrea cu adevarat de la tine „merge“.

În primul rând: Da. O altă paralelă și capturi de ecran pot trage.
Apropo, pentru link-uri dinamice vor ucide SEO.

în al doilea rând:
1. nu
2. interdicție potențială / pessimizatsiya
3. nu funcționează, deoarece parsarea fost mult timp făcut printr-o listă de proxy imens
4. Baie de deghizarea curat imediat

Problema ar putea fi rezolvată parțial, dacă ar exista o modalitate de a determina în mod fiabil crawler. Dar, din păcate, roboții pot pentru unele dintre nevoile lor de producție pentru a merge la site-ul „sub masca de“ acolo totul și Weathertop.

Împuternici oameni pentru a da

M-am bucurat aici astfel de metode pentru a proteja blocuri mici de text:
1. Generarea de texte ca imagini - utilizate în mod obișnuit ca e-mailuri ascund, dar poate fi orice doriți să generați. Puteți suprapune filigrane, utilizați suport multi-color, iar cel mai bun pentru a insera caractere arbitrare în locații arbitrare în aceeași culoare ca și textul principal - de recunoaștere în rezultatele vor fi gunoi.
2. Introduceți textul stil casual gunoi tag-uri c dinamic


Textul arată ca un notebook. și în cazul în clipboard pentru a copia notex862book.

secvențele de zgomot ar trebui să fie, adică nu depinde de timp, vreme, sau generatorul de numere aleatorii. Ea trebuie să depindă de text. Acest lucru este pentru a evita recuperarea textului nealterate prin generarea mai multor imagini sau text cu „zgomot“.

Ambele metode conduc la pierderea de performanță

Destul de interesant. Și este posibil mai în detaliu, ceea ce înseamnă că trebuie să depindă de text? Și ceea ce este legătura de text zgomotos și generarea imaginii?

Anton Tikhomirov. Se pare că a fost o întrebare la numele de clasă făceau parte dintr-un hash al textului propriu-zis

$ SHA1 = SHA1 ($ text);
$ Class1 = "primele 5 litere ale $ SHA1";
$ Class2 = "5 litere sluduet $ SHA1";
.
$ Class8 = "ultimele 5 litere $ SHA1";
apoi stilurile de generator
apoi amestecarea text și tag-uri

Cred că unele prostii.
Acum puteți arăta prin intermediul paginii PhantomJS, apoi prin jQuery elimina tot ceea ce nu este vizibil.
jQuery ( 'organism: ascuns') șterge () și toate.

Cum de a organiza apărarea site-ului parsare

1 Încărcarea conținutului prin intermediul Ajax înainte de această generație de token. Dar motoarele de căutare pot fi furios.
2 aspect trebuie să fie nu numai dinamic și pentru fiecare intrare are propriile sale motoare de căutare pentru a fi Kinder. De exemplu:

Cea mai mare parte este o dilemă între prietenie cu motoarele de căutare, precum și informații de siguranță. Mai bine, pur și simplu să informeze imediat cu privire la conținutul lor Yandex - în prin addurl, are, de asemenea, o caracteristică pentru a informa cu privire la conținut nou în cazul în care textul se potrivește. După aceea, puteți depune o plângere la hoț. Spune că ajută site-uri hoț pesimiziruyut.

Dacă sunteți în mod constant de gând să dea aspect dinamic, de exemplu, pentru a schimba numele claselor și divuri, motoarele de căutare nu este de a fi plăcut. În Google există o caracteristică la îndemână pentru marcarea „balize“ pe pagina. Este necesar să se specifice în cazul în care vă text, în cazul în care antetul în care previzualizare și se va analiza în mod automat site-ul dvs. după cum este necesar. Dar acest lucru poate fi uitat cu un aspect dinamic.

Concluzie: Ideea dubioase anti-Pasing, SEO te va urî pentru asta.

10 un an TCI anulat. Acum, toată lumea poate. )

Frontend și Django

Alte acțiuni ale piling sus de cârje pur și simplu nu are sens.

Cum de a organiza apărarea site-ului parsare

Te rog, toate webmasteri, vă uitați să menționați 3 puncte!
Toată lumea știe despre consolă și codul sursă, copiați mai greu.