Bypass CAPTCHA parsing pe php, Trepachov Dmitry

site-uri web parsing

În această lecție vom învăța cum să ocolească captcha. CAPTCHA - Aceasta este o imagine a datelor care trebuie să fie introduse în intrare pentru a depune formularul.

Captcha plasate pe formular în cazul în care doriți să obțineți în jurul valorii de să-l completați automat parserul. Cu toate acestea, aproape orice CAPTCHA poate fi eludate. Acest lucru ne întoarcem acum.

Cum CAPTCHA

Pentru a CAPTCHA de by-pass, aveți nevoie pentru a înțelege modul în care acesta este aranjat în interior.

Când vom merge la o pagină cu un formular - există deja un CAPTCHA sau este încărcat după un timp.

În cazul în care face acest CAPTCHA? Acesta este generat atunci când manipularea script PHP pe URL-ul specificat, chiar dacă, de exemplu, adresa URL, astfel - capcha.php. Apoi, în forma HTML pentru imaginea CAPTCHA este codul de mai jos:

.

Dacă vom merge la pagina cu forma, captcha imagine strânge automat cu pagina capcha.php.

In aceasta pagina capcha.php - este un script care generează un șir aleatoriu care face CAPTCHA o imagine și dă-l în browser.

În plus, pagina capcha.php pastreaza linia cu captcha în sesiune. Este necesar să se verifice intrarea corectă pe formular se depune CAPTCHA.

Dacă ne întoarcem la pagina capcha.php - de fiecare dată când va da un nou CAPTCHA și, în consecință, acest nou CAPTCHA va suprascrie cele mai vechi din sesiune.

Cum de a ocoli captcha

Deci, acum știi cum să construiască captcha. Să ne acum despre cum să obțineți în jurul ei. Pentru a face acest lucru, aveți nevoie pentru a face mai multe cereri folosind FLEXIE.

Primul este de a trimite o cerere la o imagine captcha. În cazul în care să-l trimită - puteți vedea în formularul HTML, sau pot fi urmărite într-un program de depanare, în cazul în care sunt trimise cereri.

Rezultatul acestei operațiuni va fi o imagine, o puteți salva într-un fișier folosind file_put_contents. De ce salva - pentru a putea citi captcha, și demontați-l în nici un fel (pentru a porni manual).

Cererea captcha necesar ar trebui să fie trimise prin curbarea, file_get_contents și nu, așa cum suntem siguri de a fi luate și îndreptați cookie-uri - deoarece CAPTCHA alimentat de sesiuni PHP.

Deci, pentru a primi captcha, salvați-l într-un fișier, Analizează manual captcha si casca a doua cerere are o pagină cu un formular cu datele POST pentru formularul (și CAPTCHA demontat).

Nu face o greșeală și nu fac interogare inutile afișate într-un CAPTCHA!

Utilizarea serviciilor de recunoaștere

În exemplul anterior, recunoaștem manual, dar cel mai adesea este imposibil de făcut.

Este mai bine pentru a conecta un serviciu special, care a antrenat chinezii pentru un ban în afară CAPTCHA.

Cum funcționează: citiți captcha în fișierul, și apoi folosind serviciul API-ul trimite captcha la serviciu. După 3-5 secunde, veți obține captcha înapoi dezasamblat.

Este o placere nu scump - mai putin de un dolar pe 1000 captchas demontate.

Serviciul anti-captcha

simplu CAPTCHA

Rețeaua neuronală

Ce se face în continuare:

Mai departe spre rezolvarea problemelor la următorul link: obiective pentru lecție.

Când toate decid - du-te la studiul unui subiect nou.

site-uri web parsing