Bypass CAPTCHA parsing pe php, Trepachov Dmitry
site-uri web parsing
În această lecție vom învăța cum să ocolească captcha. CAPTCHA - Aceasta este o imagine a datelor care trebuie să fie introduse în intrare pentru a depune formularul.
Captcha plasate pe formular în cazul în care doriți să obțineți în jurul valorii de să-l completați automat parserul. Cu toate acestea, aproape orice CAPTCHA poate fi eludate. Acest lucru ne întoarcem acum.
Cum CAPTCHA
Pentru a CAPTCHA de by-pass, aveți nevoie pentru a înțelege modul în care acesta este aranjat în interior.
Când vom merge la o pagină cu un formular - există deja un CAPTCHA sau este încărcat după un timp.
În cazul în care face acest CAPTCHA? Acesta este generat atunci când manipularea script PHP pe URL-ul specificat, chiar dacă, de exemplu, adresa URL, astfel - capcha.php. Apoi, în forma HTML pentru imaginea CAPTCHA este codul de mai jos:
.Dacă vom merge la pagina cu forma, captcha imagine strânge automat cu pagina capcha.php.
In aceasta pagina capcha.php - este un script care generează un șir aleatoriu care face CAPTCHA o imagine și dă-l în browser.
În plus, pagina capcha.php pastreaza linia cu captcha în sesiune. Este necesar să se verifice intrarea corectă pe formular se depune CAPTCHA.
Dacă ne întoarcem la pagina capcha.php - de fiecare dată când va da un nou CAPTCHA și, în consecință, acest nou CAPTCHA va suprascrie cele mai vechi din sesiune.
Cum de a ocoli captcha
Deci, acum știi cum să construiască captcha. Să ne acum despre cum să obțineți în jurul ei. Pentru a face acest lucru, aveți nevoie pentru a face mai multe cereri folosind FLEXIE.
Primul este de a trimite o cerere la o imagine captcha. În cazul în care să-l trimită - puteți vedea în formularul HTML, sau pot fi urmărite într-un program de depanare, în cazul în care sunt trimise cereri.
Rezultatul acestei operațiuni va fi o imagine, o puteți salva într-un fișier folosind file_put_contents. De ce salva - pentru a putea citi captcha, și demontați-l în nici un fel (pentru a porni manual).
Cererea captcha necesar ar trebui să fie trimise prin curbarea, file_get_contents și nu, așa cum suntem siguri de a fi luate și îndreptați cookie-uri - deoarece CAPTCHA alimentat de sesiuni PHP.
Deci, pentru a primi captcha, salvați-l într-un fișier, Analizează manual captcha si casca a doua cerere are o pagină cu un formular cu datele POST pentru formularul (și CAPTCHA demontat).
Nu face o greșeală și nu fac interogare inutile afișate într-un CAPTCHA!
Utilizarea serviciilor de recunoaștere
În exemplul anterior, recunoaștem manual, dar cel mai adesea este imposibil de făcut.
Este mai bine pentru a conecta un serviciu special, care a antrenat chinezii pentru un ban în afară CAPTCHA.
Cum funcționează: citiți captcha în fișierul, și apoi folosind serviciul API-ul trimite captcha la serviciu. După 3-5 secunde, veți obține captcha înapoi dezasamblat.
Este o placere nu scump - mai putin de un dolar pe 1000 captchas demontate.
Serviciul anti-captcha
simplu CAPTCHA
Rețeaua neuronală
Ce se face în continuare:
Mai departe spre rezolvarea problemelor la următorul link: obiective pentru lecție.
Când toate decid - du-te la studiul unui subiect nou.