Cerere de la un alt server sau site-ul folosind php

Salutări, dragi cititori webcodius.ru blog. În timpul dezvoltării diferitelor servicii web din timp în timp este nevoie pentru a colecta o varietate de informații de la alte site-uri. Ie necesare pentru a face site-uri de parsare. Parsarea caracteristică - o colecție de date rapidă și automată și conținutului de pe site. De exemplu, de multe ori nevoie pentru a obține un catalog, inclusiv imagini, de la diferite magazine online în modul automat. În acest caz, și mecanism util pentru analizarea site-uri.

Utilizate în principal în PHP sunt două modalități de a obține conținutul de pe site.

1. get - cerere folosind file_get_contents) funcția (.

Caracteristică vă permite să obțineți conținutul unui fișier într-un șir de caractere și are următoarea sintaxă:

file_get_contents string (string filename [, use_include_path bool [, context de resurse [, int compensare [, int maxlen]]]])
unde filename - calea către fișierul.

În caz de eșec, funcția returnează FALSE.

2. Utilizarea bibliotecii FLEXIE.

Dacă utilizați codul FLEXIE devine mai greoaie, dar există mai multe posibilități diferite, ca biblioteca este extrem de personalizabil și vă permite să obțineți și cereri poștale.

Conținutul Obținerea paginii este împărțit în patru etape:

  • Inițializarea sesiune prin intermediul funcției curl_init ();
  • setarea parametrilor relevanți prin intermediul funcției curl_setopt ();
  • interoghează funcția curl_exec ();
  • Definitivarea curl_close funcția ().

Dacă doriți să efectuați o cerere POST la site-ul de la distanță. este necesar să se CURLOPT_POST opțiunea setată la true. și CURLOPT_POSTFIELDS opțiunea de a plasa datele transmise:

Ca rezultat, ambele metode în variabila $ result devine conținutul paginii specificat ca linie de cod HTML. Apoi, puteți merge direct la parsarea paginii, care este, pentru a extrage datele necesare din conținutul liniei. De exemplu, pentru a obține toate imaginile de pe pagina sau pentru a extrage conținutul text.

Pentru parsarea, puteți utiliza expresii regulate, dar este mai bine să folosească biblioteca încorporat sau bibliotecă DOMDocument SimpleHTMLDOM.

Asta e tot, până când ne vom întâlni din nou!