Salvați datele de pe site-uri, blog-ul Sammy

În acest articol, voi să vă descriu punerea în aplicare a unei singure idei în mai multe moduri.

Judecător pentru opțiunea pe care le alegeți. Vom merge în ordine, pe Yandex, Google și Bing, face o cerere „pentru a cumpăra un elefant“ și stochează rezultatele unui dosar.

Să începem cu iMacros.

Pentru cei care nu sunt“în subiect», iMacros stochează datele în dosarul implicit. A se vedea, în cazul în care ea a stabilit o cale nouă, sau puteți, așa cum se arată în imagini.

1) apasă pe butonul „Options“ de pe panoul iMacros.

Salvați datele de pe site-uri, blog-ul Sammy

2) Alegeți fila „Cale“ - vor fi specificate cale de a salva folderul.

Salvați datele de pe site-uri, blog-ul Sammy

Acum, face același lucru în Autoit:

Primele biblioteci line-link. În al doilea rând vom obține codul HTML al paginii. A treia linie menține toate fișier-search.html în Yandex dosarul în care este rulat scriptul.

Este tot la fel, doar un nume de fișier diferit.

În acest exemplu, a fost necesar pentru a converti alfabetul chirilic în codul HTML pentru Bing „înțelege“ ceea ce avem nevoie.

Dacă utilizați un browser, este permis să facă acest lucru în cazul în care scenariul „închis“ în alfabetul chirilic.

După cum ați observat, dimensiunea script-ul Autoit mult mai scurt decât în ​​iMacros. În plus, script-ul iMacros rigid atașat la aspectul site-ului și atunci când se schimbă aceasta trebuie să fie re-remodela.

Scripturi pentru Autoit, prezentate în exemplul de mai sus, în general, nu sunt legate de aspectul site-ului și să lucreze în fundal fără a interfera cu browser-ul. AutoIt script-ul poate fi convertit într-un fișier .exe și a alerga timp de planificator în fundal.

Ei bine, și în cele din urmă vinde în script Bash, care rulează sub Linux:

Yandex, Google, Bing - 3 într-un singur fișier

script bash pentru a lucra fără a face referire la browser. Deși codul a trebuit să imite user-agent și cookie-uri pentru a „ieftin“ aceste site-uri. De asemenea, acest script poate fi rulat pe coroana (timp) în fundal.

Asta e ceea ce am nevoie pentru a finaliza această sarcină:

  • Pe iMacros - ferestre + mozilla firefox + iMacros pentru firefox
  • Pe Autoit - ferestre + AutoIt
  • La Bash - Orice Linux + wget

Legate de intrări:

Mesaj de navigare

2 gânduri pe „Salvați datele de pe site-uri“