index de căutare

Indexul de căutare - este o structură de date care conține informații despre toate căutare cunoscute sistem de documente web. Ea servește pentru a reduce timpul petrecut de căutare în depozitul de date anumită secvență de simboluri.

Cel mai frecvent tip este un index de căutare text complet. Se formează o listă cu toate cuvintele găsite în documentele indexate, indicând sursele lor. Cu această abordare, motorul de căutare păianjeni pot găsi rapid aproape orice frază în baza de date.

Ce este indexarea?

Indexarea - este procesul de colectare, sortare și stocare într-o bază de date de informații despre site-ul web este un motor de căutare, în scopul de a furniza informații de regăsire rapid și precis.

Informații importante despre articole site-uri legate, documente atașate, imagini, link-uri, fișiere audio și, desigur, cuvinte cheie. algoritm de detectare a cuvintelor cheie depinde de caracteristicile unui anumit motor de căutare.

Indexarea de noi site-uri sunt în Google pentru 1-7 zile, iar în Yandex - în aproximativ 7-30 zile.

Cum este indexarea?

Căutați pe web are loc în 2 etape. În prima etapă a motoarelor de căutare accesează Web și salvați-l la datele pe bază de reflecție pe serverele sale. Pe al doilea - motoarele de căutare sunt eliminate din baza de date răspunsuri la întrebările utilizatorilor.

Căutare roboții caută mereu paginile web pe Internet, descărcați și procesați. Web Cast este stocat pe serverele motorului de căutare și actualizate după fiecare accesare cu crawlere.

Astfel, baza de date de căutare - o colecție de index de căutare, informații cu privire la documentele și copiile acestora. Căutarea bază de date este actualizată în mod regulat. Actualizările sunt disponibile utilizatorilor după migrare la „căutare de bază“, care este o parte utilă a bazei de căutare, purificat din spam-ului și duble.

Căutare de bază a depozitului principal de robot descărcate pentru a căuta o dată la câteva zile. Procedura are loc pe timp de noapte, deoarece aceasta duce la sarcini suplimentare pe server.

Orange este în căutarea pentru un timp real documente noi și alege din mase uriașe dintre cele mai interesante pagini. Fiecare găsit rapid documentul robot de procesat rapid și în căutarea de bază. Deoarece documentele urgente este relativ mic, și este actualizat în timpul zilei.

Cum se adaugă un site / pagină în indexul unui motor de căutare?

Utilizarea addurilok necesare numai în prima etapă a vieții a site-ului în viitor motoarele de căutare se va merge la site-ul și indicele de conținutul său.

Ce se poate face pentru a facilita indexarea tuturor paginilor în motoarele de căutare?

Pentru site-ul indexat cu succes, trebuie să urmați câteva reguli de optimizare internă.

Detalii complete ale factorilor interni care sunt luate în considerare de algoritmi de căutare în timpul indexarea și paginile de clasament, dezvoltatorii de motoare de căutare sunt ținute în secret adânc. Ne putem baza doar pe informațiile oficiale și de a experimenta în practică.