Relevanța algoritmului de sortare pentru rezultatele căutării

Relevanța - este o măsură de conformitate a rezultatului dorit, sau, în ceea ce privește motoarele de căutare. cererea de răspuns adecvat.

Relevanța poate fi prezentat ca o modalitate de a sorta documentele găsite la cerere. Fiecare motor de căutare are propriul algoritm de sortare cu rezultatele căutării. Cu cât documentul se potrivește cu interogarea, cu atât mai mare ar trebui să fie în lista de răspuns.

Următorii parametri sunt în general luate în considerare, în scopul de a obține un rezultat bun:

numărul de cuvinte găsite;

„Contrast“ a cuvântului (frecvența utilizării în prezenta sale relative);

distanța între cuvintele;

Poziția cuvântului în document și în regiunile sale.

Pentru majoritatea utilizatorilor de Internet este mai natural de a pune întrebarea în mod direct, ca în comunicare normală. Este, prin urmare, interogare limbaj natural este pus în aplicare în motoarele de căutare moderne, în care cititorul determină zona aproximativă de interes.

În plus, se aplică funcția „Căutare în rezultate“, și „Find similare“, al cărui scop este clar din numele lor.

Relevanța și factorii care o influențează ...

Algoritmul pentru determinarea relevanței. reprezentând o formulă matematică cu sute de parametri care pot schimba pe o bază de zi cu zi, ceea ce face algoritmul de rupere practic imposibil.

În procesul de potrivire a motorului de căutare site-ul cererii oferă fiecare pagină de rating, care arată modul în care aceasta corespunde formulei relevanta a motorului de căutare.

Se crede că prezența a cuvântului cheie în următoarele HTML-structuri crește clasament, care se calculează de către motorul de căutare:

nume de fișier care conține codul paginii;