Dorin Sîrbu -

Motor de cautre web

Definitii

Motor de cautre web, este un program cu o arhitectura complexa, care acceseaza si descopera site-uri web pe Internet, in scopul de a prelucra si a structura informatiile aflate in ele, pentru a putea raspunde in timpi foarte mici si cu rezultate cat mai aproape de cautarile efectuate de utilizatori. Aceste programe de obicei necesita resurse mari de procesare a datelor, deoarece numarul de site-uri web creste zilnic si paginile site-urilor de pe Internet se modifica zilnic.

Pentru a prelucra site-urile publice de pe Internet, un motor de cautare le acceseaza folosind un program similar unui navigator/browser, numit de obicei “spider”, “crawler” sau “bot”, cu diferenta ca acest program nu afiseaza paginile, ci le stocheaza intr-o baza de date pentru a fi procesate ulterior.

La procesare, textele paginilor din site-uri sunt impartite in cuvinte cheie, carora le sunt atribuite anumiti parametri.

Pentru a descoperi pagini si site-uri noi aparute, un motor de cautare, la procesarea paginlilor web, scaneaza link-urile din acea pagina si pe baza lor descopera pagini si domenii noi, pe care le va accesa si procesa si din care va descoperi alte pagini si site-uri noi. De asemenea unele motoare de cautare accepta si propuneri de site-uri noi, in cazul in care autorul site-ului crede ca site-ul lui nu a fost “descoperit” de acel motor de cautare.

In timpul procesului de cautare, initiat de un utilizator, motorul de cautare cauta in baza lui de date, in lista de cuvinte cheie, cuvintele cautate in “fraza de cautare” introdusa si conform unui algoritm intern, afiseaza intr-o anumita ordine o lista de pagini care contin acele cuvinte cheie.

Deoarece inca nu exista un motor de cautare perfect si de obicei in spatele acestor motoare de cautare sunt companii comerciale, au fost mai multe controverse legate de ordinea rezultatelor in lista de cautare dupa importanta “propusa”.

Un utilizator simplu cunoaste un motor de cautare mai mult din punctul de vedere al unei interfete web simpliste, de obicei oferita gratuit, care are o casuta text in care poate scri o anumita “fraza de cautare” si caruia la apasarea “butonului  de cautare”, ii este afisata o lista de rezultate mai aproape sau mai putin aproape de lucrul cautat. Acuratetea sporita a rezultatelor oferite, ca rezultat al cautarii de un motor de cautare, este cheia succesului pentru un asemenea serviciu.

Bineinteles ca pe Internet exista mult mai multe motoare de cautare. O lista cu cele mai cunoscute motoare de cautare web ar fi:

  • Ask.com
  • Baidu.com (cunoscut in China)
  • Bing.com
  • Cuil.com
  • Google.com
  • Yahoo.com
  • Yandex.com (cunoscut in Rusia)