Dorin Sîrbu -

Motor de cautre web

Definitii

Motor de cautre web, este un program cu o arhitectura complexa, care acceseaza si descopera site-uri web pe Internet, in scopul de a prelucra si a structura informatiile aflate in ele, pentru a putea raspunde in timpi foarte mici si cu rezultate cat mai aproape de cautarile efectuate de utilizatori. Aceste programe de obicei necesita resurse mari de procesare a datelor, deoarece numarul de site-uri web creste zilnic si paginile site-urilor de pe Internet se modifica zilnic.

Pentru a prelucra site-urile publice de pe Internet, un motor de cautare le acceseaza folosind un program similar unui navigator/browser, numit de obicei “spider”, “crawler” sau “bot”, cu diferenta ca acest program nu afiseaza paginile, ci le stocheaza intr-o baza de date pentru a fi procesate ulterior.

La procesare, textele paginilor din site-uri sunt impartite in cuvinte cheie, carora le sunt atribuite anumiti parametri.

Pentru a descoperi pagini si site-uri noi aparute, un motor de cautare, la procesarea paginlilor web, scaneaza link-urile din acea pagina si pe baza lor descopera pagini si domenii noi, pe care le va accesa si procesa si din care va descoperi alte pagini si site-uri noi. De asemenea unele motoare de cautare accepta si propuneri de site-uri noi, in cazul in care autorul site-ului crede ca site-ul lui nu a fost “descoperit” de acel motor de cautare.

In timpul procesului de cautare, initiat de un utilizator, motorul de cautare cauta in baza lui de date, in lista de cuvinte cheie, cuvintele cautate in “fraza de cautare” introdusa si conform unui algoritm intern, afiseaza intr-o anumita ordine o lista de pagini care contin acele cuvinte cheie.

Deoarece inca nu exista un motor de cautare perfect si de obicei in spatele acestor motoare de cautare sunt companii comerciale, au fost mai multe controverse legate de ordinea rezultatelor in lista de cautare dupa importanta “propusa”.

Un utilizator simplu cunoaste un motor de cautare mai mult din punctul de vedere al unei interfete web simpliste, de obicei oferita gratuit, care are o casuta text in care poate scri o anumita “fraza de cautare” si caruia la apasarea “butonului  de cautare”, ii este afisata o lista de rezultate mai aproape sau mai putin aproape de lucrul cautat. Acuratetea sporita a rezultatelor oferite, ca rezultat al cautarii de un motor de cautare, este cheia succesului pentru un asemenea serviciu.

Bineinteles ca pe Internet exista mult mai multe motoare de cautare. O lista cu cele mai cunoscute motoare de cautare web ar fi:

  • Ask.com
  • Baidu.com (cunoscut in China)
  • Bing.com
  • Cuil.com
  • Google.com
  • Yahoo.com
  • Yandex.com (cunoscut in Rusia)

Internet

Definitii

Internet-ul, este o retea foarte mare, compusa dintr-o multime de retele de calculatoare si dispozitive portabile (telefoane, handheld, etc.), interconectate intre ele prin intermediul unor protocoale de comunicare si transport date standardizate (TCP/IP, UDP, etc.).

Internet este o retea foarte complexa si functioneaza prin interconectarea a diverse echipamente hardware si programe specializate software. Comunicarea intre retelele conectate la Internet ar fi imposibila daca nu ar exista o multime de standarde de comunicare si interconectare. Prin simpla accesare a unei pagini web se folosesc vreo zece standarde.

Responsabili pentru crearea si/sau adoptarea de standarde noi  pentru Internet sunt Internet Engineering Task Force (pentru cine vrea sa afle mai mult despre aceste standarde, poate vizita www.ietf.org).

La Internet sunt conectate atat retele ale institutiilor publice, cat si retele private si este folosit pentru a transporta o varietate foarte mare de date. Cele mai cunoscute tipuri de date transferate prin intermediul Internet sunt: paginile web,  mesajele e-mail, fisiere de diferite tipuri (video, muzica, documente), voce, etc.

Datorita faptului ca Internet-ul a capatat o raspandire foarte mare si ofera costuri reduse de transport, multe din tehnologiile existente s-au orientat spre folosirea Internet-ului ca mijloc mai ieftin de transport a informatiilor. Din aceste tehnologii face parte telefonia (VoIP) si televiziunea (IPTV).

In ziua de azi se presupune ca peste un sfert din populatia planetei are acces la Internet si reteaua Internet este in continua crestere.

Ce este un server?

IT

Server, este termenul folosit pentru a descrie un sistem informatic compus dintr-un calculator specializat si un program, care ruleaza pe acest calculator pentru a deservi mai multe cereri de la clienti. Denumirea provine de la cuvantul englez serve – a servi (clientii care efectuaza cereri catre server).

Datorita faptului ca programul software (sau program server) este “invizibil” ochiului uman, de multe ori aceste calculatoare specializate (sau masina server) sunt cunoscute mai des sub denumirea de server.

server-522x217 Ce este un server? O masina server, este un calculator specializat, care functioneaza non-stop si care trebuie (de obicei) sa indeplineasca cateva criterii suplimentare fata de un calculator simplu utilizat in conditii casnice:

  • Sa ofere putere de calcul sporita
  • Sa ofere o fiabilitate sporita (luand in calcul ca trebuie sa functioneze non-stop ani de zile)
  • Sa ofere mecanisme redundante pentru protectie la defectiuni (exemplu: 2 surse de alimentare)
  • Consum mic de curent electric
  • Sa posede o arhitectura hardware interna, care sa permita schimbarea unor piese de schimb fara a fi nevoie de oprit complet sistemul.
  • Sa fie gandit pentru optimizarea spatiului pe care il ocupa (de multe ori sunt nevoie de sute de astfel de masini server si spatiul devine o problema)

Pe masina server se instaleaza un program numit sistem de operare. Acest program se ocupa de gestionarea si coordonarea resurselor hardware disponibile. Din sisteme de operare folosite pe servere fac parte: Linux, Solaris, BSD, UNIX, Windows Server, s.a.

Sistemul de operare folosit este foarte importat, deoarece stabilitatea, posibilitatea de a schimba componente defecte fara repornire si capacitatea lui de a rula pe o perioada lunga de timp fara intrerupere/repornire, au un impact important asupra functionarii corecte si continua a serviciului oferit.

Un program server, este un program instalat pe o masina server, care ruleaza non-stop “in asteptare” si “asculta” cererile de la clienti (de obicei cererile vin de la utilizatori prin intermediul unei retele). Cand apare o cerere de la un client, programul server executa instructiunile care este programat si intoarce un raspuns clientului care a facut cererea.

In dependenta de puterea de calcul a masinei server si de gradul ei de incarcare, pe aceasta pot rula mai multe programe de tip server, care sa indeplineasca mai multe functionalitati.

Exemple de programe server pe care le folositi (cateodata fara sa constientizati :) ) sunt:

  • Server web (va conectati la el prin intermediul browserului si va deserveste paginile web pe care le vedeti)
  • Server e-mail (trimiteti si primiti mesajele de e-mail)
  • Server baza de date (se ocupa de stocarea si interogarea datelor)
  • Server FTP (servere ce ofera acces rapid la fisiere partajate)
  • Server DNS (am discutat despre el in articolele precedente)

Toata structura Internet este bazata pe arhitectura client-server. Milioane de servere deservesc zilnic miliarde de utilizatori web, utilizatori de e-mail si alte servicii mai “invizibile” pentru utilizatorii simpli.

Ca o concluzie la cele scrise mai sus, un server este un calculator specializat, care are instalat pe el un sistem de operare, pe care ruleaza unul sau mai multe programe de tip server, create pentru a deservi si raspunde la cererile mai multor clienti (utilizatori), care apeleaza si au nevoie de acele servicii.

Ce este un site web?

Definitii, IT, Online

Un site web este un fel de prezentare electronica interactiva, care este compusa din mai multe pagini web, imagini, video, animatii, audio si alte tipuri de fisiere, organizate intr-un anumit fel, accesibile fiecare prin adrese unice de tip URL (exemplu URL pagina curenta: http://www.vadmin.ro/sfaturi/internet/site-web-128.html) si legate logic intre ele prin legaturi (link-uri).

Fisierele unui site web sunt instalate pe un calculator (server), conectat permanent la Internet, pe care ruleaza un program destinat de tip server,  numit server web si care la cererea unui navigator/browser de oriunde de pe Internet (calculatorul vostru), poate trimite aceste fisiere.

Paginile web din cadrul unui site sunt fisiere in format text, scrise intr-un limbaj de descriere a datelor HTML/XHTML (Hyper Text Markup Language). Acest HTML/XHTML este un limbaj de descriere, care defineste cum sunt organizate logic textele, imaginile, video si animatiile in pagina (antet, paragrafe, liste, imagini, legaturi, etc). HTML/XHTML este util, pentru ca fiind standard pe Internet, “cineva” (ex: programatorul) poate formata intr-un anumit fel un continut si “altcineva” necunoscut (ex: browser) poate “descifra” acea organizare si o poate afisa in format grafic si citibil pentru utilizator.

Paginele web si celelalte resurse, instalate pe serverul web sunt accesate prin intermediul uni protocol de comunicare la nivel de aplicatie HTTP (Hyper Text Transfer Protocol) sau HTTPS (varianta securizata al HTTP), care foloseste protocolul de transport al datelor TCP/IP, descris in unul din articolele precedente, pentru a face cereri catre serverul web si a primi aceste fisiere ca raspuns. (puteti vedea acest lucru chiar in adresa de acum a browser-ului http://www.vadmin.ro/sfaturi/internet/site-web-128.html, unde partea http:// specifica protocolul pe care-l va utiliza browser-ul vostru ca sa acceseze site-ul acesta).

Paginile web pot fi de doua tipuri: pagini statice si pagini dinamice.

Paginile statice sun fisiere text, scrise in format HTML, al caror continut nu se modifica la accesarea lor si se modifica doar la reactualizarea/suprascrierea lor pe serverul web cu un continut nou.

Paginile dinamice, dupa cum spune si numele, sunt generate dinamic de catre scripturi (bucati de cod) scrise intr-un limbaj de programare (PHP, ASP, etc.). Aceste pagini sunt generate in dependenta de actiunile intreprinse de utilizator sau de schimbarile care au avut loc pe server. Un exemplu de pagina dinamica este o pagina de cautare, care in dependenta de termenul de cautare, cauta in baza de date un set de rezultate si le intoarce in format HTML un raspuns spre browser. Browser-ul converteste textul HTML in pagina pe care o vedeti de obicei.

Pentru a vedea cum arata o pagina web in format HTML, din browser/navigator, alegeti din meniu optiunile View -> Source (pe unele navigatoare functioneaza direct tastele Ctrl+U). Navigatorul o sa va afiseze un text “codat”, care va fi pagina pe care o vizualizati in momentul acela, doar ca in format “neprelucrat”, HTML.

Ca si oricare alt lucru care este legat de calculatoare si aici sunt multe standarde :) care definesc modul de formatare a paginilor, modul de formatare a imaginilor, modul de formatare a video-urilor, modul de comunicare intre browser si server web, modul de organizare a fisierelor pe server-ul web, etc.

Ca o concluzie simplificata la cele de mai sus, un site web este un set de pagini scrise in format HTML si alte fisiere resursa, accesibile unic prin intermediul unui URL, interconectate logic intre ele prin legaturi/link-uri, care sunt instalate pe un server web, de unde un browser prin intermediul unui protocol HTTP/HTTPS le poate accesa, decodifica si afisa intr-un format citibil pe calculatorul vostru.

Noua imagine pentru Slabute.ro

Noutati

Dupa o perioada lunga de efort si timp, noua interfeta web pentru comunitatea slabute.ro, a fost activata online. Deoarece comunitatea a crescut intre timp si blogul lui slabuta s-a transformat in comunitatea slabutelor, aceasta schimbare era necesara si site-ul trebuia adaptat noilor cerinte.

Noua interfata urmeaza o aranjare a informatiilor de tip portal si afiseaza articolele intr-o forma originala, mult mai placuta si mai intuitiva.

interfata-noua-slabute-ro-473x391 Noua imagine pentru Slabute.ro

Va doresc o navigare placuta!