Dorin Sîrbu -

Bit

Bit, in informatica este unitatea de baza, de masura a informatiei, care poate avea una din valorile 0 sau 1. Un bit reprezinta ‘cea mai mica bucata’ de informatie.

Bit, date Din punct de vedere implementare fizica, acest bit poate fi un impuls electric (la transfer de date prin diverse medii), o stare a unui circuit electric bistabil (ex: memoria RAM), o stare al unui material magnetic (ex: harddisk), etc. Nu o sa intru mult in detalii referitor la modul de implementare din punct de vedere tehnic, deoarece depinde foarte mult de arhitecura dispozitivelor de calcul, metodele de productie, standarde, etc.

Unitatea de care ati auzit probabil cel mai des, este octet sau byte. Un byte reprezinta un grup de 8 bit. Ca sa va faceti o idee ce inseamna un byte, pot sa va dau un exemlu: codul unui caracter ‘simplu’, din acest text pe care il cititi acum, ‘ocupa’ un byte. Daca numarati caracterele dintr-o propozitie, puteti sa va dati seama aproximativ cata memorie ‘ocupa’. Am zis aproximativ, deoarece mai sunt si caractere speciale, cum ar fi ‘tab’, ‘spatiu’, ‘linie noua’, etc.

Acum, ca am aflat despre byte si cat ocupa un caracter, o sa va mai dau si alte exemple, ca sa intelegeti ce inseamna o cantitate de informatie.

Daca as salva pe harddisk, cuvantul ‘bit’ (fara caracterele apostrof), pe harddisk s-ar salva:

3 caractere x 1 byte, care inseamna: 3 caractere x 8 biti = 24 biti

Adica se vor modifica in valori de 1 si 0 (in dependenta de codurile caracterelor), 24 de ‘portiuni care reprezinta un bit’, pe unul din platanele harddisk-ului si astfel acest cuvant va fi memorat.

Daca as trimite in retea, printr-un cablu, cuvantul ‘bit’ (fara caracterele apostrof), prin cablu s-ar transmite:

3 caractere x 1 byte, care inseamna: 3 caractere x 8 biti = 24 biti

Adica la transmitatorul de informatie se va seta de 24 de ori nivelul tensiunii, care va insemna 1 sau 0, iar la receptorul acestor informati, aceste ‘nivele de tensiune’ vor fi preluate si utilizate(ex:salvate in memorie, afisate pe ecran, etc.).

Bineinteles ca exemplele de mai sus sunt simplificate. La salvarea si transferul de date, mai sunt si alte informatii suplimentare, care ‘identifica’ acele date de unde vin, unde se duc si cui apartin, dar si acele date, folosesc la baza unitatea de masura bit.

kB

kB (se pronunta kilobait), este o unitate de masura a cantitatii de informatie, care reprezynte 1024 byte. Pentru mai multe informatii legate de unitatile de masura a cantiatii de informatie, cititi articolele bit si byte.

SPAM

SPAM este considerata o procedura de trimitere a unui numar mare de mesaje e-mail (de catre un spamer) catre utilizatori, care nu si-au exprimat acordul in prealabil in acest sens. Aceste mesaje de e-mail de tip SPAM, de obicei sunt de natura comerciala si sunt destinate pentru a promovara diverse produse si servicii (de obicei dubioase) sau pentru propunea unor “scheme financiare”.

A nu se incurca cu mesajele de tip newsletter, unde utilizatorii isi dau acceptul initial pentru a primi mesaje cu noutati si de unde se pot dezabona in orice moment, pentru a nu mai primi acele mesaje.

Un mesaj de orice tip, care este primit cu acordul in prealabil (in urma inregistrarii sau in urma abonarii) nu este un mesaj de tip SPAM.

Trimiterea de SPAM, este folosita de obicei ca metoda de promovare, deoarece implica costuri reduse din partea spamer-ului, si anume, o conexiune la Internet, un program de trimitere e-mailuri in masa, care se poate descarca gratuit de pe Internet si o lista de e-mail-uri, de obicei publicate undeva pe site-urile de pe Internet (site-uri de job-uri, site-uri de anunturi, site-uri sociale, etc.).

Mesajele de tip SPAM sunt considerate un “lucru rau”, deoarece provoaca pierderi finanicare pentru urmatoarele tipuri de categorii:

  • Furnizorii de servicii Internet, traficul suplimentar generat de acest tipuri de mesaje, consuma din latimea de banda si resurse hardware si deci creaza costuri suplimentare.
  • Utilizatorii care platesc abonamentul de Internet per (trafic) cantitatea de informatii transmisa (a nu se incurca cu latimea de banda, care inseamna viteza conexiunii), in sensul ca la preluarea mesajelor e-mail, sunt contorizate si mesajele de tip SPAM. In ziua de azi, cam aproape toate abonamentele sunt cu trafic nelimitat, lucrul acesta a inceput sa nu mai fie o problema, eventual s-a transformat in costruri pentru furnizorul de Internet, care ar putea in unele cazuri sa creasca pretul abonamentului, dar nu in mod obligatoriu.
  • Companiile de publicitate, pierd din acei clienti, care decid sa abordeze “aceasta cale” si nu mai apeleaza la serviciile lor.

Un alt tip de inconvenient, generat de aceste mesaje de tip SPAM, este faptul ca poti gasi uneori casuta de intrare mesaje (Inbox) plina cu zeci de astfel de mesaje si doar unul sau doua mesaje, care cu adevarat sunt adresate personal, lucru care implica o gestionare suplimentara a mesajelor de e-mail.

Lupta cu SPAM-ul

S-au creat mai multe campanii negative impotriva mesajelor de tip SPAM prin Internet. S-au creat si organizatii non-profit care se lupte impotriva acestui fel de promovare. De asemenea, pe serverele de e-mail (programe de tip server, care se ocupa de gestiunea si redirectarea e-mail-urilor), sunt instalate extensii, care verifica intr-o baza de date internationala, fiecare mesaj nou, care soseste pe server. In unele programele de tip client, pentru gestionarea mesajelor e-mail pe calculator, de asemenea sunt adaugate extensii pentru a verifica si a marca daca sunt sau nu SPAM mesajele noi venite.

Legislatie pentru SPAM

Mesajele de tip SPAM, conform legislatiei in vigoare sunt ilegale. Legea 506 din 17 noiembrie 2004 privind prelucrarea datelor cu caracter personal şi protecţia vieţii private în sectorul comunicaţiilor electronice (Art. 12) , reglementeaza acest lucru.

SPAM-ul si cenzura

Ca in orice domeniu, exista si probleme de implementare sau incalcari ale legislatiei. Linia fiind foarte fina intre cele doua, este foarte greu sa definesti daca este o incalcare intentionata si/sau o greseala de implementare a unui mecanism.

Nu sunt rare cazurile, cand mesaje care nu sunt SPAM si respecta legislatia in vigoare sunt incadrate in categoria SPAM si sunt trimise in alte casute (Spam, Bulk, etc.) decat casuta de intrare mesaje (Inbox),  in felul acesta “cenzurand” acele mesaje, prin faptul ca utilizatorii in cauza nu primesc corect acele mesaje si de multe ori nu le vad niciodata. De asemenea imaginea institutiei este denaturata, fiind incadrata incorect la categoria “spamer”.

O sa dau si un exemplu pe care il stiu pentru a explica acest capitol si anume despre comunitatea slabute.ro. Pe deja bine-cunoscutul serviciu de e-mail gratuit Yahoo.com, nu rare au fost cazurile, cand ni s-a raportat ca mesajele de confirmare a inregistrarii in comunitate au fost catalogate drept “SPAM” si au fost trimise in casuta “Bulk”, motiv pentru care utilizatorii nu au putut sa finalizeze corect inregistrarea in comunitatea de slabute. De asemenea mesajele de tip newsletter, pentru unii utilizatori tot sunt trimise in casuta “Bulk”, lucru iarasi incorect.

Este o catalogare incorecta din partea Yahoo, deoarece toate mesajele sunt trimise doar cu acceptul utilizatorilor la inregistrarea in comunitate si orice utilizator se poate dezabona oricand prin mecanismele oferite atat in forum cat si prin intermediul e-mail.

Ca o ultima remarca la erorile de mai sus, sunt de parere ca in astfel de cazuri, trebuie folosite mecanisme care functioneaza corect si nu partial corect, deoarece se produc incalcari de legislatie, care pot incalca drepturile persoanelor care folosesc acele conturi de e-mail.

Phishing

Phishing, este o forma de activitate infractionala, executata asupra uneia sau mai multor “victime” de catre un “atacator”, care foloseste numele unei institutii cunoscute, in scopul de a induce in eroare victimele, referitor la relatia atacatorului cu institutia si a obtine date confidentiale importante, pentru a le folosi ulterior in scopuri infractionale (furtul de bani din contul victimei, comenzi la produse de pe Internet folosind datele victimei, etc.). Phishing provine de la cuvantul englez “fishing”, care in traducere inseamna “a  pescui” sau mai pe romaneste, “incerci sa-i induci in eroare si vezi ce prinzi”. Atacatorii, de obicei, se folosesc de lipsa de cunostinte complete legate de procedura, tehnologie, calculatoare si Internet ale “victimelor” pentru a le induce in eroare si a le “forta” sa spuna telefonic sau sa introduca datele lor importante intr-un sistem informatic al atacatorului, cu mesaje de tipul “daca nu completezi datele in 10 zile, contul se inchide si pierzi banii”. Printre datele vizate de atacatori se enumera: date de identificare personala, date despre carduri bancare, date de acces la conturi de tip Internet Banking, conturi la site-uri de transfer bani on-line, etc. Un atac de tip phising poate fi efectuat prin urmatoarele cai:

  • cel mai des intalnit este phishing-ul prin e-mail-uri false, trimise din numele unor institutii financiare, care de obicei va invita pe un site fals, care seamana foarte mult cu cel original, unde trebuie sa completati un formular, care o sa va fure datele introduse.
  • phishing prin contact telefonic referitor la o asa zisa “problema” unde este nevoie urgent sa transmiti datele voastre importante pentru a o rezolva.
  • phishing prin mesaje de tip SMS, unde trebuie urgent sa dati un raspuns ca sistemul sa “nu dezactiveze contul” sau alta “inventie”.
  • phishing prin utilizarea de echipamente false, care emuleaza comportamentul echipamentelor originale, doar ca efectueaza operatiuni care de obicei se termina “fara succes”.
  • phishing prin contact direct, prezentatandu-se ca reprezentat al companiei, care vrea sa va ajute.
  • … probabil mai sunt inventate si alte metode, dar o sa le adaug pe masura ce se inventeaza si se decopera :)

Pentru a creste siguranta personala si a scadea sansele de succes ale atacului de tip phishing, am scris un articol cu un set de sfaturi generale Combatere phishing, care o sa va ajute foarte mult sa evitati astfel de cazuri.

Motor de cautre web

Motor de cautre web, este un program cu o arhitectura complexa, care acceseaza si descopera site-uri web pe Internet, in scopul de a prelucra si a structura informatiile aflate in ele, pentru a putea raspunde in timpi foarte mici si cu rezultate cat mai aproape de cautarile efectuate de utilizatori. Aceste programe de obicei necesita resurse mari de procesare a datelor, deoarece numarul de site-uri web creste zilnic si paginile site-urilor de pe Internet se modifica zilnic.

Pentru a prelucra site-urile publice de pe Internet, un motor de cautare le acceseaza folosind un program similar unui navigator/browser, numit de obicei “spider”, “crawler” sau “bot”, cu diferenta ca acest program nu afiseaza paginile, ci le stocheaza intr-o baza de date pentru a fi procesate ulterior.

La procesare, textele paginilor din site-uri sunt impartite in cuvinte cheie, carora le sunt atribuite anumiti parametri.

Pentru a descoperi pagini si site-uri noi aparute, un motor de cautare, la procesarea paginlilor web, scaneaza link-urile din acea pagina si pe baza lor descopera pagini si domenii noi, pe care le va accesa si procesa si din care va descoperi alte pagini si site-uri noi. De asemenea unele motoare de cautare accepta si propuneri de site-uri noi, in cazul in care autorul site-ului crede ca site-ul lui nu a fost “descoperit” de acel motor de cautare.

In timpul procesului de cautare, initiat de un utilizator, motorul de cautare cauta in baza lui de date, in lista de cuvinte cheie, cuvintele cautate in “fraza de cautare” introdusa si conform unui algoritm intern, afiseaza intr-o anumita ordine o lista de pagini care contin acele cuvinte cheie.

Deoarece inca nu exista un motor de cautare perfect si de obicei in spatele acestor motoare de cautare sunt companii comerciale, au fost mai multe controverse legate de ordinea rezultatelor in lista de cautare dupa importanta “propusa”.

Un utilizator simplu cunoaste un motor de cautare mai mult din punctul de vedere al unei interfete web simpliste, de obicei oferita gratuit, care are o casuta text in care poate scri o anumita “fraza de cautare” si caruia la apasarea “butonului  de cautare”, ii este afisata o lista de rezultate mai aproape sau mai putin aproape de lucrul cautat. Acuratetea sporita a rezultatelor oferite, ca rezultat al cautarii de un motor de cautare, este cheia succesului pentru un asemenea serviciu.

Bineinteles ca pe Internet exista mult mai multe motoare de cautare. O lista cu cele mai cunoscute motoare de cautare web ar fi:

  • Ask.com
  • Baidu.com (cunoscut in China)
  • Bing.com
  • Cuil.com
  • Google.com
  • Yahoo.com
  • Yandex.com (cunoscut in Rusia)