Računalništvo, telefonija
23.12.2015 16:17
Posodobljeno 9 let nazaj.

Deli z drugimi:

Share

Kako deluje spletno iskanje?

Googlovi pajki so povsod po spletu
Googlovi pajki so povsod po spletu

Od algoritma do odgovora – kako deluje spletno iskanje

Še pred nekaj desetletji smo morali odgovore na vprašanja iskati v knjigah, strokovnih publikacijah, pri različnih poznavalcih, v časopisih itd. Danes je tovrstno iskanje odgovorov skoraj popolnoma nadomestilo iskanje preko spleta. Dnevno se zgodi nekaj milijard iskanj, na mesečni ravni pa lahko govorimo o več 100 milijardah iskanj! Enostavno vpišete, kar želite izvedeti, pritisnete tipko Enter in … zgodi se čarovnija, saj dobite rezultate hitreje, kot lahko trznete z očesom.

Ste se kdaj vprašali, kako je to mogoče? Oziroma kako pridemo preko računalniškega algoritma od vprašanja do odgovora? O tem, kako deluje današnje spletno iskanje, smo povprašali Uroša Okorna iz podjetja Dominatus d.o.o. Povedal nam je, da imajo današnji iskalniki, oz. če se lahko nanašamo kar na Google, tri glavne funkcije:

1. pregledovanje oz. plazenje po spletnih straneh in indeksiranje teh strani … ja, Googlovi pajki so praktično povsod po spletu,


2. zagotavljanje odgovorov za uporabnike,

3. boj proti neželeni in škodljivi vsebini.

Z razumevanjem teh treh funkcij pa boste dobili tudi bolj podroben vpogled v to, kako iskanje deluje in kako vam Google postreže z informacijami, ki jih iščete.

1. Plazenje po straneh in indeksiranje


V osnovi se vse začne z »mrežo« oz. »medmrežjem« spletnih strani, ki jih je na njem moč najti. Medmrežje si lahko predstavljate kot razvejano mrežo podzemne železnice v New Yorku in mrežo njenih postaj. Vsaka postaja predstavlja unikaten dokument; npr. običajno gre za spletno stran, lahko pa je tudi PDF dokument, slika itd. Google pa se mora skozi železnico in skozi postaje premikati in poiskati ter beležiti te dokumente. Zabeležene dokumente in mesta shrani in si ustvarja zemljevid podzemne železnice.

V praksi oz. v danem trenutku je medmrežje sestavljeno iz ogromnega števila spletnih strani, število pa se pospešeno povečuje iz dneva v dan. Google se po medmrežju premika s pomočjo spletnih pajkov, ki se plazijo po njem, kar v praksi pomeni, da se premika od ene do druge spletne strani preko povezav, ki so na voljo na tej strani. Vsako spletno stran zabeleži in jo shrani v Googlov indeks oz. jo indeksira zato, da jo lahko pri iskalni poizvedbi hitro in učinkovito najde. V indeksu, ki je velik preko 100 milijonov gigabajtov, strani razvrsti po vsebini, ključnih besedah, page ranku itd. Google je z namenom zagotavljanja bliskovito hitrega iskanja zgradil podatkovne centre, ki praktično po celem svetu procesirajo enormne količine podatkov.

S pregledovanjem in indeksiranjem strani Google torej zagotavlja, da takrat, ko opravljate poizvedbo preko brskalnika, dobite karseda kvalitetne ciljne prikaze kolikor hitro je mogoče!


2. Zagotavljanje odgovorov za uporabnike


Brskalnikom, kot je npr. Google, lahko rečemo kar stroji za odgovore. Ko opravite iskalno poizvedbo, brskalnik podrobno preišče in pregleda zbirko podatkov oz. indeksirane strani ter naredi 2 stvari:

  • vrne vam samo rezultate, ki so za vas relevantni ali uporabni,
  • rezultate rangira oz. razvrsti glede na popularnost strani, ki vam posreduje informacije.

Za zagotavljanje odgovorov sta torej pomembna tako relevantnost kot tudi popularnost strani … kako ju torej iskalniki določijo?

Popularnost in relevantnost se ne določata ročno, ampak iskalnik za to uporabijo posebne matematične enačbe oz. algoritme. Njihova naloga je, da ločijo zrno od plevel (relevantnost strani) in potem zrna razvrstijo po vrsti od najbolj do najmanj kvalitetnega (popularnost). Iskalniki določajo relevantnost na podlagi več dejavnikov – skupaj jih je več kot 200. Običajno predvidevajo, da bolj kot je stran popularna, bolj dragocene informacije ima.


Na takšen način vam Google vrne relevanten odgovor na vaše zastavljeno vprašanje.

3. Boj proti neželeni in škodljivi vsebini


Za zagotavljanje optimalne uporabniške izkušnje je izjemno pomembno, da vsebina ni zlonamerna oz. škodljiva. Google se zaveda, da v primeru, ko je vsebina neželena ali zlonamerna, ne moremo več govoriti o relevantnih rezultatih. Zato praktično 24/7 nadzira vsebino in v primeru, ko je to potrebno, tudi posreduje. Večino tovrstne vsebine odstrani avtomatično, v nekaterih primerih pa posreduje tudi človeška ekipa. V primeru, da mora Google ukrepati, o tem obvesti lastnika spletnega mesta, ki ima potem možnost, da stran ustrezno popravi.


Sedaj veste, kako vam iskalniki iz množice spletnih mest v le delčku sekunde prikažejo le tistih nekaj, ki so za vas najbolj ustrezne. Prepričani smo, da bo Google še naprej skrbel, da bo njihova čarovnija nekaj posebnega!

Če želite tudi vašo spletno stran pripeljati čim višje v iskalnikih, preberite in upoštevajte nasvete, ki jih najdete na www.optimizacija-strani.info.


Prijavi napako v članku

Povezave

Članek je pripravljen v sodelovanju s partnerjem DOMINATUS d.o.o.
Za več informacij so vam na voljo pri DOMINATUS d.o.o.
Ob kontaktu povejte, da ste objavo zasledili v Računalniških novicah.

Želite biti obveščeni o novostih, ki jih pripravljamo s partnerjem DOMINATUS d.o.o.? Vpišite svoj e-mail in se prijavite na BREZPLAČNE e-novice, od katerih se lahko kadarkoli odjavite.




Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

SOREX d.o.o.

Foersterjeva ulica 10, 8000 Novo mesto, Tel: 07 337 90 10
Zlati partner

MICROSOFT d.o.o.

Ameriška ulica 8, 1000 Ljubljana, Tel: 01 584 61 11
Slovenska podružnica Microsofta je bila ustanovljena leta 1994 z željo, da bi tudi slovenskemu trgu ponudili inovativno programsko opremo. Od začetkov, ko so bili v podjetju zaposleni ... Več

COMCOM d.o.o.

Lapajnetova ulica 29, 5280 Idrija, Tel: 05 372 20 20
Ukvarjajo se s: SAP svetovanjemPodatkovno analitiko in inženiringom Več

ARTIO PRINT & DESIGN

Cerkvenjak 13, 2236 Cerkvenjak, Tel: 031 538 000
Storitve tiska po meri sodobnega naročnika Pomislite na naslednje: iščete ponudnika za tisk letakov, brošur ali vizitk, storitev, ki jo v visoko konkurenčnem okolju potrebujemo ... Več