Google osa 2: Miten Googlen hakukone toimii?

 

Viime postauksessa käsittelimme Googlea kokonaisuudessaan yrityksenä, ja sen syntyperää. Tässä postauksessa pureudumme sen sijaan enemmän itse Googlen toimintaan hakukoneena, ja siihen, millä perusteella se etsii tietoa internetin laajasta verkostosta. Nykyään webissä on niin paljon monenlaista tietoa, että voisi sanoa, että sitä on aivan liikaa. Tästä syystä hakukoneiden pitääkin nykyään optimoida yhä paremmin ja monisyisemmin, että millaista materiaalia se ensisijaisesti etsii käyttäjilleen. Ennen ehkä riitti jossain määrin pelkkien hakusanojen etsiminen ja Google, tai jokin muu hakukone, pystyi sitten vain listata hakutuloksiinsa nämä kaikki tulokset, joista löytyi kyseinen hakusana tai hakusanat. Nykyään samalla hakusanalla voi löytyä niin uskomattomat määrät sisältöä, että sitä pitää lajitella myöskin muilla perusteilla. Googlella onkin algoritmeja, joiden perusteella se hakee tietoa hakukoneeseensa. Voitkin ajatella, että ensin Google nappaa kaiken, mistä löytyy hakusanasi, mutta tämän jälkeen lista on niin pitkä, että pitää löytää muita keinoja priorisoida nämä ja laittaa ne hakukoneessa oikeaan järjestykseen. Mitäs nämä algoritmit sitten ovat, ja miten ne toimivat?

Panda

Panda algoritmiKuten huomaat, Google on nimennyt algoritminsa hauskasti eläinkunnan mukaan. Ensinnäkin, lähdetään liikkeelle tästä mustavalkoisesta nallesta, eli panda -algoritmista. Pandan tarkoitus on tutkia sivustojen sisältöä. Ne tutkivat, onko hakusanalla löydetyt sivustot sisällöltään laadukkaita sekä lukijaystävällisiä. Jos se näyttää vain ja ainoastaan hakusanoja toistavalta, aivottomalta tekstiltä, voi Google poistaa tämän hakutuloksista jopa kokonaan. Tämä onkin ehkä pahinta, mitä yritykselle voi tapahtua, mikäli se pyrkii hakukoneoptimoimaan sivustojaan. Toisaalta, näin ei kovin helposti tapahdu, mikäli pyrkii luomaan laadukasta ja mielenkiintoista sisältöä oikeille lukijoille. Karkeasti voidaankin sanoa, että tämän Panda -algoritmin kanssa ei tule olemaan ongelmia, mikäli kirjoitta aja luo sisältöä sivustolleen nimenomaan käyttäjiä varten, eikä hakukonetta varten. Google kysyykin tältä sivustolta muun muassa, että vastaako se hakusanojen asettamiin kysymyksiin, ja onko tieto ajan tasalla? Mikäli sivuston tekstit ovat monta vuotta vanhoja, se tuskin löytyy hakutuloksista ensimmäisten joukosta. Toisena vaikuttavana tekijänä Pandan lisäksi on tietenkin muut sivustot, sekä kuinka paljon tietoa kyseisistä hakusanoista kokonaisuudessaan löytyy. Mikäli siitä on netissä hyvinkin vähän tietoa, eikä montaa sivustoa tarjolla, voi Google tietenkin jakaa ensimmäisenä näitä vanhempiakin sivustoja. Google ei siis tietenkään pysty vaikuttamaan siihen sisältöön mitä internetistä löytyy, se vain lajittelee ne haun perusteella parhaaksi katsomallaan tavalla.

Kolibri

Kolibri sen sijaan ei ole niin vahvasti sivun sisällön laadukkuuteen pureutuva kuin panda, vaan se keskittyy enemmän juurikin näihin eri hakusanoihin, joita Googleen kirjoitat. Se tutkii kokonaisuudessaan hakusanoja, jotka Googleen on kirjoitettu. Onko hakusanoja kenties yksi vai useampi, ja onko ne avainsanojen kaltaisesti perusmuodossa, vai muodostavatko ne kenties kysymyslauseen? Millaisia assosiaatioita eli niin sanottuja mielleyhtymiä näihin sanoihin kätkeytyy? Kyse ei ole siis yksittäisten sanojen bongaamisesta juuri siinä muodossa kuin ne on kirjoitettu, vaan myös siitä, minkä sanojen kanssa tätä hakusanaa yleensä käytetään, tai missä se esiintyy.

Pingviini

Pingviini algoritmiPandan sivuston laatua tarkkailevan silmän alta sekä kolibrin sanojen tutkimisen kautta siirrymme pingviiniin, joka tutkiikin laajemmin, miten sivustot ovat yhteydessä toisiinsa. Monesti eri sivustoilla on linkkejä johonkin toisille sivustoille, Ne voi olla esimerkiksi mainoksia tai muita yhteistyösopimuksia. Google on nykyään niin älykäs, että se tutkii myöskin näitä. Erilaiset sivustot luovatkin niin sanottuja hämähäkin verkkoja, joilla ne ovat yhteydessä muihin sivustoihin. Toki voi olla, että sivustolle ei ole mitään linkkejä, eikä sivustolta ole linkkejä mihinkään toiselle sivustolle. Tätä ei yleensä ottaen pidetä pingviinin silmin yhtä arvokkaana sivuna. Toisaalta jos linkkejä on joillekin hyvin epäilyttäville sivuille, ei tämäkään tietenkään ole hyvä. Kuitenkin, tässäkin kannattaa muistaa, että sisältöä ja tekstiä kirjoitetaan lukijoille, eikä hakukoneelle.

Fred

Algoritmi nimeltä Fred on Googlen uusin keksintö. Nykyään monet firmat haluavat luoda hakukoneoptimointia sivustolleen, ja joskus tämä on jo kääntynyt heitä vastaan. Jotkin sivustot kirjoittavat liikaa ikään kuin vain hakukoneelle, ja Google ei pidä tästä. Google haluaa, että hakukoneen käyttäjä löytää itselleen parasta mahdollista sisältöä, eikä että jokin sivusto, joka yrittää höynäyttää Googlea, pomppaakin hakutulosten kärkeen.

Tässä siis joitakin pieniä periaatteita, joita Google ottaa huomioon hakutuloksissaan!