Nový systém vyhľadávania od Google: Caffeine

Marek Poleč  /  10. 06. 2010, 08:50

Spoločnosť Google oznámila dokončenie nového systému určeného na indexáciu webového obsahu s názvom Caffeine. Caffeine poskytuje až o 50 percent vyššiu čerstvosť a relevantnosť výsledkov vyhľadávania ako tomu bolo doteraz.

Či už ide o tému, blog alebo príspevok na fóre, teraz možno nájsť relevantný obsah oveľa rýchlejšie, takmer okamžite potom ako bol uverejnený a zaindexovaný robotmi Google. Takéto vyhľadávanie však stále nie je prehľadávaním live webu. To čo je ponúkané ako výsledok vyhľadávania predstavuje zoznam zaindexovaných stránok. Tým je priradzovaná dôležitosť na základe obsahu a množstva kľúčových slov, pričom sa zohľadňuje aj Page Rank, systém hodnotenia web stránok vyvinutý spoločnosťou Google. Prečo však spoločnosť Google prichádza s novým systémom vyhľadávania? Obsah na internete sa stále mení a nový pribúda. Rozrastá sa nielen do veľkosti a počtu nových stránok, ale aj príchodom videí, obrázkov, noviniek a real-time aktualizácií. Okrem toho sa zmenili aj očakávania ľudí, ktoré sú teraz väčšie ako bývali. Tí čo hľadajú chcú nájsť najčerstvejší relevantný obsah a tí čo publikujú očakávajú, že budú nájdení hneď potom ako bol ich obsah zverejnený.



 

Caffeine drží krok s vývojom webových stránok a spĺňa rastúce očakávania užívateľov. Pôvodný Google index sa skladal z niekoľkých vrstiev, z ktorých boli niektoré obnovované rýchlejším tempom než tie ostatné. Hlavná vrstva sa aktualizovala každých pár týždňov. V čase, keď bolo treba obnoviť vrstvu starého indexu sa musel analyzovať celý web. To znamenalo, že dochádzalo k výraznému oneskoreniu medzi nájdením stránky a obdobím, kedy bola vytvorená. Caffeine však analyzuje web v malých dávkach a index aktualizuje priebežne. Ak nájdu roboti Google nové stránky, alebo nové informácie na týchto stránkach, dokážu ich okamžite pridať priamo do indexu. Znamená to, že tak možno nájsť čerstvé informácie rýchlejšie ako kedykoľvek predtým. Caffeine indexuje webové stránky v obrovskom, celosvetovom meradle. V skutočnosti spracuje každú sekundu stovky tisícok stránok súbežne. Ak by sme tento proces prirovnali k hromade papiera, takáto hromada by rástla rýchlosťou až 5 km/s. Caffeine už teraz zaberá takmer 100 miliónov GB úložného priestoru v špeciálnej databáze a pridáva nové informácie vo výške niekoľkých 100 000 GB denne.

Zdroj: googleblog.blogspot.com

Neprehliadnite: