Internet (nielen) pre začiatočníkov XI. – Hľadanie podľa skutočného obsahu

Július Pastierik  /  12. 11. 2007, 00:00

Hoci to znie paradoxne, fulltextové vyhľadávanie iba podľa obsahu stránok nie je vo vyhľadávačoch až také bežné. Aj na toto však existuje riešenie – ponúka ho portál webindex.sk.

Ak často vyhľadáte v Google, určite sa vám stalo, že vám vyhľadávač síce našiel pomerne veľké množstvo stránok, ale v podstate ste ani na jednej z nich nenašli relevantné informácie, resp. kým ste sa ku nim prepracovali, pootvárali ste zbytočne veľa odkazov, kde hľadaná informácia vôbec nebola.

Najdene odkazy

Prečo k takejto situácii dochádza? Je to z toho dôvodu, že Google pri vyhľadávaní neprezerá iba obsah stránok, ale vyhľadáva aj podľa informácií, ktoré sú uložené v meta tagoch. Pravdaže, autori vyhľadávača to mysleli dobre – ale kto zaručí, že tam nie sú uložené aj informácie, ktoré nemajú nič spoločné s tým, čo stránky skutočne obsahujú. A tu je kameň úrazu. Pokiaľ sa chcete presvedčiť o tom, čo všetko sú schopní programátori „napchať“ do týchto informácií, môžete si otvoriť zdrojové kódy stránok.

Ako „vzorový“ príklad si uveďme napr. stránky realitky.sk, kde okrem relevantných slov, ktoré naozaj súvisia s realitami (napr. byt, byty, dom, domy, zahrada, zahrady, chalupa, chalupy, chata, chaty, peknebyvanie, plastove okna a pod.) nájdeme značné množstvo „balastu“ (napr. hospoda, krcma, kapusta, recepty, erotika, bordel, sexdoma, tetovanie, piercing…). Myslíme si, že k týmto údajom nie je čo dodať.

Navod na pouzivanie

Preto je potešiteľné, že aj na toto existuje riešenie – vyhľadávanie výhradne podľa obsahu stránok. Počet nájdených odkazov síce nebude taký veľký, ako pri iných vyhľadávačoch, ale bude zaručené, že hľadaný výraz sa na stránkach aj skutočne nachádza. A práve takéto vyhľadávanie ponúka portál webindex.sk.

Pravdaže, aj tento portál monitoruje informácie v meta tagoch, ale tieto používa iba pre katalógovú databázu, ktorá môže slúžiť napr. ako zdroj informácií pre katalógové vyhľadávače (o tých sme si písali minule). Samotný fulltextový vyhľadávač obsahuje iba texty, ktoré skutočne aj vidíme na príslušných stránkach. Pri vlastnom vyhľadávaní môžeme používať niekoľko rozšírených spôsobov hľadania (zakázanie alebo vynútenie zobrazenia slov vo výsledkoch, logické podmienky a pod.).

Ponuka služieb

Okrem už spomenutej funkcie hľadania nám tento vyhľadávač ponúka ďalšie, veľmi zaujímavé možnosti. Ihneď pri vyhľadávaní nás zaujme maličký panáčik, ktorý sa väčšinou (nie vždy) objaví na konci odkazu na nájdenú stránku. Kliknutím na tohto panáčika sa nám zobrazia veľmi zaujímavé informácie – IČO, DIČ, IČ DPH, e-mail, telefón, fax, mobil a ICQ zo stránky, na ktorú odkaz smeruje.

Pravdaže, tieto údaje nemusia byť kompletné, pretože sa na príslušných stránkach nemusia všetky nachádzať. Tak isto nemusia byť vždy relevantné, najmä na rôznych diskusných fórach nájdeme množstvo e-mailov, telefónov či iných kontaktov, ktoré sú nepravdivé alebo nezmyselné (takéto kontakty nás však väčšinou ani nezaujímajú). Tak isto sa tu nedozvieme e-maily v tom prípade, ak nie sú uvedené vo funkcii „mailto“, pretože maily ukryté v skriptoch roboty nedokážu odhaliť.

export kontaktov

Tí používatelia, ktorí sa čudujú, ako to, že im chodia spamy, keď svoju mailovú adresu uviedli „iba“ na nejakom fóre sa však aspoň teraz dozvedeli, ako to zisťujú roboty pre účely zasielania spamu. Ochrana môže byť jednoduchá – stačí napísať mailovú adresu v tvare, ktorý robot nemôže rozoznať (napr. slovne „pastierik zavinac inet bodka sk“).

Pokiaľ sa nám nechcú kontaktné informácie odpisovať, alebo ich potrebujeme viac, môžeme si pomocou zaškrtávacích políčok vybrať tie, ktoré nás zaujímajú a za pomerne nízky poplatok (6,- s DPH za jeden kontakt) nám ich prevádzkovateľ po úhrade zašle v XML formáte. Pri úhrade môžeme o. i. využiť priamo aj služby Slovenskej sporiteľne (sporopay) a Tatra banky (TatraPay).

Uloženie kontaktov - platba

Ďalšie služby,ktoré ponúka tento portál sú zamerané na prevádzkovateľov vlastných internetových stránok a sú spoplatnené. Medzi tieto služby patrí možnosť tzv. sponzorovaného odkazu, ktorá zaisťuje, aby vaše stránky boli zobrazené medzi prvými nájdenými, čím si zvýšite ich viditeľnosť a tým aj návštevnosť.

Veľmi zaujímavá je aj možnosť tzv. separátneho fulltextového vyhľadávania. V tomto prípade je zabezpečené neustále cyklické sledovanie vybranej domény, takže sa všetky novo pridané informácie dostanú ihneď aj do vyhľadávacej databázy a tým sa práve vaše stránky dokážu rýchlejšie nájsť.

Vyhľadávacia lišta Webindex na iných stránkach

Prevádzkovateľ portálu webindex.sk ponúka záujemcom aj fulltextové vyhľadávanie na ich vlastných stránkach bez toho, aby museli niečo programovať. Toto riešenie spočíva v jednoduchom pridaní vyhľadávacieho políčka na ľubovoľnej doméne, pričom sa výsledky vyhľadávania integrujú do príslušnej stránky. Pri tejto službe je možné objednať, či sa bude hľadať iba vybranej doméne, ale vo všetkých slovenských doménach. Aby sme nezabudli aj na konkurenciu, podobnú platenú službu ponúka aj Google.

Webindex.sk má však čosi aj pre každého z nás – odmenu za pomoc pri monitorovaní internetu a získavaní informácií pre tento vyhľadávač. Prevádzkovatelia vyvinuli voľne šíriteľný šetrič obrazovky, ktorý v čase, keď fyzicky nepracujete na počítači, monitoruje internet a zasiela tieto údaje do databázy Webindex.sk.

Šetrič

Šetričom vlastne poskytujete kapacitu vášho počítača a internetového pripojenia v čase, keď na ňom nerobíte v prospech vyhľadávača webindex.sk. Po zmonitorovaní určitého počtu stránok dostanete ako odmenu reklamné predmety (momentálne je to pekné tričko). Týmto vznikol ojedinelý projekt, v rámci ktorého môžeme prispieť k zlepšeniu kvality a množstva údajov, ktoré potom sami využívame.

Samozrejme, spomínaný šetrič neobsahuje žiaden škodlivý kód, neposiela žiadne informácie o počítači, na ktorom beží, ale naozaj iba monitoruje internetové stránky. Na druhej strane musíme upozorniť, že pokiaľ platíte za objem prenesených dát, nie je táto voľba pre vás optimálna. Ako zaujímavú informáciu môžeme uviesť, že podobný projekt sa chystá koncom tohto roku zaviesť aj Wikipédia.

Odmena za pomoc

Na budúce: Google nie je iba vyhľadávač.


Neprehliadnite: