Z archívu: Pokročilé vyhľadávanie cez Google

Tomáš Gluchman  /  18. 06. 2006, 00:00

Google je v súčasnosti najpoužívanejší svetový fulltextový vyhľadávač, ktorý indexuje vyše osem miliárd webových stránok. Umožňuje tzv. jednoduché vyhľadávanie (pomocou kľúčových slov) a pokročilé vyhľadávanie (pomocou operátorov). V tomto článku si tieto operátory predstavíme.

Základné operátory

Medzera – logický súčin. Vyhľadá stránky obsahujúce všetky slová oddelené medzerou, napr. slovenský internet (príklad).

OR – logický súčet. Vyhľadá stránky obsahujúce aspoň jedno zo slov oddelených výrazom OR, napr. web OR internet (príklad).

Úvodzovky – vyhľadá presnú frázu uvedenú v úvodzovkách, napr. "slovenský internet" (príklad).

Mínus – definuje, ktoré slovo alebo slová sa nesmú nachádzať v nájdených dokumentoch, napr. internet -web (vyhľadá slovo internet, ale len v dokumentoch, ktoré neobsahujú slovo web, príklad).

Plus – definuje, ktoré slovo (alebo slová) sa musia nachádzať vo vrátenom dokumente, napr. internet +web (vyhľadá dokumenty obsahujúce frázy internet a web, ekvivalent logického súčinu, príklad).

Hviezdička – napr. slovenský * internet (medzi slovami slovenský a internet sa nachádza jedno alebo viac slov, príklad).

Vlnovka – hľadá dokumenty obsahujúce dané slovo alebo jeho synonymá, napr. ~design (príklad). Keďže Google má v databáze väčšinou anglické synonymá, tie bude aj vracať. Pre slovo design nájde synonymá ako napr. designers, architecture, construction, a pod.

Matematické operátory

Google má integrovaný algoritmus (Google calculator), ktorý rozozná jednoduchý matematický vzorec, spracuje ho a vráti výsledok. K výpočtom je možné použiť tieto operátory:

  1. operátory pre prácu s dvoma číslami:
    1. + - pre sčítanie (napr. 1+1, príklad)
    2. - odčítanie (napr. 1-1, príklad)
    3. * - násobenie (napr. 2*2, príklad)
    4. /. delenie (napr. 4/2, príklad)
    5. ^ - mocnina (napr. druhá mocnina zo štyroch: 4^2, príklad)
    6. th root of – odmocnina ("n-tá odmocnina z", napr. 5th root of 32 = piata odmocnina z tridsaťdva, príklad)
    7. % of – výpočet percentuálneho podielu (napr. 10% of 100 = desať percent zo sto, príklad)
  2. operátory, ktoré pracujú len s jedný číslom a môžu sa vyskytovať len pred ním:
    1. sqrt – druhá odmocnina, napr. sqrt(4) (príklad)
    2. goniometrické funkcie sin, cos, tan, atď. – čísla musia byť v radiánoch alebo s uvedením jednotky, napr. sin(pi/2) (príklad v radiánoch) alebo sin(90 degrees) (príklad v stupňoch)
    3. logaritmy ln (prirodzený logaritmus so základom e) a log (dekadický logaritmus so základom 10), napr. ln(17) (príklad) alebo log(100) (príklad)
  3. operátor, ktorý pracujú len s jedným číslom a vyskytuje sa len za ním: ! - faktoriál (napr. 3!, príklad). Google calculator dokáže pracovať aj s číslami v hexadecimálnom, oktálnom, či binárnom formáte. Stačí zadať prefix, ktorý určuje číselnú sústavu:
    • 0x pre hexadecimálne čísla
    • 0o pre oktálne čísla (pozn. čítaj "nula o")
    • 0b pre čísla v binárnej podobe
    Napr.: 0x5a + 0b1010 (príklad).
  4. operátor pre prevod jednotiek: in – Google calculator pozná množstvo jednotiek a dokáže medzi nimi robiť konverzie, napr. 5 in roman numerals (príklad) alebo 1 mile in kilometer (príklad), resp. 1 miles in kilometers (príklad). Tvorcovia Google dokonca odporúčajú experimentovať s Google calculator a skúšať aj rôzne kombinácie.
    Napríklad predošlý príklad so sčítaním čísel v rôznych sústavách vráti výsledok v hexadecimálnom formáte. Výsledok môžeme previesť do sústavy decimálnej: 0x5a + 0b1010 in decimal (90 + 10 = 100, príklad).

Vhodné je pridávať na koniec výrazu pre Google calculator aj znak = (rovná sa), aby sa predišlo nedorozumeniu hlavne pri dlhších výrazoch (20+50-70=, príklad).

Viac informácií o Google calculator a pár príkladov nájdete v pomocníkovi alebo na stránkach GoogleGuide.com, kde sú aj príklady fyzikálnych jednotiek, ktoré je možné použiť.

Operátory pre pokročilé hľadanie

Sú to výrazy, ktoré spresňujú vyhľadávanie, resp. oblasť vyhľadávania (modifikátory – Query Modifiers), alebo prikazujú vyhľadávaču, čo má zobraziť (alternatívne výrazy pre vyhľadávanie – Alternate Query Types). Tieto výrazy sa zadávajú pred hľadané slovo a nesmie byť medzi nimi a slovom žiadna medzera!

Výraz: cache
Príklad: cache:www.inet.sk
Opis: Google si každú stránku, ktorú navštívi ukladá do špeciálnej pamäti, tzv. cache (pozn. čítaj keš). Použitím príkazu cache:URL sa zobrazí verzia danej webovej stránky, ktorá je uložená v Google cache. Ak za tento výraz s URL stránky pridáte ďalšie kľúčové slová, Google ich na zobrazenej stránke zvýrazní.

Výraz: link
Príklad: link:www.inet.sk
Opis: Tento výraz vyhľadá všetky web-stránky, ktoré má uložené v cache, a ktoré obsahujú odkaz na danú webovú stránku. Vracia sa zoznam stránok podobný tomu pri hľadaní kľúčových slov.

Výraz: related
Príklad: related:www.inet.sk
Opis: Vracia sa zoznam podobných (príbuzných) web-stránok k zadanej stránke.

Výraz: info
Príklad: info:www.inet.sk
Opis: Zobrazí informácie o stránke, ktorými Google disponuje. Väčšinou sa jedná o obsah META tagov obsahujúcich opis stránky (ak nie je k dispozícií, zobrazí sa vyňatok stránky ako čistý text). Zároveň vráti aj odkaz na stránku, ktorú má v cache, podobné stránky, stránky, ktoré odkazujú na danú URL, stránky, ktoré sú z domény danej URL, alebo stránky, ktoré obsahujú hľadaný výraz (v tomto prípade sa jedná o zadanú URL).
Táto služba je tiež dostupná zadaním URL stránky do políčka pre vyhľadávanie bez prefixu "info:" (napr. www.inet.sk, príklad).

Výraz: site
Príklad: site:sk (príklad) alebo site:inet.sk (príklad)
Opis: Prikazuje vyhľadávaču, na akú doménu má obmedziť vyhľadávanie. Môže sa pritom jednať o doménu prvého, druhého, tretieho, atď. rádu. Napríklad výraz site:sk obmedzí vyhľadávanie len na stránky s doménou prvého rádu SK, ale výraz site:inet.sk obmedzí vyhľadávanie len na stránky, ktoré sa nachádzajú pod doménou INET.SK (zároveň aj jej subdomény). K tomuto výrazu je možné pridávať aj kľúčové slová, podobne ako v prípade jednoduchého vyhľadávania (napr. slovenský internet site:inet.sk, príklad).

Výraz: allintitle
Príklad: allintitle:slovenský internet
Opis: Týmto výrazom Google vráti len stránky, ktoré obsahujú dané kľúčové slová v názve stránky (HTML tag title). Na vyhľadávanie je možné použiť základné operátory, teda napr. výraz allintitle:slovenský -internet (príklad) vráti webové stránky, ktoré obsahujú v názve slovo "slovenský" ale "internet" už nie.

Výraz: intitle
Príklad: intitle:slovenský internet
Opis: Podobný ako výraz "allintitle", v tomto prípade vracia Google výsledky, ktoré obsahujú v názve stránky len slovo "slovenský", pričom slovo "internet" sa môže vyskytovať kdekoľvek na stránke (či už v názve alebo nie). Ekvivalentom k "allintitle" je pridanie tohto výrazu pred každé kľúčové slovo, napr. intitle:slovenský intitle:internet (príklad) = allintitle:slovenský internet (príklad).

Výraz: allinurl
Príklad: allinurl:dmoz slovensky
Opis: Podobný ako výraz "allintitle". Kľúčové slová hľadá v URL. Poznámka: výraz akceptuje LEN kľúčové slová, teda všetky ostatné časti URL (/, &, ?,...) nebudú akceptované, napríklad výraz allinurl:dmoz / slovensky (príklad) bude braný ako allinurl:dmoz slovensky (príklad) a nebudú vrátené výsledky, kde v sa v URL vyskytujú slová dmoz a slovensky oddelené lomítkom.

Výraz: inurl
Príklad: inurl:inet internet
Opis: podobný ako výraz "intitle", ale výraz za "inurl:" sa hľadá len v URL adrese web-stránky (viď. "allinurl").

Výraz: filetype
Príklad: filetype:pdf slovenský internet
Opis: Prikazuje vyhľadávať kľúčové slová v dokumente príslušného typu súboru. Okrem štandardných dokumentov vo formáte HTML Google vyhľadáva a indexuje spolu 13 typov rôznych dokumentov (neustále sa ale vyhľadávajú ďalšie typy súborov, ktorých výskyt je zriedkavejší):

  • Adobe Portable Document Format (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • Lotus WordPro (lwp)
  • MacWrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (wri)
  • Rich Text Format (rtf)
  • Shockwave Flash (swf)
  • Text (ans, txt)

Výraz: define
Príklad: define:HTML
Opis: Trochu odlišný druh výrazu od vyššie spomenutých. Google má v databázi množstvo svetových internetových encyklopédií a umožňuje v nich vyhľadávať. Zadaním výrazu define:HTML Google vráti dostupné definície skratky HTML. Dá sa zvoliť vyhľadávanie v niektorom svetovom jazyku (angličtina, francúzština, nemčina, ruština, atď.), slovenčina tu ale nefiguruje (možnože raz budeme svetovým jazykom ;)).

Výraz: #...#
Príklad: rok 1900...2000
Opis: Ďalší odlišný druh výrazu. Definuje rozsah hľadania. Pre výraz "rok 1900...2000" sa vrátia všetky výsledky, ktoré obsahujú slovo "rok" a číslo v rozsahu od 1900 do 2000. Pomocou tohto výrazu sa dajú jednoducho vyhľadávať napr. ceny produktov.

Výraz: safesearch
Príklad: safesearch:sex
Opis: Umožňuje z výsledkov vyhľadávania odstrániť stránky s nevhodným obsahom (napr. keď niečo hľadáme pre vzdelávacie účely a chceme naozaj relevantné výsledky).

Viac tém pomocníka a F.A.Q. k vyhľadávaniu pomocou Google nájdete na http://www.google.com/intl/sk/help/index.html.

Neprehliadnite: