Čo všetko môžete získať pomocou googlu

Rasťo Turek  /  28. 05. 2005, 00:00

HIT / Bol som veľmi prekvapený čo všetko má google zaindexované. Mená, heslá, prístupy, logy, kontá, správy a všetko, čo si niekto uložil na disk a nezakázal k tomu prístup. Perličkou pre množstvo ľudí bude určite prístup na stránky s erotickou tematikou. Áno aj k tomu sa dá dostať cez google. Určite sa pýtate, ako je to možné?

Jednoducho. Google funguje v podstate ako filter databáze a teda nerozlišuje (vo väčšine prípadov) či je výsledok morálne správny alebo nie a či ste vy "tá" zodpovedná osoba ktorej ho ukázať.

Na začiatok upozornenie: Článok vznikol hlavne pre upozornenie bezpečnostných chýb a lenivosti administrátorov.

Chyby programátorov

V podstate google nedokáže len tak vytiahnuť hocijaké heslo napr. z databáze. Tu v podstate ide o chyby programátorov, ktorí ukladajú heslá napr. do textového súboru a zabudnú zakázať robotom prístup k chráneným súborom, čo sa zabezpečuje pridaním súboru robots.txt do rootu webu. Keďže takto veľa programátorov nespraví, google zaindexuje každý súbor napríklad v priečinku admin či inom, kde máte možno uschované dôležité mená a heslá Vašich klientov či návštevníkov.

Ako na to?

Určite ste už nedočkavý ako sa k takýmto veciam prepracovať. Ešte dodám, že ďalej budem pokračovať rozdelením každého postupu do samostatnej sekcie, aby to bolo priehľadnejšie. K takýmto "nekalím" činnostiam sa dostanete v podstate úplne jednoducho tým, že sa pripojíte na stránky www.google.sk (uvádzam pre prípad že ste náhodou nepoznali, čomu však moc neverím) a teraz už stačí len správne sformulovať reťazec. Väčšina z Vás hľadá asi tak, že napíše text napríklad "inet" a čaká, akú stránku mu google "vypľuje". Pri tomto "hacku" musíte však reťazce formulovať trošku inak a na to je dobre byť aspoň maličkou časťou programátor, alebo poznať máličko ako google funguje. Veľa sa dočítate na samotných stránkach www.google.sk avšak nik Vám do očí nehodí, že si kľudne môžete prezrieť zaheslované stránky. Dosť bolo teórie poďme na to.

Príklady z praxe

Erotické stránky a stránky chránené systémom .htaccess

Hodne erotických stránok využíva systém prihlasovania cez .htaccess. Pre nezainteresovaných to nie je dôležité, píšem to skôr ľuďom, ktorí vedia o čom to je. Takže ak chcete zistiť napríklad prístup k erotickej stránke, stačí ak do googlu zadáte nasledovný reťazec.

"http://*:*@deluxepass.com" admin:admin

Čo tento reťazec znamená? V podstate asi toľko, že v úvodzovkách zadaný text je text, ktorý sa dopĺňa textom za nimi. Keď žiadny nezadáte, bude sa hľadať akýkoľvek reťazec, ktorý bude zodpovedať pravidlu, v tomto prípade stručne povedané: Hľadaj na stránky deluxepass.com s akýmkoľvek reťazcom pred @ s parametrom admin:admin. Ako som povedal pred chvíľkou, ak tam parameter nepridáte, google bude hľadať akýkoľvek odpovedajúci reťazec a tak sa môžete dostať napríklad na ruské stránky, kde je týchto hesiel neúrekom. Aby ma nik neobvinil, že on nič nenašiel, tu je príklad:

http://www.lostcoders.net/posts-p16065.htm


Heslá "na objednávku"

Ďalším z príkladov, ktoré tu uverejním sú heslá tzv. na objednávku. Jednoducho množstvo stránok funguje tak, že si heslá ukladajú do priečinkov na servery a tak je ich jednoduché odhaliť. V podstate Vám tento riešenie zobrazí logy a iné informácie generované stránkami. Jedinou chybou je, že pornografické stránky majú schválne pomenované súbory, ktoré zodpovedajú vyhľadávaciemu reťazcu a tak po Vašom otvorení Vás zavalí pornografický materiál. Radšej si dopredu skontrolujte, či stránky nenesú názov pornografickej stránky, alebo si to rovno overte.

inurl:password intitle:index-of

Čo znamená tento reťazec? Prvá časť znamená, že má google hľadať slovo password v url. Druhá časť zabezpečuje že to bude priečinok, do ktorého je prístup, teda miesto na servery, kde sa môžete dostať aj vy cez http a nie len cez ftp.


SQL chyba

Google dokáže zaindexovať aj chybu SQL servera, ktorý v danej chvíli vyhodí chybu. Týmto spôsobom sa dá zistiť meno a heslo k databáze. Nevýhodou pre programátorov je pamäť, ktorú google má a ktorá Vám zobrazí stránku v danom okamžiku jeho indexácie. Väčšinu ľudí ani nenapadne po odstránení chyby toto heslo zmeniť a tu je miestečko pre Vás. Môžete kľudne získať akékoľvek informácie z veľmi veľkých stránok a narobiť aj veľa škody. Preto by som Vás chcel vyzvať k zodpovednosti, tento článok neslúži k deštrukcii alebo osobnému obohateniu, skôr ako zaujímavosť v stále jedno tvárnejšom živote. Reťazec bude vyzerať nasledovne:

"access denied for user" "using password"

Čo znamená tento reťazec? V jednoduchosti je to chybová hláška, ktorú vráti SQL server pri
chybe.


Nájdite si svoj rellease

V tejto sekcii by som Vám chcel ukázať, aké jednoduché je nájsť napríklad kompletný Windows v celom balíku. Ale to nie je jediná možnosť. Existuje ich veľmi veľké množstvo, mnoho obmien a podobne. Asi teraz neviete o čom hovorím a preto Vám najskôr ukážem reťazec, ktorý zabezpečí vyhľadávanie balíka.

inurl:microsoft filetype:iso

Opäť známy parameter. Takže prvá časť prehľadá url či sa v nej nenachádza slovo microsoft. Len čo toto slovo objaví, hľadá automaticky typ zabezpečený druhou frázou a ten je teraz definovaný ako iso. Iso je kompletný balík, teda image cédečka a podobne. Je však množstvo možností, ako a aký balík získať. V url môžete hľadať aj iné slová ako napríklad adobe, cad, oracle, pinnacle a podobne. Typ súboru je samozrejme tiež len na Vás, ak sa rozhodnete že bude .zip tak bude .zip. Je veľa typov .rar, .ace, .iso, .cue, .bin, .tar.gz, .gz, .mdf a ďalej.


FrontPage heslá

Tento "fantastický" program využíva aj v tejto dobe hodne veľa ľudí a tak je ešte stále možné nájsť heslá, ktoré vytvoril. Google dokáže aj krásne filtrovať výsledok, čiže výstup bude už len čistý text meno heslo. Reťazec bude vyzerať takto.

ext:pwd inurl:(service | authors | administrators | users) "# -FrontPage-"

Ak si prezriete reťazec zistíte, že záujem máme len o súbor pwd a prehľadávame url ktorá obsahuje slová service, authors, administrators, users a hľadáme len typ FrontPage.


Citlivé súbory

Google Vám môže vyhľadať aj takzvané citlivé súbory, medzi ktoré by som napríklad zaradil logy a podobne. Tu je zoznam súborov, ktoré môžu znamenať bezpečnostné riziko. Pamätajte, že stránky sa vyvíjajú, menia a tak je dobre prehľadávať skôr pamäť samotného googla. Reťazec bude vyzerať nasledovne.

intitle:"Index of" _vti_inf.html

Ako sme si už pred tým povedali, prvá časť nám zabezpečí zobrazenie len výpisu a prístupu k priečinku webu, druhá vyhľadáva jednotlivé súbory. Ich zoznam tých asi najpodstatnejších nájdete tu.

_vti_inf.html, service.pwd, users.pwd, authors.pwd, administrators.pwd, shtml.dll, shtml.exe, fpcount.exe, default.asp, showcode.asp, sendmail.cfm, getFile.cfm, imagemap.exe, test.bat, msadcs.dll, htimage.exe, counter.exe, browser.inc, hello.bat, dvwssr.dll, cart32.exe, add.exe, index.JSP, index.jsp, SessionServlet, shtml.dll, index.cfm, page.cfm, web_store.cgi, shop.cgi, upload.asp, default.asp, pbserver.dll, phf, test-cgi, finger, Count.cgi, php.cgi, php, nph-test-cgi, handler, webdist.cgi, webgais, websendmail, faxsurvey, htmlscript, perl.exe, wwwboard.pl, www-sql, view-source, campas, aglimpse, glimpse, man.sh, AT-admin.cgi, AT-generate.cgi, filemail.pl, maillist.pl, info2www, files.pl, bnbform.cgi, survey.cgi, classifieds.cgi, wrap, cgiwrap, edit.pl, perl, names.nsf, webgais, dumpenv.pl, test.cgi, submit.cgi, guestbook.cgi, guestbook.pl, cachemgr.cgi, responder.cgi, perlshop.cgi, query, w3-msql, plusmail, htsearch, infosrch.cgi, publisher, ultraboard.cgi, db.cgi, formmail.cgi, allmanage.pl, ssi, adpassword.txt, redirect.cgi, f, cvsweb.cgi, login.JSP, login.jsp, dbconnect.inc, admin, htgrep, wais.pl, amadmin.pl, subscribe.pl, news.cgi, auctionweaver.pl, .htpasswd, acid_main.php, access_log, access-log, access.log, log.htm, log.html, log.txt, logfile, logfile.htm, logfile.html, logfile.txt, logger.html, stat.htm, stats.htm, stats.html, stats.txt, webaccess.htm, wwwstats.html, source.asp, perl, mailto.cgi, YaBB.pl, mailform.pl, cached_feed.cgi, cr, global.cgi, Search.pl, build.cgi, common.php, common.php, show, global.inc, ad.cgi, WSFTP.LOG, index.html~, index.php~, index.html.bak, index.php.bak, print.cgi, register.cgi, webdriver, bbs_forum.cgi, mysql.class, sendmail.inc, CrazyWWWBoard.cgi, search.pl, way-board.cgi, webpage.cgi, pwd.dat, adcycle, post-query, help.cgi

Možno sa Vám bude zdať zoznam pridlhý, ale povedal by som že je prikrátky. Súborov, ktoré môžu vážne ohroziť Vášho webu. Tu je krásny príklad bezpečnosti.

http://gray-world.net/etc/passwd/


Heslá v súbore

Ak sa Vám ešte nemálilo, ukážem Vám ako nájsť aj heslá v textovom súbore uložené niekde na servery. Zápis bude nasledovný.

inurl:passlist.txt

Myslím, že tu ani nie je čo vysvetľovať. Ak by ste hľadali iný typ, html alebo napríklad php zameňte ho. Rovnako aj názov súboru môžete zameniť.


Overovacie súbory

Nad týmto názvom som polemizoval asi hodinu, tak ma prosím nezbite. Ide o súbor, kde sa do textového súboru zapisujú údaje o užívateľoch, čo používa napríklad DCForum a DCShop. Tu sa naskytá otázka, či je vôbec možné, aby firma ktorá ponúka elektronický obchod môže vôbec takto triviálne zapisovať dáta. Ale to je na inú diskusiu. Zápis bude nasledovný.

allinurl:auth_user_file.txt

Význame je asi taký, že hľadáte v celej url dostupné práve tento jeden textový súbor. Skoro som z nôh spadol, keď som objavil tento súbor. Upozorňujem že je z pamäte googla.

http://64.233.183.104/search?q=cache:A_0xhNsU5DwJ:www.hktransit.com/shop/cgi-bin/DCShop/Auth_data/auth_user_file.txt+allinurl:auth_user_file.txt&hl=sk


Hry, filmy, hudba a iné


Aj toto sa dá pomocou googla nájsť. Zápis je veľmi jednoduchý.

"parent directory " /appz/ -xxx -html -htm -php -shtml -opendivx -md5 -md5sums

"parent directory " DVDRip -xxx -html -htm -php -shtml -opendivx -md5 -md5sums

"parent directory " Xvid -xxx -html -htm -php -shtml -opendivx -md5 -md5sums

"parent directory " Gamez -xxx -html -htm -php -shtml -opendivx -md5 -md5sums

"parent directory " MP3 -xxx -html -htm -php -shtml -opendivx -md5 -md5sums

"parent directory " Meno speváka alebo skupiny -xxx -html -htm -php -shtml -opendivx -md5 -md5sums


Ak sa pozriete na zápis, zistíte že sa dá ľahko vyhľadať akákoľvek vec na googli.


Hudba

Vyhradil som si pre tuto špecialitku jednu kategóriu. Po zadaní jednoduchého reťazca do googla môžete nájsť celé albumy spevákov, skupín a pod. Ak niečo hľadáte, zadajte tento reťazec.

?intitle:index.of? mp3

Znamená asi toľko, že hľadáte v priečinku vami zobraziteľnom súbor končiaci na mp3. Ak pridáte aj speváka, tak výsledok bude ešte viac presný. Príkladom ?intitle:index.of? mp3 jackson nájdete množstvo z jeho albumov, ja som klikol hneď na prvý odkaz a lala

http://laugh-svca.www.conxion.com/media/mp3/Jackson/


Zhodnotenie a záver

Myslím, že je to nadnes už aj dosť. Dúfam, že som Vás týmto článkom zaujal a že sa stane Vaším obľúbeným. Chcem Vás však poprosiť o niekoľko vecí. Všetky informácie používajte s mierou a hlavne pre svoje osobné účely. Prosím nevyužívajte ich pre prospech svoj alebo iných osôb. Ďalej dúfam, že článok nevyvolá histériu a že nebude polovica návštevníkov inet.sk vyhľadávať tieto informácie. Článok vznikol hlavne pre upozornenie bezpečnostných chýb a lenivosti administrátorov.

Ak by mal tento článok u Vás úspech, môžem sa pozrieť aj na ďalšie možnosti využitia internetových nástrojov.

Na záver by som Vás rád všetkých pozval do novo vzniknutého fóra pre programátorov ale i obyčajných ľudí sídliace na adrese http://forum.helfnimi.com. Dúfam, že aj tu sa budete cítiť dobre a budete sa radi vracať.

Prajem veľa úspechov pri googlovaní.

Rastislav Turek // http://forum.helfnimi.com

Neprehliadnite: