Vyhľadávanie a mazanie duplicitných súborov – CloneSpy

Július Pastierik  /  17. 01. 2008, 00:00

Máte dojem, že niektoré súbory máte na disku viackrát a hľadáte nástroj, pomocou ktorého by ste toto dokázali zistiť? Skúste sa pozrieť na program CloneSpy, ktorý v tomto smere ponúka viac než zaujímavé možnosti.

 

Určite sa mnohým z vás stalo, že ste pracovali s nejakým súborom a „zrazu“ ste zistili, že vidíte niečo, čo ste už niekedy upravovali – jednoducho ste otvorili „zabudnutú“ starú verziu. Alebo si ukladáte na disk fotografie a namiesto presunutia ich skopírujete a potom neviete, či niektorá fotografia sa nenachádza aj inde – a ak áno, tak kde. Jedným slovom, tak ako na pracovnom stole, tak aj v počítači si počas práce vytvoríme „pracovný neporiadok“ a po určitom čase je vhodné, aby sme „upratali“.

Manuálne vyhľadávanie a porovnávanie súborov je síce tiež jedna z metód, ako dosiahnuť poriadok, ale pokiaľ máte na disku tisícky súborov, je to práca bez konca a sotva dosiahneme želateľný účinok – jednoducho namiesto prachovky potrebujeme výkonný vysávač. A takýmto „vysávačom“ môžeme nazvať predstavovaný program CloneSpy.

Parametre času a veľkosti

Hneď na úvod uveďme, že tento program sa neinštaluje a pretože si nastavenia ukladá do inicializačného súboru („CloneSpy.ini“), môžeme ho nosiť zo sebou aj na USB kľúči.

Pretože program ponúka až štyri rôzne spôsoby vyhľadávania duplicitných súborov, veľmi dôležité je nastavenie niektorých parametrov (voľba „File – Options“), ktoré sa pri niektorých typoch používajú. Z mnohých možností, ktoré tu nájdeme spomeňme napr. vymedzenie typov hľadaných súborov či už podľa ich atribútov (napr. vylúčime prezeranie systémových súborov) alebo podľa prípon (napr. vylúčime vyhľadávanie programov EXE, COM, DLL…). Pravdaže, ak si chceme skontrolovať, či nemáme zbytočne viacnásobne uložené napr. inštalačné programy stiahnuté z internetu, túto možnosť nepoužijeme.

Okrem súborov môžeme špecifikovať aj ignorované adresáre. Program pri vlastnej kontrole automaticky pracuje aj s podadresármi pričom môžeme kontrolovať nielen lokálne disky, ale aj disky, ktoré zdieľame z iných počítačov v rámci počítačovej siete, takže kontrola môže byť veľmi dôkladná a napr. správca systému môže pomocou tohto nástroja jednoducho a efektívne prekontrolovať celú počítačovú sieť.

Atribúty súborov

Medzi ďalšie zaujímavé nastavenia patrí možnosť nastavenia časových a veľkostných parametrov kontrolovaných súborov, teda môžeme programu určiť, že má kontrolovať iba súbory, ktoré boli vytvorené (modifikované) iba v určitom časovom období, resp. ktoré majú iba stanovený rozsah veľkosti. Pri tomto môžeme nastaviť aj tzv. parameter „podobnosti“, ktorým určujeme, že súbory, ktoré sa líšia o stanovenú veľkosť sú „podobné“. Táto veľkosť môže byť zadaná s presnosťou 1 byte, ale môžeme ju zadať aj v rozsahu kB, MB či dokonca GB.

Aby sme mali istotu, že pri mazaní duplicitných súborov náhodou nezmažeme súbor jedinečný, môžeme si nastaviť, ako sa má vlastné mazanie správať – či sa majú súbory mazať do koša, mazať nenávratne alebo iba presunúť do špecifikovaného adresára.

Ignorované adresáre

Ako vidíme z nastavení možností, program toho ponúka naozaj dosť už v tejto oblasti a preto môžeme očakávať, že nás príjemne prekvapí aj v oblasti vlastného hľadania. Je to naozaj tak. CloneSpy umožňuje vyhľadávať duplicitné súbory v špecifikovaných adresároch a porovnávať súbory medzi skupinami adresárov. Okrem toho môžeme vytvárať kontrolné CSC súbory adresárov. Pri porovnávaní s nimi nám potom program vypíše údaje iba o tých súboroch, ktoré sa nachádzajú v týchto adresároch a zároveň ich máme zapísané v týchto zoznamoch, čím môžeme sledovať napr. či došlo k ich zmene, alebo či sa nám náhodou znovu neobjavil niekde súbor, ktorý tam nemá čo robiť a pod.

Parametre mazania súborov

Pri vlastnom hľadaní program pracuje v dvoch automatických krokoch. V prvom si vytvorí zoznam súborov a v druhom robí vlastné porovnávanie. Preto sa môže stať, že ak medzitým niektorý súbor napr. vymažeme v inom programe, CloneSpy nám ohlási, že príslušný súbor nenašiel a musíme mu povedať, ako sa má s tým vysporiadať (opakovať pokus o jeho prečítanie, ignorovať chybu atď.).

Pri vlastnom vyhľadávaní duplicitných súborov nám program ponúka štyri rôzne spôsoby. Pri prvom spôsobe „Duplicates“ vyhľadávame zhodné súbory bez ohľadu na ich názov a príponu, pričom sa porovnáva ich obsah. Takýmto spôsobom môžeme odhaliť aj duplicitné súbory s nesprávnymi príponami. Pravdaže, nie všetky takto nájdené súbory sú zbytočné, pretože napr. pri video DVD súboroch program nájde zhodné IFO a ich záložné BUP súbory (ktoré sú však potrebné).

Porovnávanie súborov v rôznych adresároch

Vzhľadom na to, že program ignoruje názvy a prípony a porovnáva súbory s rovnakou veľkosťou podľa ich obsahu, môžeme takto odhaliť napr. spomínané viacnásobné fotografie, ktoré sme presunuli do iného adresára, tam premenovali a potom sme ich zabudli z pôvodného adresára vymazať.

Druhý spôsob vyhľadávania „ Duplicates + same name“ je podobný prvému, ale v tomto prípade sa pri hľadaní zhodných súborov berie do úvahy aj podmienka zhodného názvu. Samozrejme, týmto spôsobom dosiahneme rýchlejšie vyhľadávanie oproti prvému spôsobu, na druhej strane je jasné, že program nemusí zistiť všetky duplicity.

Zhodné súbory podľa mena aj veľkosti, ktoré však nie sú duplicitné

Tretí spôsob vyhľadávania „Same name“ sa venuje súborom s rovnakým názvom bez ohľadu na ich veľkosť. Je to vynikajúci spôsob, ako odhaliť staré „zabudnuté“ verzie určitých súborov. Ako inak, aj tento spôsob má svoje nedostatky – ak máme napr. na disku viac filmov, potom nám nájde napr. „duplicitné“ súbory „VTS_01_0.BUP“, ktoré však určite nie sú duplicitné a nie sú to ani rôzne staré verzie jedného a toho istého súboru.

Niektoré nedostatky tretieho spôsobu hľadania čiastočne odstraňuje posledný – štvrtý spôsob „Same name + (approx.) same size“. Pri tomto spôsobe hľadania sa berie do úvahy nastavený parameter „podobnosti“ veľkosti, takže sa porovnávajú iba súbory, ktoré majú nielen rovnaké názvy, ale aj nami definovanú podobnú veľkosť. Aj tu však môžeme naraziť na nesprávne vyhľadanie, pretože niekedy aj súbor s rovnakým názvom a veľkosťou (a dokonca aj obsahom, ktorý sa však v tomto prípade neporovnáva) môže byť rôzny iba preto, lebo je súčasťou celého systému súborov – napr. pri stiahnutých internetových stránkach.

Rovnaké mená súborov, ktoré označujú neduplicitné súbory

Ako vidíme, ani jeden spôsob hľadania nie je dokonalý, ale to sa pri automatickom vyhľadávaní nedá ani dosiahnuť a preto po nájdení duplicitných súborov sa nás program opýta, čo má urobiť. Súbory, ktoré chceme vymazať môžeme označiť manuálne (dvojklikom) alebo automaticky (podľa veku, veľkosti…) a máme k dispozícii aj inverziu výberu. Aby sme sa vedeli správne rozhodnúť, po označení súboru ho môžeme „spustiť“, t. j. otvoriť v programe, s ktorým je asociovaný alebo si otvoriť adresár, kde sa predmetný súbor nachádza.

Ako sme už spomínali, nájdené „duplicity“ v skutočnosti duplicitami vôbec nemusia byť a preto program okrem možnosti vymazania ponúka aj možnosť preskočenia nájdených duplicít. Až po určení, čo sa má s nájdenými súbormi urobiť program pokračuje vo vyhľadávaní ďalej, pokiaľ neprehľadá všetky súbory vo vybraných adresároch, resp. pokiaľ ho vo vyhľadávaní neprerušíme. Ak nám prekáža možnosť manuálneho označovania, môžeme si nastaviť aj automatické mazanie, ale toto odporúčame naozaj iba v tom prípade, keď sme si istí, že nájdené duplicity sú naozaj duplicitné súbory. Práve preto sme pri jednotlivých možnostiach spomenuli ich nedostatky.

Internet: www.clonespy.com

Neprehliadnite: