Lista winnt@man.lodz.pl
[Lista archiwów] [Inne Listy]

[WINNT] Szukanie duplikatów plików ale według PODOBNYCH nazw, a nie taki

To: winnt@man.lodz.pl
Subject: [WINNT] Szukanie duplikatów plików ale według PODOBNYCH nazw, a nie takich samych nazw
From: "jedrek" <wonzespamem@w.on>
Date: Mon, 10 Feb 2020 12:31:38 +0100
Czy jest jakieś narzędzie, które umie szukać dubli plików, gdzie można definiować klucz wg którego ma szukać podobnych nazw? Zdarza się, że mamy plik (nie są one równe co do rozmiaru), np. jedno i to samo zdjęcie ale np. bardziej skompresowane, zmniejszone rozdzielczością. Albo ten sam film w rozdzielczości 720p i 1080p ale różniące się delikatnie nazwą, albo ta sama muzyczka tylko raz z bitrate 320kbs a w innym miejscu z bitrate 192kbps i kilka innych znaków w nazwie - przez co typowy szukacz duplikatów nazw nie wskaże nam takiego pliku jako potencjalnie zdublowanego. Większość narzędzi szukające duplikatów (czy to szukanie w Total Commander, czy to DoubleKiller) ma co do nazewnictwa plików szukanie tylko dokładnie zdublowanej tej samej nazwy kropka w kropkę w innym pliku.
Ale wystarczy, że duplikat pliku (o innym rozmiarze) ma coś więcej dopisane.
Np dodaną numerację w nazwie, albo dopisek typu "youtube", a pierwowzór nie ma takich dodatkowych ciągów dopisanych i wszelkie narzędzia polegają na takim szukaniu.
Gdy nazwy są te same nie ma problemu znaleźć, że mamy duplikat.
Ale gdy kilka znaków się nie zgadza to już po szukaniu. Czy jakieś narzędzie przewiduje, że ma się np. zgadzać n-znaków w nazwie plików? Jeżeli zdefiniowane n-znaków się zgadza to narzędzie wskazuje taki plik jako potencjalny dubel. Allbo jakieś inne kryteria, które z gąszcza tysięcy plików będą w stanie wyłuskać potencjalny dubel. Samo szukanie przez podanie słów kluczowych nazwy pliku nie wchodzi w grę, bo często nie wiemy po latach, że plik o nazwie "cdefg" ma dubla, wiemy tylko, że plik o nazwie "abcd" może mieć dubla. Dopiero rozbudowane narzędzie byłoby nam w stanie wskazać, że wskazany przez nie plik może być potencjalnym dublem.

<Pop. w Wątku] Aktualny Wątek [Nast. w Wątku>