Re: czym znalezc pliki o zblizonych nazwach...

Autor: Grzegorz Niemirowski <gnthexfiles_at_poczta.onet.pl>
Data: Sun, 7 Apr 2013 15:39:54 +0200
Message-ID: <kjrt00$2c2$1@news.icpnet.pl>
Content-Type: text/plain; format=flowed; charset="iso-8859-2"; reply-type=response

artiun <artiun_at_spam.wp.pl> napisał(a):
> Ten przykład, który podał - jest prosty.

No właśnie. Niech poda jakiś bardziej miarodajny. Albo po prostu próbkę
losowych 10% plików.

>> Pamiętaj, że jeśli jeden plik
>> ma tyle samo wspólnych wyrazów co drugi, a drugi tyle samo co trzeci, to
>> wcale nie musi oznaczać, że trzeci będzie miał tyle samo, co pierwszy.
>> Możesz też grupować według określonej liczby tych samych wyrazów, ale
>> wtedy będziesz mieć jeden plik w wielu grupach.
> Długość napisów (nazw plików) nie ma znaczenia

Nie napisałem niczego, bo by temu przeczyło.

> - grupuje się po podanych fragmentach.

Ale nie mamy ich podanych, tylko kilka niereprezentatywnych przykładów,
które stanowią jakiś promil całości.

> To prawda, jeśli dla podanego przykładu wprowadzę jako filtr Kowal - to
> uzyskam to co na wejściu.

Ja zrozumiałem tak, że żadnego filtru nie ma. Filtry mają się tworzyć
dynamicznie.

> Odwracasz role, algorytm jest jeden, ten który go wykorzystuje musi
> myśleć (wiedzieć) co robi. z mojego doświadczenia wynika, że samo
> programowanie to pestka w porównaniu z energonomią i zapewnieniem
> idiotoodporności (głupi przykład - co by przy błędach nie pozwalać na
> Enter, Enter...)

Chodzi mi o to, że żadnego algorytmu na tę chwilę nie ma. Żeby zaproponować
jakiś algorytm, trzeba by lepiej poznać resztę nazw plików oraz preferencje
pytającego. Można wymyślić różne algorytmy, które dadzą taki wynik jak w
przykładzie, ale dla reszty danych mogą wypaść kiepsko. I moim zdaniem
najtrudniejszą rzeczą będzie algorytm ogólny. Potem bardziej szczegółowy,
obsługujący sytuacje takie jak Enter, Enter itp.

-- 
Grzegorz Niemirowski
http://www.grzegorz.net/
OE PowerTool i Outlook Express: http://www.grzegorz.net/oe/
Uptime: 3 days, 22 hours, 20 minutes and 20 seconds 
Received on Sun 07 Apr 2013 - 15:45:02 MET DST

To archiwum zostało wygenerowane przez hypermail 2.2.0 : Sun 07 Apr 2013 - 16:42:01 MET DST