artiun <artiun_at_spam.wp.pl> napisał(a):
> Ten przykład, który podał - jest prosty.
No właśnie. Niech poda jakiś bardziej miarodajny. Albo po prostu próbkę
losowych 10% plików.
>> Pamiętaj, że jeśli jeden plik
>> ma tyle samo wspólnych wyrazów co drugi, a drugi tyle samo co trzeci, to
>> wcale nie musi oznaczać, że trzeci będzie miał tyle samo, co pierwszy.
>> Możesz też grupować według określonej liczby tych samych wyrazów, ale
>> wtedy będziesz mieć jeden plik w wielu grupach.
> Długość napisów (nazw plików) nie ma znaczenia
Nie napisałem niczego, bo by temu przeczyło.
> - grupuje się po podanych fragmentach.
Ale nie mamy ich podanych, tylko kilka niereprezentatywnych przykładów,
które stanowią jakiś promil całości.
> To prawda, jeśli dla podanego przykładu wprowadzę jako filtr Kowal - to
> uzyskam to co na wejściu.
Ja zrozumiałem tak, że żadnego filtru nie ma. Filtry mają się tworzyć
dynamicznie.
> Odwracasz role, algorytm jest jeden, ten który go wykorzystuje musi
> myśleć (wiedzieć) co robi. z mojego doświadczenia wynika, że samo
> programowanie to pestka w porównaniu z energonomią i zapewnieniem
> idiotoodporności (głupi przykład - co by przy błędach nie pozwalać na
> Enter, Enter...)
Chodzi mi o to, że żadnego algorytmu na tę chwilę nie ma. Żeby zaproponować
jakiś algorytm, trzeba by lepiej poznać resztę nazw plików oraz preferencje
pytającego. Można wymyślić różne algorytmy, które dadzą taki wynik jak w
przykładzie, ale dla reszty danych mogą wypaść kiepsko. I moim zdaniem
najtrudniejszą rzeczą będzie algorytm ogólny. Potem bardziej szczegółowy,
obsługujący sytuacje takie jak Enter, Enter itp.
-- Grzegorz Niemirowski http://www.grzegorz.net/ OE PowerTool i Outlook Express: http://www.grzegorz.net/oe/ Uptime: 3 days, 22 hours, 20 minutes and 20 secondsReceived on Sun 07 Apr 2013 - 15:45:02 MET DST
To archiwum zostało wygenerowane przez hypermail 2.2.0 : Sun 07 Apr 2013 - 16:42:01 MET DST