Re: Polski Infoseek (bylo: Polskie "Yahoo" ???)

Autor: Wojtek Sylwestrzak (wojsyl_at_icm.edu.pl)
Data: Wed 05 Feb 1997 - 23:05:46 MET


In pl.comp.www Michal Rolski <rolski_at_sprocket.ict.pwr.wroc.pl> wrote:

: : Hm, sprobowalem - np. Lech Wałęsa.
: : W odpowiedzi dostalem (na samym poczatku):

: : LECH WALESA http://www.pol.pl:80/lawgov._p/walesa.htm
: : LECH WALESA http://www.pol.pl:80/PL01/lawgov._p/walesa.htm
: : LECH WALESA http://www.pol.pl:80/PL09/lawgov._p/walesa.htm
: : LECH WALESA http://www.pol.pl:80/PL10/lawgov._p/walesa.htm

: : Oczywiscie to wszystko jest ta sama strona, tylko w roznym
: : kodowaniu. Czy liczycie to jako oddzielne dokumenty ?

: A czy jakis inny robot jest w stanie stwierdzic, ze to jest ta sama
: strona tylko w roznym kodowaniu i umiescic je
: w swojej bazie jako jedna i ta sama strona, a nie
: jako oddzielne strony ? Szczerze mowiac watpie.

A czy ktos twierdzi, ze jakis inny robot radzi sobie z polskimi literkami ? ;-)
Otoz powyzszy przyklad pokazuje, ze:
1. netoskop sobie nie radzi, bo zwraca wilokrotnie kopie tych samych
    stron rozniacych sie tylko kodowaniem
2. przekodowywanie na serwerze (w tym przykladzie www.pol.pl)
    jest szkodliwe, bo zamiast pomagac, wprowadza chaos.
   Serwer powinien serwowac tylko w ISO-8859-2, a klient powinien
   juz zajmowac sie przekodowaniem na taki system, jakiego uzywa
   na swojej platformie. I wtedy nie byloby problemu.

: Nie uwierze, ze Infoseek rozpoznaje polskie kodowanie i jest w stanie
: odfiltrowac powielajace sie strony w roznym kodowaniu.

Nie potrafi. nikt nigdy nie twierdzil, ze potrafi.

: Dlaczego na pytanie "walesa", ale gdzie l i a sa w ISO,
: infoseek zwraca tylko dwie strony?

To chyba nieprawda, wiec trudno mi odpowiedziec dlaczego.

: : No wlasnie - co to za liczba to 238662 ?

: Jest to liczba stron, ktore zostaly zakwalifikowane jako text/html.

Czyli na przyklad taki www.pol.pl zostal policzony kilkakrotnie
(jako PL01, PL09 etc)

Ciekawe co zaproponuje polska Altavista ?

--w



To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 16:02:27 MET DST