Re: Polski Infoseek (bylo: Polskie "Yahoo" ???)

Autor: Wojtek Sylwestrzak (wojsyl_at_icm.edu.pl)
Data: Wed 05 Feb 1997 - 14:15:12 MET


In pl.comp.www Michal Rolski <rolski_at_sprocket.ict.pwr.wroc.pl> wrote:

: Poza tym altavista i inne wyszukiwarki zachodnie ( w tym polski Infoseek )
: nie rozrozniaja standardow polskich liter, jak wpisze sie np. slowo

W tym miejscu wypada przypomniec, ze standard jest jeden. ISO-8859-2.

: "zlacze" to zostana znalezione tylko strony, na ktroych wystepuje to
: slowo w jezyku polskawym, natomiast nie zostana znalezione te slowa
: gdzie polskie litery zostaly zakodowane w roznych standardach,
: takich jak ISO i CP. Jedynie polski NEToskop na http://www.chip.pl/

Hm, sprobowalem - np. Lech Wałęsa.
W odpowiedzi dostalem (na samym poczatku):

    LECH WALESA http://www.pol.pl:80/lawgov._p/walesa.htm
    LECH WALESA http://www.pol.pl:80/PL01/lawgov._p/walesa.htm
    LECH WALESA http://www.pol.pl:80/PL09/lawgov._p/walesa.htm
    LECH WALESA http://www.pol.pl:80/PL10/lawgov._p/walesa.htm

Oczywiscie to wszystko jest ta sama strona, tylko w roznym
kodowaniu. Czy liczycie to jako oddzielne dokumenty ?

: to potrafi. Do tego NEToskop ma niewatpliwie jedna z wiekszych na swiecie
: baz polskich stron WWW.

Liczba skatalogowanych stron WWW: 238662
Domyslam sie, ze to chodzi tylko o strony w HTML ?
Jesli tak, to infoseek ma 2 razy wiecej ...
a jesli jeszcze liczycie wielokrotnie te same strony, rozniace
sie tylko sposobem kodowania liter ...
No wlasnie - co to za liczba to 238662 ?

Pozdrawiam,

--w



To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 16:02:26 MET DST