Re: AltaVista i inne przeszukiwarki

Autor: Jaroslaw Zielinski (jz_at_it.com.pl)
Data: Wed 05 Feb 1997 - 20:43:02 MET


Zbigniew S. Borowiec wrote:
>
> Jaroslaw Zielinski wrote:
>
> > Czy AltaVista korzysta z <META> tak jak Infoseek, to znaczy, czy mozemy
> > wyszukac autor:Kowalski, jesli na serwerze mamy <meta name="autor"
> > content="kowalski"?
>
> Na razie obsluguje tylko tagi HTML'a takie jak applet, img src, oraz
> meta tag description, ale tylko na razie :)

Wyjasnie moze, dlaczego to wazne. Polecenia <meta name> pozwalaja
zdefiniowac w dokumencie HTML pola. Wyobrazmy sobie na przyklad
internetowe wydanie archiwum duzej gazety, to jest setki tysiecy tekstow
(kazdy numer gazety to ponad sto tekstow). Kazdy tekst jest zapisany w
oddzielnym pliku HTML i zdefiniowane sa typowe pola opisu
bibliograficznego: autor, tytul, numer gazety, data, dzial, slowa
kluczowe (keywords, streszczenie (description).

Dzieki temu mozemy uzywajac zwyklej maszyny wyszukiwawczej wyszukac
artykuly danego autora czy na dany temat. Oczywiscie sa maszyny
wyszukiwawcze, ktore pozwalaja na definiowanie dowolnych pol, ale te sa
kilkakrotnie drozsze od tych prostych, pelnotekstowych (powiedzmy 8000
dolarow do 1000 dolarow lub nawet do 0 dolarow w przypadku Microsoft
Index Server). Mozemy nawet uzywac publicznej uslugi wyszukiwawczej,
takiej jak Infoseek (ktora w pelni wykorzystuje <meta name>).

Gdyby wiecej autorow stron internetowych zaczelo uzywac <meta name>, to
bysmy sie w Internecie czuli coraz bardziej jak w bibliotece a nie jak
na wysypisku makulatury, gdzie mozna znalezc co prawda sporo ciekawych
rzeczy, ale nijak nie ma na to metody.

AltaVista tak naprawde rozpoznaje dwa pola, a nie jedno: description i
keywords, sprawdzilem to wlasnie w pliku pomocy
(http://www.altavista.digital.com/cgi-bin/query?pg=h). Sa to podstawowe
pola, ktorych uzywaja wszystkie liczace sie uslugi wyszukiwawcze (nie
wiem jak Netoskop czy Sieciowid).

> > Mysle, ze generalny problem z AltaVista byl/jest taki, w porowaniu z
> > HotBot, ze AltaVista to wielkie publiczne demo mozliwosci komputerow DEC
> > Alpha, natomiast HotBot to komercyjna usluga wyszukiwawcza, majaca
> > zamiar utrzymywac sie z reklam. Roznica ta powoduje inne podejscie.

> Blad ..., zarowno altavista.digital.com jak i wszystkie mirrory
> zaczynaja utrzymywać sie z reklam, zapraszam na ich strony jako dowod.
> A mirrorow i kolejnego poziomu uslug który oficjalnie nazywa sie
> Value Added Link jest juz kilka ...(Holandia, Szwajcaria ....) Nie
> mowiac o tym, iz większosc serwisow przeszukiwawczych w USA
> (patrz Lycos, ale nie tylko) bazuje na danych zebranych przez Altaviste.

Gdy AltaVista zaczynala prace i gdy z niej korzystalem, do momentu gdy
przerzucilem sie na HotBot, nie bylo tam zadnych reklam. Teraz juz sa,
wiec problem "byl" a nie "jest". Ciagle uwazam, ze AltaVista jest mniej
zaawansowana niz HotBot czy Infoseek i mam takie wrazenie, ze to
dlatego, ze wazniejsze bylo pokazanie tych wielkich mlynow niz robionej
w nich maki.

Natomiast ma AltaVista szanse, ktorej nie ma HotBot (a ktora juz dzieki
Wojtkowi Sylwestrzakowi wykorzystal Infoseek) - stworzenia dobrej uslugi
wyszukiwawczej w Polsce. Czy ja wykorzysta? Zobaczymy, duzo zalezy od
tego, kto bedzie ja w Polsce robil. Mysle, ze nie jest tu problemem
ilosc dokumentow - jesli dzis mamy ich ponad 200 tysiecy, za rok pewnie
bedzie 300 tysiecy, to ciagle jest malo w porownaniu z 30 milionami na
swiecie; problemem beda drobne kruczki przy implementacji - "diabel
siedzi w szczegolach" - ktore moga polozyc nawet najbardziej markowy
pomysl.

Jaroslaw Zielinski
http://winter.it.com.pl/ - Projekt Winter

PS. Do Zbigniewa Borowca - warto albo uzywac ISO Latin 2 albo pisac
"polskawo", bo to sie trudno pozniej czyta.



To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 16:02:27 MET DST