Re: Polska AltaVista, indeksowanie, bylo: Jeszcze jedno pytanko

Autor: Zbigniew S. Borowiec (borowiec_at_rpw.dec.com)
Data: Fri 21 Feb 1997 - 16:23:07 MET


Maciek Uhlig wrote:
>
> Prosze mnie oswiecic, jesli mysle nie tak, jak trzeba.
>
> robots.txt nalezy do mechanizmu antyrobotowego. To znaczy nie wpuszcza do
> penych katalogow i plikow. Do pozostalych wpuszcza. Tam robot szuka czego
> popadnie i sobie potem indeksuje. Wszystko. I to tez jest do niczego.
>
> Moim zdaniem powinno byc tak: w stronie WWW zaszyte sa slowa kluczowe. Takie,
> ktore webmaster zyczy sobie, aby byly widziane na zewnatrz. Robot pobiera tylko
> te slowa kluczowe i wedlug nich indeksuje. Wyszukiwanie jest wtedy owocne, bo
> dostaje sie to, co trzeba.
>
> Czyli polaczenie WAIS i WWW. Czy cos takiego jest zralizowane?
Oczywiscie, patrz projekt HARVEST (poszukaj przez AltaViste :) ) i
komercyjne wykonanie Netscape Catalog Server 1.0. Problem w tym ilu
autorow (w koncu oni powinni tworzyc strony a nie administrator, ktory
ewentualnie moze byc rowniez autorem) wpisuje i bedzie wpisywac takie
pola meta jak autor, address, nie mowiac o description i keywords,
ktore w tej chwili sa uzywane przez altaviste. Popatrz na tekst
ponizej linku strony w odpowiedzi altavisty. Tam zamias pierwszych ilus
linii tekstu - najczesciej nic nie mowiacego - moze byc zawartosc meta
tagu description. Rzeczywistosc jednak skrzeczy i takich opisow jest na
tyle malo, ze nie zauwaza ich sie w ogole. Osobiscie bylbym bardzo
zadowolony by z dyskusji na tematy indekserow, tagow itp. wyszedl
praktyczny efekt w postaci wspolnej akcji tak by wszystkie strony w
polskim internecie zostaly opatrzone takimi tagami, czy nie mozemy choc
raz byc w czyms dobrym przed innymi... Ale moja nadzieja nie wieksza
jest nizli ziarnko gorczycy... Raczej dyskusje bez skutkow w czynach sa
polska specjalnoscia.

Z powodu niesmialosci nie nazwe ich "biciem piany" czy "akademickimi
dyskusjami" bez urazy dla nikogo. Sorry, jesli mimo wszystko kogos
dotknalem.

rgds/
   /zsb
>
> Pozdrowienia,
>
> Maciek Uhlig



To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 16:02:58 MET DST