Re: http://xxx.lanl.gov/

Autor: Szymon Sokol (szymon_at_uci.agh.edu.pl)
Data: Thu 10 Nov 1994 - 11:59:18 MET


Jaroslaw Rafa (RAJ_at_inf.wsp.krakow.pl) wrote:

: Ja sie nie znam na WWW-robotach. Ale opisz moze w prostych slowach jak WWW
: serwer rozpoznaje, ze korzysta z niego robot, a nie normalny uzytkownik?

W prostych slowach: protokol HTTP zawiera mozliwosc "przedstawienia" sie
klienta serverowi (jest to tzw. pole "User-Agent"). No wiec jak User-Agent=
{Lynx, Mosaic, ...} to jest zwykly uzytkownik, a jak User-Agent={WebCrawler,
...} to jest to robot. Oczywiscie to nie jest foolproof, bo ludzie pisza nowe
browsery - i w zwiazku z tym jest ta wlasnie konwencja, ze robot ma SAM
sprawdzac, czy istnieje na serverze zbior /robots.txt i stosowac sie do jego
zawartosci. Jak sie nie stosuje, to... trudno ;-)

--
                        Szymon Sokol -- Network Manager
U     U M     M M     M University of Mining and Metallurgy, Computer Center
U     U MM   MM MM   MM ave. Mickiewicza 30, 30-059 Krakow, POLAND
U     U M M M M M M M M TEL. +48 12 338100 EXT. 2885  FAX +48 12 338907
 UUUUU  M  M  M M  M  M finger szymon_at_galaxy.uci.agh.edu.pl for PGP key
                        WWW page: http://www.uci.agh.edu.pl/~szymon/


To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 15:46:56 MET DST