Autor: Szymon Sokol (szymon_at_uci.agh.edu.pl)
Data: Thu 10 Nov 1994 - 11:59:18 MET
Jaroslaw Rafa (RAJ_at_inf.wsp.krakow.pl) wrote:
: Ja sie nie znam na WWW-robotach. Ale opisz moze w prostych slowach jak WWW
: serwer rozpoznaje, ze korzysta z niego robot, a nie normalny uzytkownik?
W prostych slowach: protokol HTTP zawiera mozliwosc "przedstawienia" sie
klienta serverowi (jest to tzw. pole "User-Agent"). No wiec jak User-Agent=
{Lynx, Mosaic, ...} to jest zwykly uzytkownik, a jak User-Agent={WebCrawler,
...} to jest to robot. Oczywiscie to nie jest foolproof, bo ludzie pisza nowe
browsery - i w zwiazku z tym jest ta wlasnie konwencja, ze robot ma SAM
sprawdzac, czy istnieje na serverze zbior /robots.txt i stosowac sie do jego
zawartosci. Jak sie nie stosuje, to... trudno ;-)
-- Szymon Sokol -- Network Manager U U M M M M University of Mining and Metallurgy, Computer Center U U MM MM MM MM ave. Mickiewicza 30, 30-059 Krakow, POLAND U U M M M M M M M M TEL. +48 12 338100 EXT. 2885 FAX +48 12 338907 UUUUU M M M M M M finger szymon_at_galaxy.uci.agh.edu.pl for PGP key WWW page: http://www.uci.agh.edu.pl/~szymon/
To archiwum zostało wygenerowane przez hypermail 2.1.7 : Wed 19 May 2004 - 15:46:56 MET DST