Re: przeszukiwanie zasobów internetu

Autor: Arek Staron (astaron_at_mail.onet.pl)
Data: Tue 23 Jan 2001 - 08:36:46 MET


Dnia 22 Jan 2001 11:28:51 GMT, e-golab przylecial i wygruchal:
>[ Almight]
>
>>- ile czasu potrzebował bym aby przeszukać wszystkie zasoby
>> internetu z końcówką .pl w adresie?
>
>Najpierw zastanów się skąd weźmiesz _wszystkie_ nazwy *.pl,
>chyba, że będziesz sprawdzał wszystkie kombinacje aaaaaaa.pl,
>aaaaaab.pl, aaaaaac.pl .... powodzenia.

Nieeee, tego sie tak nie robi... Od tego są spidery..
Piszesz kawałek forkujcego sie kodu, który zaczyna od jakiejś strony, zciąga ją
indeksuje w bazie wybiera z niej linki i idzie dalej po nich...
Wystarczy więc spreparować pierwszą stronkę z kilkoma popularnymi linkami i
dalej idzie już siamo...

-- 
Arek Staroń <astaron_at_republika.pl>
WE APOLOGISE FOR THE INCONVENIENCE


To archiwum zostało wygenerowane przez hypermail 2.1.7 : Tue 18 May 2004 - 21:19:41 MET DST