Re: przeszukiwanie zasobów internetu

Autor: Zbigniew Cofała (cofala_at_firma.hoga.pl)
Data: Tue 23 Jan 2001 - 18:19:15 MET


     Almight wrote:
> chciałym napisać programik do przeszukiwania zasobów internetu

> - nie mając stałego dostępu do internetu czy mogę go umieścić na jakimś
> - bezpłatnym serwerze aby działał non-stop?

Nie ma szans.

> czy są do tego
> odpowiednie serwery?

Owszem. I to do tego używa się farmy serwerów.

> - jakie warunki musiał by spełniać taki program (w jakim języku i na
> jaką platformę go napisać)?

Biorąć pod uwagę twoje założenia (poindeksowanie wszystkich stron w
internecie) nie ma do tego standardowych narzędzi. Nawet oprogramowanie baz
danych na których stoją takie maszyny jest pisane konkretnie pod to
zastosowanie. Każdy Oracle czy Informix by się wyłożył.

> - czy możecie polecić jakieś linki lub literaturę?

http://szukaj.topole.com - to taka wyszukiwarka która sobie stoi u mnie w
domu i zindeksowałem w niej trzy małe site'y na próbę:
http://www.linux.com.pl/
http://www.jtz.org.pl/
http://www.ygreg.and.pl/
a i tak jest tam prawie 2000 dokumentów. W polskim internecie masz ponad 6
mln stron. Teraz sobie wyobraź że w każdej sekundzie wchodzi 5 ludzi na
stronę wyszukiwarki i zadaje pytanie.

> - ile czasu potrzebował bym aby przeszukać wszystkie zasoby internetu z
> końcówką .pl w adresie?

Zależy od prędkości łącza - kilka dni do tygodnia. Problemem nie jest
zindeksowanie, problemem jest zwracanie wyników zapytań tak dużej bazy.

> Tylko nie mówcie mi ze mam wyszukiwarki. Wiem o tym.

Naprawdę masz wyszukiwarki :)

-- 
-=< all the best! >=-
cofala_at_firma.hoga.pl
FidoNet: 2:484/26.7


To archiwum zostało wygenerowane przez hypermail 2.1.7 : Tue 18 May 2004 - 21:19:48 MET DST