Autor: Zbigniew Cofała (cofala_at_firma.hoga.pl)
Data: Tue 23 Jan 2001 - 18:19:15 MET
Almight wrote:
> chciałym napisać programik do przeszukiwania zasobów internetu
> - nie mając stałego dostępu do internetu czy mogę go umieścić na jakimś
> - bezpłatnym serwerze aby działał non-stop?
Nie ma szans.
> czy są do tego
> odpowiednie serwery?
Owszem. I to do tego używa się farmy serwerów.
> - jakie warunki musiał by spełniać taki program (w jakim języku i na
> jaką platformę go napisać)?
Biorąć pod uwagę twoje założenia (poindeksowanie wszystkich stron w
internecie) nie ma do tego standardowych narzędzi. Nawet oprogramowanie baz
danych na których stoją takie maszyny jest pisane konkretnie pod to
zastosowanie. Każdy Oracle czy Informix by się wyłożył.
> - czy możecie polecić jakieś linki lub literaturę?
http://szukaj.topole.com - to taka wyszukiwarka która sobie stoi u mnie w
domu i zindeksowałem w niej trzy małe site'y na próbę:
http://www.linux.com.pl/
http://www.jtz.org.pl/
http://www.ygreg.and.pl/
a i tak jest tam prawie 2000 dokumentów. W polskim internecie masz ponad 6
mln stron. Teraz sobie wyobraź że w każdej sekundzie wchodzi 5 ludzi na
stronę wyszukiwarki i zadaje pytanie.
> - ile czasu potrzebował bym aby przeszukać wszystkie zasoby internetu z
> końcówką .pl w adresie?
Zależy od prędkości łącza - kilka dni do tygodnia. Problemem nie jest
zindeksowanie, problemem jest zwracanie wyników zapytań tak dużej bazy.
> Tylko nie mówcie mi ze mam wyszukiwarki. Wiem o tym.
Naprawdę masz wyszukiwarki :)
-- -=< all the best! >=- cofala_at_firma.hoga.pl FidoNet: 2:484/26.7
To archiwum zostało wygenerowane przez hypermail 2.1.7 : Tue 18 May 2004 - 21:19:48 MET DST