Re: Monitoring hardwaru w serwerach IBM

Autor: Konrad Kosmowski <konrad_at_kosmosik.net>
Data: Sat 19 Jun 2010 - 01:00:06 MET DST
Message-ID: <mcate7-38a.ln1@kosmosik.net>
Content-Type: text/plain; charset=ISO-8859-2

** Unknown User <temporary_user@o2.niespamuj.pl> wrote:

> Szukam _darmowego_ sposobu na monitoring hardwaru w serwerach IBM z
> systemem Windows Serwer.

Zabbix - serwer jest na Linuksie (zalecana platforma) na monitorowanych
serwerach jest agent dla Windows. Agent pozwala na wywoływanie poleceń powłoki,
które to zwracają wskaźniki, agent przekazuje wskaźnik do serwera, serwer
Zabbix zapisuje wskaźniki i na ich podstawie możesz sobie zdefiniować
wyzwalacze (np. zbyt wysoka temperatura) i akcje do nich (np. wyślij SMS do
administratora). W ogóle cały silnik jest dosyć rozbudowany - można działać w
oparciu o zależności, eskalować, badać trendy itd.

Dalej pozostaje kwestia każdego z serwerów i co chcesz na nim monitorować. IBM
z reguły dostarcza dosyć obskórne narzędzia CLI dla Windows, więc jest to
możliwe, dalej to kwestia przesiedzianych nad skryptologią godzin - no well
chciałeś _za_darmo_, więc jak rozumiem jesteś na to gotowy. 30 serwerów to
skończona liczba, więc i ilość skryptów do napisania (do odpalania przez agenta
Zabbix) jest skończona. :)

(...)

> Z jakiegoś powodu wzrosła temperatura kilku serwerów.

Kwestia inteligentnej korelacji danych - jak rozumiem (bo Cię to dziwi) wzrosła
temperatura niektórych podczas gdy inne np. w tej samej szafie są w normie? Czy
może w ogóle wzrosła temperatura w serwerowni? Masz czujnik do tego? Warto.

> Zapaliły się kontrolki. IBM SD nie pokazuje z czym jest problem. Potrzebuję
> zbierać dane o temperaturze, obrotach wiatraków, napięciach i co się jeszcze
> da. W przypadku linuxa wystarczy lm_sensors i skrypty, a w przypadku
> windowsa nie mam do pojęcia...

W przypadku Windows podobnie tylko trudniej skryptować.

> Chcę doprowadzić do sytuacji w której zanim pojadę do serwerowni, będę
> wiedział co wziąć na podmianę i czy mam daną część na stanie czy muszę od
> razu zgłaszać usterkę i czekać na części z IBM.

A to zupełnie inny temat - chodzi Ci po prostu o wyciąganie informacji jaki
podzespół prawdopodobnie padł na podstawie danych z monitoringu? No to musisz
stworzyć słownik korelacji np. jeżeli mamy złe napięcia to potencjalnie
zasilacz itd. - to wszystko *można* zrobić ręcznie, ale to jest kupa roboty -
dlatego właśnie IBM bierze pieniądze za swoje narzędzia do tego (ale szczerze
przyznam, że widziałem to zaimplementowane w kilku miejscach i nigdzie to nie
dzialało).

-- 
    +                                 '                      .-.     .
                               ,                         *    ) )
  http://kosmosik.net/                     .           .     '-'  . kK
Received on Sat Jun 19 01:15:03 2010

To archiwum zostało wygenerowane przez hypermail 2.1.8 : Sat 19 Jun 2010 - 01:51:03 MET DST