Pomoc MON dotycząca definicji usług To drugi i ostatni etap konfiguracji MON.
Wartości domyślne są wyświetlane dla usług obowiązkowych . Więcej informacji na temat definicji usług znajduje się w odpowiednim temacie pomocy poniżej. W przypadku „mail.alert” upewnij się, że sendmail jest skonfigurowany i że deamon „sendmail” jest uruchomiony na maszynie hosta.
Definicje usług
- nazwa usługi
- Definicja usługi zaczyna się od słowa kluczowego service, po którym następuje słowo będące znacznikiem tej usługi.
Składnikami usługi są interwał, monitor oraz jedna lub więcej definicji przedziałów czasowych, jak zdefiniowano poniżej.
Jeśli nazwa usługi „default” jest zdefiniowana w grupie obserwacyjnej o nazwie „dafault” (patrz wyżej), wówczas do obsługi nieznanych pułapek mon zostanie użyta definicja default / default.
- interwał czasowy
- Interwał słowa kluczowego, po którym następuje wartość czasu, określa częstotliwość uruchamiania skryptu monitorowania. Wartości czasu są zdefiniowane jako „30s”, „5m”, „1h” lub „1d”, co oznacza 30 sekund, 5 minut, 1 godzinę lub 1 dzień. Część liczbowa może być ułamkiem, takim jak „1,5 godziny” lub półtorej godziny. Ten format specyfikacji czasu będzie określany jako czasowy .
- traptimeout timeval
- Ten parametr bierze jednocześnie specyfikacji argument jako przedział, i sprawia, że obsługa spodziewać się pułapki z zewnętrznego źródła przynajmniej tak często, jeszcze awaria zostanie zarejestrowany. Jest to używane w przypadku usługi w stylu pulsu.
- trapduration timeval
- Jeśli zostanie odebrana pułapka, status usługi, do której została dostarczona pułapka, zwykle pozostaje stały. Jeśli trapduration jest określony status usługi pozostaną w stanie awarii na czas określony przez timeval, a następnie będzie zresetowane do „sukcesu”.
- randskew timeval
- Zamiast zaplanować uruchamianie skryptu monitorowania na początku każdego interwału, losowo dostosuj interwał określony parametrem interwału za pomocą randskew plus-lub-minus . Wartość pochylenia jest określona jako parametr interwału : „30s”, „5m” itp. Na przykład, jeśli interwał wynosi 1 m, a randskew wynosi „5s”, wówczas mon zaplanuje skrypt monitorowania co jakiś czas między 55 sekundami a 65 sekund. Ma to na celu pomóc w rozłożeniu obciążenia na serwer, gdy wiele usług jest zaplanowanych w tych samych odstępach czasu.
- monitor nazwa-monitora [arg ...]
- Słowo kluczowe monitor, po którym następuje nazwa skryptu i argumenty określają, że monitor ma działać po upływie czasu. Podczas określania argumentów wysyłanych do skryptu monitorowania przestrzegane są podobne do powłoki konwencje cytowania. Skrypt jest wywoływany z katalogu podanego z argumentem -s , a wszystkie poniższe słowa są dostarczane jako argumenty do programu monitorującego, a następnie lista hostów w grupie, do której odnosi się bieżąca grupa obserwacyjna. Jeśli linia monitora kończy się na „;;” jako osobne słowo grupy hostów nie są dołączane do listy argumentów podczas wywoływania programu.
- allow_empty_group
- Opcja allow_empty_group pozwoli na wywołanie monitora, nawet gdy grupa hostów dla tego zegarka jest pusta z powodu wyłączonych hostów. Domyślnym zachowaniem nie jest wywoływanie monitora, gdy wszystkie hosty w grupie hostów zostały wyłączone.
- opis opistekst
- Tekst poniższy opis jest pytani przez programy klienckie, przekazanych do ostrzeżeń i monitorów poprzez zmienną środowiskową. Powinien zawierać krótki opis usługi, odpowiedni do zamieszczenia w wiadomości e-mail lub na stronie internetowej.
- exclude_hosts host [host ...]
- Wszelkie hosty wymienione po exclude_hosts zostaną wykluczone z kontroli usługi.
- exclude_period periodspec
- Nie uruchamiaj zaplanowanego monitora w czasie określonym przez okres .
- zależy zależne wyrażenie
- Słowo kluczowe depend służy do określania wyrażenia zależności, które ma wartość prawda lub fałsz, w sensie logicznym. Zależności są rzeczywistymi wyrażeniami Perla i muszą być zgodne ze wszystkimi regułami składniowymi. Wyrażenia są oceniane we własnej przestrzeni pakietów, aby przypadkowo nie wywołać niepożądanych skutków ubocznych. Jeśli podczas oceny wyrażenia zostanie znaleziony błąd składniowy, jest on rejestrowany przez syslog.
Przed oceną występują następujące podstawienia wyrażenia: frazy, które wyglądają jak „grupa: usługa” są zastępowane wartością bieżącego statusu operacyjnego tej określonej usługi. Te podstawienia opstatus są obliczane rekurencyjnie, więc jeśli usługa A zależy od usługi B, a usługa B zależy od usługi C, to usługa A zależy od usługi C, a pomyślne statusy operacyjne (które mają wartość „1”) to „STAT_OK”, „STAT_COLDSTART ”,„ STAT_WARMSTART ”i„ STAT_UNKNOWN ”. Słowo „SELF” (wielkimi literami) może być użyte dla grupy (np. „SELF: service”) i jest skrótem dla bieżącej grupy obserwacyjnej.
Ta funkcja może być używana do kontrolowania alertów dla usług zależnych od innych usług, np. Testu SMTP, który zależy od tego, czy komputer jest osiągalny przez ping.
- dep_behavior {a | m}
- Ocena wykresów zależności może kontrolować tłumienie wywołań alertów lub monitorowania.
Eliminacja alertów . Jeśli ta opcja jest ustawiona na „a”, wyrażenie zależności zostanie ocenione po wyjściu monitora z usługi lub odebraniu pułapki. Alert zostanie wysłany tylko wtedy, gdy ocena się powiedzie, co oznacza, że żaden z węzłów na wykresie zależności nie wskazuje niepowodzenia.
Monitoruj tłumienie . Jeśli jest ustawiona na „m”, wyrażenie zależności zostanie ewaluowane przed uruchomieniem monitora usługi. Jeśli ewaluacja się powiedzie, monitor zostanie uruchomiony. W przeciwnym razie monitor nie zostanie uruchomiony, a status usługi pozostanie taki sam.
Definicje okresu
Okresy służą do określania warunków, które powinny umożliwić wysyłanie ostrzeżeń.
- okres [etykieta:] okresspec
- Okres grupuje jeden lub więcej alarmów i zmiennych, które kontrolują, jak często zdarza się alert w przypadku awarii. Słowo kluczowe okresu ma dwie formy. Pierwszy bierze argument, który jest specyfikacją okresu z modułu Patrick Ryan's Time :: Period Perl 5. Aby uzyskać więcej informacji, patrz „czas perldoc :: okres”.
Drugi formularz wymaga etykiety, a następnie specyfikacji okresu, jak zdefiniowano powyżej. Etykieta to etykieta składająca się ze znaku alfabetu lub znaku podkreślenia, po którym następuje zero lub więcej znaków alfanumerycznych lub znaków podkreślenia i kończy się dwukropkiem. Ten formularz pozwala na wiele okresów z tą samą definicją okresu. Jednym z zastosowań jest zdefiniowanie okresu, który nie ma żadnych parametrów alarmowych lub alarmowych dla określonego okresu, a drugi dla tego samego okresu z innym zestawem alertów, który zawiera te parametry.
- alertevery timeval
- Słowo kluczowe alertevery (w ramach definicji okresu ) przyjmuje ten sam typ argumentu, co zmienna interwałowa , i ogranicza liczbę wysyłanych alertów, gdy usługa nadal nie działa. Na przykład, jeśli interwał wynosi „1h”, to tylko alarmy w sekcji okresu będą uruchamiane tylko raz na godzinę. Jeśli słowo kluczowe alert zostanie pominięte we wpisie okresu, alert zostanie wysłany za każdym razem, gdy zostanie wykryta awaria. Domyślnie, jeśli wynik dwóch kolejnych awarii ulegnie zmianie, wówczas odstęp czasu alertu zostanie zastąpiony. Jeśli słowo „podsumowanie” jest ostatnim argumentem, to przy porównywaniu wyników kolejnych awarii brane będą pod uwagę tylko podsumowujące linie wyjściowe.
- alertafter num
- alertafter num timeval
- Słowo kluczowe alertafter (w sekcji okres) ma dwie formy: tylko z „num” argumentu, albo z „num timeval” argumentów. W pierwszej formie alert będzie wywoływany tylko po „num” kolejnych awarii.
W drugiej postaci argumenty są dodatnimi liczbami całkowitymi, po których następuje interwał, jak opisano powyżej w zmiennej interwałowej . Jeśli te parametry są określone, alerty dla tego okresu będą wywoływane dopiero po tym, jak wiele awarii wystąpi w tym okresie. Na przykład, jeśli alertafter otrzyma argument „3 30 m”, wówczas alarm zostanie wywołany, jeśli 3 awarie wystąpią w ciągu 30 minut.
- numalerts num
Ta zmienna informuje serwer, aby w przypadku awarii wywoływał nie więcej niż num alertów. Licznik alertów jest przechowywany dla poszczególnych okresów i jest resetowany po każdym sukcesie.
- comp_alerts
Jeśli ta opcja jest podana, wówczas podwyższenia będą wywoływane tylko wtedy, gdy zostanie wywołany odpowiedni alert „przestoju”.
- alert alert [arg ...]
- Okres może zawierać wiele alertów, które są uruchamiane w przypadku awarii usługi. Alert jest określany za pomocą słowa kluczowego alert , po nim opcjonalny parmeter wyjścia i argumenty interpretowane tak samo jak definicja monitora , ale bez „;;” wyjątek. Parametr wyjścia ma postać exit = x lub exit = xy i powoduje, że alert jest wywoływany tylko wtedy, gdy status wyjścia skryptu monitorowania mieści się w zakresie parametru exit . Jeśli, na przykład, linia alertu to alert exit = 10-20 mail. Alert mis, wówczas mail-alert zostanie wywołany z argumentem mis jako argumentami, jeśli wartość wyjścia programu monitorującego wynosi od 10 do 20. Ta funkcja umożliwia wyzwolenie różne alerty o różnych poziomach ważności (np. gdy wolne miejsce na dysku zwiększa się z 8% do 3%).
Zobacz sekcję PROGRAMY ALERTOWE powyżej, aby wyświetlić listę osób, które mon przekażą automatycznie programy alarmowe.
- upalert alert [arg ...]
- Upalert jest uzupełnieniem ostrzeżenia . Upalert jest wywoływany, gdy usługa przechodzi stan od niepowodzenia do sukcesu. Skrypt upalert nazywa się podając te same parametry, co skrypt alertu , z dodatkiem parametru -u , który służy po prostu do poinformowania skryptu alertu, że jest wywoływany jako upalert. Dla każdej definicji okresu można określić wiele podwyższeń. Należy pamiętać, że domyślnym zachowaniem jest wysyłanie aktualizacji w górę, niezależnie od tego, czy wysłano jakiekolwiek wcześniejsze ostrzeżenia „w dół”, ponieważ zmiany w górę są wywoływane przy zmianie stanu. Ustaw opcję comp_alerts na okres, aby sparować upalerty z alertami „down”.
- alert startalert [arg ...]
- Startalert jest wywoływany tylko wtedy, gdy serwer mon rozpoczyna wykonywanie.
- upalertafter timeval
- Parametr upalertafter jest określony jako ciąg znaków zgodny ze składnią parametru interwału („30s”, „1m” itp.) I kontroluje wyzwalanie upalertu . Jeśli usługa wraca do poprzedniego stanu po tym, jak nie działa przez czas dłuższy lub równy wartości tej opcji, wywoływany jest upalert . Użyj tej opcji, aby zapobiec wywoływaniu upalertów z powodu „blipów” (krótkich przerw).