監控cacti/nagios/zabbix (二)nagios

發布時間：2020-07-15 13:29:13 來源：網絡閱讀：2815 作者：welch1314 欄目：移動開發

1. Nagios安裝 - 服務端（192.168.0.7）
Centos6默認的yum源里沒有nagios相關的rpm包，但是我們可以安裝一個epel的擴展源：
yum install -y epel-release

然后安裝nagios相關的包
yum install -y httpd nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
設置登錄nagios后臺的用戶和密碼：htpasswd -c /etc/nagios/passwd nagiosadmin
vim /etc/nagios/nagios.cfg
nagios -v /etc/nagios/nagios.cfg 檢測配置文件
啟動服務：service httpd start; service nagios start
瀏覽器訪問： http://192.168.0.7/nagios

2. Nagios安裝 - 客戶端（192.168.0.6）
在客戶端機器上
yum install -y epel-release
yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe
vim /etc/nagios/nrpe.cfg  找到“allowed_hosts=127.0.0.1” 改為 “allowed_hosts=127.0.0.1,192.168.0.6” 后面的ip為服務端ip; 找到” dont_blame_nrpe=0” 改為  “dont_blame_nrpe=1”
啟動客戶端 /etc/init.d/nrpe start

3. 監控中心（192.168.0.7）添加被監控主機（192.168.0.6）
cd /etc/nagios/conf.d/
vim 192.168.0.7.cfg                //加入：
define host{
      use                   linux-server
      host_name          192.168.0.6
      alias                      0.6
      address                192.168.0.6
      }

define service{
      use                   generic-service
      host_name             192.168.0.6
      service_description    check_ping
      check_command          check_ping!100.0,20%!200.0,50%
      max_check_attempts 5
      normal_check_interval 1
}

define service{
      use                   generic-service
      host_name             192.168.0.6
      service_description    check_ssh
      check_command          check_ssh
      max_check_attempts    5 ##當nagios檢測到問題時，一共嘗試檢測5次都有問題才會告警，如果該數值為1，那么檢測到問題立即告警

      normal_check_interval 1 ##重新檢測的時間間隔，單位是分鐘，默認是3分鐘
      notification_interval          60 ##在服務出現異常后，故障一直沒有解決，nagios再次對使用者發出通知的時間。單位是分鐘。如果你認為，所有的事件只需要一次通知就夠了，可以把這里的選項設為0。
}

define service{
      use                   generic-service
      host_name             192.168.0.6
      service_description    check_http
      check_command          check_http
      max_check_attempts    5
      normal_check_interval 1
}

##以上服務不依賴于客戶端nrpe服務，我們可以想象，我們在自己電腦上可以使用ping或者telnet探測遠程任何一臺機器是否存活、是否開啟某個端口或服務。而當我們想要檢測客戶端上的某個具體服務的情況時，就需要借助于nrpe了，比如想知道客戶端機器的負責或磁盤使用情況。

4.  繼續添加服務
服務端vim /etc/nagios/objects/commands.cfg
增加：define command{
      command_name check_nrpe
      command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
      }
繼續編輯

vim /etc/nagios/conf.d/192.168.0.6.cfg
增加如下內容：define service{
      use    generic-service
      host_name    192.168.0.6
      service_description    check_load
      check_command          check_nrpe!check_load
      max_check_attempts 5
      normal_check_interval 1
}

define service{
      use    generic-service
      host_name    192.168.0.6
      service_description    check_disk_sda1
      check_command          check_nrpe!check_hda1
      max_check_attempts 5
      normal_check_interval 1
}

define service{
      use    generic-service
      host_name    192.168.0.6
      service_description    check_disk_sda3
      check_command          check_nrpe!check_hda2
      max_check_attempts 5
      normal_check_interval 1
}

說明：  check_nrpe!check_load ：這里的check_nrpe就是在commands.cfg剛剛定義的，check_load是遠程主機上的一個檢測腳本
在遠程主機上vim /etc/nagios/nrpe.cfg 搜索check_load，這行就是在服務端上要執行的腳本了，我們可以手動執行這個腳本
需要檢查磁盤名字，df-h ，如果是sda1 sda3,就把check_hda1更改一下：/dev/hda1 改為 /dev/sda1
再加一行command[check_hda2]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/sda3
客戶端上重啟一下nrpe服務: service nrpe restart
服務端也重啟一下nagios服務: service nagios restart

5. 配置告警
vim /etc/nagios/objects/contacts.cfg //增加：define contact{
      contact_name yunwei
      use                            generic-contact
      alias yunwei
      email huaweizhou@foxmail.com
      }

define contact{
      contact_name xiaoshou
      use                            generic-contact
      alias xiaoshou
      email noc@foxmail.com
      }

define contactgroup{
      contactgroup_name ops
      alias chinaops
      members yunwei,xiaoshou
      }

然后在要需要告警的服務里面加上contactgroup

define service{
      use    generic-service
      host_name    192.168.0.6
      service_description    check_load
      check_command          check_nrpe!check_load
      max_check_attempts 5
      normal_check_interval 1
      contact_groups ops
      notifications_enabled  1 ##是否開啟提醒功能。1為開啟，0為禁用。一般，這個選項會在主配置文件（nagios.cfg）中定義，效果相同。
      notification_period 24x7 ##發送提醒的時間段。非常重要的主機（服務）我定義為7×24，一般的主機（服務）就定義為上班時間。如果不在定義的時間段內，無論什么問題發生，都不會發送提醒。注意x是小寫
      notification_options:w,u,c,r ##這個是service的狀態。w為waning， u為unknown, c為critical, r為recover(恢復了），類似的還有一個  host對應的狀態：d,u,r d = 狀態為DOWN, u = 狀態為UNREACHABLE , r = 狀態恢復為OK，需要加入到host的定義配置里。
}

參考：
調用短信接口 http://www.aminglinux.com/bbs/thread-7380-1-1.html
整合微信  http://www.aminglinux.com/bbs/thread-7917-1-1.html

向AI問一下細節

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

監控cacti/nagios/zabbix (二)nagios

猜你喜歡

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

監控cacti/nagios/zabbix (二)nagios

猜你喜歡

最新資訊

相關推薦

相關標簽