某科技公司智能監(jiān)控
項目需求:
成都某科技有限公司的軟硬件設備種類繁多,設備數(shù)量較大,發(fā)生故障時,會產(chǎn)生海量告警信息,增加運維人員工作量,且無法快速定位故障原因。綜上該公司需要搭建自動化運維高可用平臺解決上述問題。
解決方案:
根據(jù)項目需求安裝、配置和聯(lián)調(diào)上??v立正式生產(chǎn)區(qū)和開發(fā)測試區(qū)共計兩套的Zabbix高可用監(jiān)控平臺,主要組建包括Zabbix、MairaDB、Agent、Check,完成監(jiān)控平臺在上海縱立所有節(jié)點的網(wǎng)絡拓撲圖。安裝并配置OS層級的采集程序,充分協(xié)調(diào)及溝通技術難點及可行性,進行數(shù)據(jù)采集定制,數(shù)據(jù)采集后,在Zabbix界面中對所需監(jiān)控的設備和指標項、告警等進行配置工作,并在Zabbix中對基礎指標進行展示,進行監(jiān)控模板定制化開發(fā),對服務器、網(wǎng)絡設備及存儲設備添加,完成設備信息錄入,關聯(lián)模板及測試模板獲取數(shù)據(jù)是否正常,完善設備信息?;赯abbix標準功能,對流量、丟包率、狀態(tài)、響應時間等實施網(wǎng)絡鏈路監(jiān)控,針對網(wǎng)絡設備配置變更告警、備份功能,部署監(jiān)控告警(聲音、短信、郵件、微信),與縱立系統(tǒng)對接,完成整個平臺的部署。后期對管理員進行培訓。
|
項目管理對象
|
|
服務器:HP、DELL、IBM、Lenovo
存儲:HP、IBM、Horeb、
交易中間件:Tibco RV、Tomcat
數(shù)據(jù)庫:Oracle
網(wǎng)絡:IBM、HP、HW、Fortinet、Sangfor、SG1200
虛擬機:Redhat、WindowsWin Server 2012、 WindowsWin-7、Suse
攝像頭:HoneyWell
|
實現(xiàn)效果:
1、
服務器及進程管理:通過對通用服務器的監(jiān)控管理(主要為windows、Linux、HP-UNIX、HANA一體機等系統(tǒng)監(jiān)控),自動發(fā)現(xiàn)網(wǎng)絡中服務器設備的信息,實時采集服務器的狀態(tài)和性能等信息,實時采集服務器中當前運行的進程信息。
2、
網(wǎng)絡設備管理:通用網(wǎng)絡設備的監(jiān)控管理,主要是交換機、防火墻、負載均衡、路由器等設備監(jiān)控,自動發(fā)現(xiàn)網(wǎng)絡中的設備,采集設備相關信息(基本信息,接口信息,連接狀態(tài)等),可動態(tài)展示實時網(wǎng)絡負載、流量分布、運行時間等。
3、
中間件管理:實時采集并顯示中間件的服務狀態(tài)、會話狀態(tài)、消息隊列狀態(tài)。
4、存儲設備管理:通用存儲設備的監(jiān)控管理,主要是設備的硬件狀態(tài),邏輯狀態(tài)及日志的管理。
5、數(shù)據(jù)庫管理:實時監(jiān)聽和分析數(shù)據(jù)庫的連通狀態(tài)、性能狀態(tài)、表空間狀態(tài)、鎖狀態(tài)等,可分析sql語句的執(zhí)行性能和執(zhí)行結果。
6、虛擬化管理:實時采集虛擬化系統(tǒng)的性能、可用性、配置等信息。直觀展示虛擬化系統(tǒng)的狀態(tài)以及虛機的可用性。
7、監(jiān)控系統(tǒng)管理:實時采集監(jiān)控平臺數(shù)據(jù),可實時查看監(jiān)控畫面,實時報警提醒。
截圖展示:
樹形圖展示