

Zabbix一手應(yīng)用問答
Q1 Zabbix支持集成scom,splunk等其他的監(jiān)控系統(tǒng)的告警和性能數(shù)據(jù)嗎?
A1 Zabbix支持通過API或者數(shù)據(jù)庫ETL集成其他系統(tǒng)或者平臺(tái)。除此之外,當(dāng)SCOM、SPLUNK等數(shù)據(jù)收集上來時(shí),也可以通過調(diào)用Zabbix_sender的方式集成到zabbix中。
Q2 跟BMC相比的話 ,除了價(jià)格,Zabbix有一些什么其它的優(yōu)勢(shì)呢?
A2 Zabbix有很多優(yōu)勢(shì),如可擴(kuò)展,接口豐富,易于同其他平臺(tái)集成。支持各種平臺(tái)的Agent使其在深度和廣度上超越了大多數(shù)的監(jiān)控工具。
Q3 支持基于動(dòng)態(tài)基線的閾值告警嗎?
A3 不支持,但在最新的版本中支持預(yù)測(cè)。
Q4 一臺(tái)機(jī)器上有多個(gè)進(jìn)程或者多個(gè)端口等監(jiān)控也是通過LLD去實(shí)現(xiàn)嗎?
A4 可以自定義發(fā)現(xiàn)原型來實(shí)現(xiàn)LLD。
Q5 如果長時(shí)間沒采集到值,是否可以告警通知出來?
A5 可以,Zabbix支持nodata報(bào)警,即當(dāng)沒收到值的時(shí)候,將報(bào)警發(fā)出。
Q6 Zabbix可以實(shí)現(xiàn)apm的監(jiān)控嗎?
A6 根據(jù)需求可以部分或者全部實(shí)現(xiàn),Zabbix支持原生的JMX監(jiān)控。
Q7 agent端和server端需要開通哪些端口?
A7 Zabbix本身只需要開通10050,10051端口(主動(dòng)、被動(dòng)監(jiān)控)。如需要監(jiān)控Agent端其他服務(wù)(如80,443等),則需要額外開通。
Q8 我們遇到一個(gè)問題,通過ZabbixAPI創(chuàng)建監(jiān)控項(xiàng),然后通過pyzabbixSender推送數(shù)值到Zabbix,但是不能即可成功,這是什么原因呢,必須要等到一段時(shí)候后才能成功。
A8 Zabbix Server和Proxy同步時(shí)定期的,在早期版本默認(rèn)時(shí)3600s,需要修改conf文件以加快同步周期。
Q9 我們的系統(tǒng)內(nèi)部的主機(jī)也高達(dá)1.1w,但是我們遇到了很多隊(duì)列積壓的問題,修改了很多Cache的大小,還是效果不佳。
A9 是否需要修改cache大小取決于Zabbix
internal check中的busy或者free的百分比,與queue沒有直接關(guān)系。queue的堆積可能是網(wǎng)絡(luò)延遲、agent端的響應(yīng)緩慢造成的,需要具體分析。
Q10 Zabbix的自動(dòng)發(fā)現(xiàn)是基于安裝客戶端的主機(jī)么?
A10 Zabbix的自動(dòng)發(fā)現(xiàn)功能可以基于客戶端,也可以基于協(xié)議(如http,ftp),按指定的規(guī)則將符合規(guī)則的主機(jī)加入監(jiān)控。
Q11 Zabbix加載更多的面板會(huì)影響性能嗎?
A11 加載更多的面板會(huì)導(dǎo)致Zabbix數(shù)據(jù)庫的讀壓力增加。如果可以進(jìn)行合理調(diào)優(yōu),那么影響不大。
Q12 現(xiàn)在推薦哪個(gè)版本呢?
A12 最新的版本是3.4,如果是開源使用建議使用這個(gè)版本。如果需要商業(yè)支持,可以考慮3.0LTS,以獲得更多的商業(yè)支持生命周期。
Q13 什么樣的規(guī)則(通過什么方式)可以區(qū)分自動(dòng)發(fā)現(xiàn)的機(jī)器是windows還是linux的主機(jī)?
A13 首先網(wǎng)絡(luò)發(fā)現(xiàn)的網(wǎng)段的操作系統(tǒng)需要安裝Zabbix
Agent,可以通過網(wǎng)絡(luò)發(fā)現(xiàn),并配置獲得的key為system.uname。Windows系統(tǒng),key的返回會(huì)包含Windows這個(gè)字符串;同樣的linux系統(tǒng)也會(huì)包含“Linux”這個(gè)字符串。根據(jù)返回值配置后面的動(dòng)作(加組、套用模版等)。
Q14 一般多少數(shù)量的主機(jī)才需要用到proxy?
A14 這個(gè)問題沒有固定的答案,看具體的業(yè)務(wù)場(chǎng)景和需求。建議安裝網(wǎng)絡(luò)區(qū)域部署Proxy以減少防火墻需要打通的端口。
Q15 主機(jī)性能,每秒刷新值達(dá)到100這個(gè)值是不是很大了?
A15 可以說非常小了,官方的最大部署中,nvps可以達(dá)到幾十萬。
Q16 自動(dòng)化發(fā)現(xiàn)后,可以修改監(jiān)控項(xiàng)么?
A16 可以修改,如果修改原型的監(jiān)控項(xiàng),會(huì)更改所有關(guān)聯(lián)該模版的主機(jī)。如有個(gè)性化需求,可以在單個(gè)host上單獨(dú)添加。
Q17 帶外怎么自動(dòng)監(jiān)控ipmi
A17 可以通過Share上的模版,結(jié)合網(wǎng)絡(luò)發(fā)現(xiàn)功能,自動(dòng)為帶外網(wǎng)絡(luò)發(fā)現(xiàn)到的Host關(guān)聯(lián)并添加監(jiān)控。
Q18 我們現(xiàn)在使用Zabbix監(jiān)控,服務(wù)器數(shù)量1000不到,但是查看監(jiān)控圖形時(shí),圖形會(huì)出現(xiàn)斷裂,如何解決呢?
A18 出現(xiàn)斷裂可能是數(shù)據(jù)庫沒有數(shù)據(jù),或者Agent端根本沒有收集到數(shù)據(jù)。前者可以通過數(shù)據(jù)庫調(diào)優(yōu)解決,后者可以在Agent本機(jī)觀察負(fù)載情況,以定位問題。
Q19 自動(dòng)發(fā)現(xiàn)里面怎么修改模板來排除特定的名字的監(jiān)控項(xiàng),只留下同類型的需要的監(jiān)控項(xiàng),因?yàn)槲以诓糠志W(wǎng)絡(luò)設(shè)備上的發(fā)現(xiàn)會(huì)出現(xiàn)很多虛的用戶接口也被抓進(jìn)監(jiān)控項(xiàng),數(shù)量很大,怎么排除。
A19 可通過常規(guī)中的正則表達(dá)式功能,為自動(dòng)發(fā)現(xiàn)排除不需要的Item。
Q20 Appliance版本? VMware Workstation Pro可以用嗎?
A20 可以,下載vmdk文件,并掛載到VM中就可以使用。
Q21 最近經(jīng)常出現(xiàn)Zabbix server無法獲取proxy數(shù)據(jù)的情況,每次都需要禁用部分proxy,然后重啟Zabbix server,再逐一將proxy分別啟用才能恢復(fù)。請(qǐng)問這個(gè)是配置參數(shù)原因?qū)е碌模€是Zabbix的bug。
A21 Server和Proxy同步有周期,早起版本3600s,在conf文件中修改配置以縮短同步時(shí)間。