1.故障
图像断点,数据采集不到,agent-listen端CPU占用过高,报警zabbix-agent 15钟未采集到数据
2.原因
机器运行nginx tcp链接数过多,zabbix监控端口监控调用了系统自带net.tcp.listen健,经查此键调用了netstat 命令。当tcp连接数很高时。此命令耗时过高CPU占用大导致
3.解决方案
a.新增Template Tcp Port Auto Discovery SS 模板配置 里面的项目原型新建自定义键值net.tcp.listen.ss[{#TCP_PORT}] 替换 原先的net.tcp.listen[{#TCP_PORT}]
b.在zabbix_agent.conf 配置文件新增UserParameter=net.tcp.listen.ss[*],ss -ln|grep $1|wc -l
c.相关主机取消并清理Template Tcp Port Auto Discovery模板,新增Template Tcp Port Auto Discovery SS 模板。