自动化监控对域名权威体系算法波动的搜索行为预测

案例| 平安银行自动化监控平台的实践

平安银行自动化监控平台的实践随着银行业务的快速发展,IT基础设施的数量和复杂性不断增加,对自动化运维监控和管理的需求也日益增强。平安银行广州分行在面对商业产品功能局限性以及科技运营监控成本控制的需求下,选择了基于Zabbix开源监控系统,并通过二次开发的方式,构建了分行环境下的自动化运维监控平台。该平台有效整合了各类IT基础设备的监控,提供了事件预警及集中式的展示,实现了自主运维、自主可控的目的。一、项目背景平安银行广州分行随着业务的快速发展,IT基础设施(包括大量的服务器、网络设备、哑终端等)数量急剧增加,而商业监控产品的功能不足,加之分行科技运营成本有限、运维人员数量较少,导致分行科技日常运维难度日益增大。为了在有限的科技运营成本下提高运维效率,平安银行广州分行决定基于开源的Zabbix监控系统,并配合二次开发,建立分行自动化监控平台。二、项目实践(一)Zabbix系统简述Zabbix是一个基于Web界面的分布式开源企业级自动化运维解决方案,能够监控各种网络设备、存储设备、数据库、中间件以及服务器系统应用的运行参数,并提供灵活的报警机制,使系统管理员能快速定位故障设备。其特点包括主动式监控、支持微信、短信、电话、邮件等多维化报警功能、支持多种系统的异构平台、支持IP协议的设备均可监控、软件开源可按需开发以及支持脚本运行实现自动化运维等。(二)平台架构设计方案Zabbix系统主要由Zabbix Server、数据库、Web界面、Zabbix Proxy和Zabbix Agent五个功能组件组成,可以运行在多种操作系统平台上。平安银行广州分行应用Zabbix系统搭建的监控平台主要用于监控服务器、虚拟机、网络设备以及各类哑终端。整个监控平台架构分为监控采集端、监控服务端和用户端三个部分。监控采集端通过Zabbix Agent和SNMP协议等对IT基础设备的性能和可用性进行监控和数据收集,并将收集的数据发送给Zabbix Server。监控服务端包括Zabbix Server组件和数据库两部分,负责处理数据、生成告警事件并通过不同的媒介向系统用户发出故障通知。用户端主要有Web应用和大屏展示,供用户进行日常监控数据的查询和监控设备配置。(三)监控功能实施方案应用服务器、虚拟机设备:在被监控目标上部署Zabbix Agents,使用Zabbix系统提供的监控模板对CPU占用率、磁盘空间占用率、内存占用率、在线率等可用性指标进行监控,同时也对重要进程进行存活状态监控。网络设备监控:针对交换机、路由器等支持SNMP协议的网络设备,利用网络设备的OID值设置“SNMP监控项”捕获运行指标。另外,通过Php脚本二次开发采集的数据,计算上联总行交换机的带宽占用率等信息。哑终端监控:通过部署Zabbix的通用“ICMP Ping”监控模板,对重要的哑终端设备在线率可用性进行监控,并实现分组向终端设备的负责人发出警告。对接LDAP实现用户统一登录:基于平安银行通过AD域来批量管理用户,同时考虑网络安全防护体系要求,通过配置Zabbix用户登录认证,对接总行AD域服务器,实现只有域控中的用户才能登录Zabbix。监控告警:通过配置告警媒介,启用邮件告警类型,并根据告警类型创建触发器,设置相对应的事件响应接收人。同时,通过Python二次开发捕获告警数据,实现企业微信进行微信短信息告警。(四)项目成效通过本项目的实施,平安银行广州分行实现了以低成本、自主可控的形式对分行众多IT基础设备进行监控,解决了日益增多的基础设备带来的维护问题,大大提高了日常运维效率。同时,通过二次开发实现了微信告警以及上联总行交换机的带宽占用率监控,并自动定时上报银监动态监控系统,提供了自主可控的监控、上报手段。此外,置于统一的信息监控之下,标准化的操作大大降低了安全监控的难度,运维人员可以通过设置不同的终端控制策略控制用户对USB等设备的访问,实现数据隔离,最大程度地保障数据安全。三、结束语Zabbix的应用不仅限于上述的监控功能,还包括操作系统日志监控、数据库监控、中间件监控、Web应用监控、机房环境监控等。未来,平安银行广州分行将继续开发Zabbix的更多应用场景,并整合各类运维事件,提供低成本、高效益的智能化统一监控运维平台。通过不断优化和完善监控平台的功能和性能,平安银行广州分行将进一步提升运维效率和服务质量,为业务的快速发展提供有力的技术支持和保障。


nginx