背景
监测指标历史数据可保存 180 天以上,并可自行设置各指标的告警阈值。
数据源包含内置数据源与自定义数据源,内置数据源是指系统内置各类对象常规监控项及其数据来源方式(如SNMP、SSH、Teln et、WMI 等数据采集方式);自定义数据源是指在内置监控项不满足监控需求时,用户可以通过SNMP、API、Script、IPMI 等方式自定义数据源,从而完成自定义相关监控项。将所有运维系统的数据整合之后,告警实现采用内置数据源、自定义数据源、数据模板来实现不同数据的告警通知。
2. 监控模板
监控模板模块允许用户创建、保存和应用监控配置的模板,以便快速配置和部署监控方案。模板包含预定义的监控指标、数据类型和数据源,并支持关联设置页面布局和实例对象,用户能够灵活地调整监控配置,以满足不同环境和需求。为用户提供了一个方便而灵活的方式来管理监控配置的模板,确保系统中的监控方案保持一致性和规范性。
用户可以在监控模板中定义各种监控项,这可能包括系统资源使用率、服务响应时间、错误率等。系统内置多种模型及其监控项,内置监控项通过自研Agent、SNMP、IPMI、WMI、SSH、脚本、第三方上传等多种方式进行采集监控数据。除了内置监控项外,用户还可以自身的监控需求进行自定义监控项。每个监控项在模板中都具有唯一的标识符和相关的配置参数,以确保在系统中被准确地识别和监控。
页面布局允许用户定义、配置和管理监控设备的详情指标数据展示页面,可选择内置的组件对指标进行关联,通过图表的形式组合成设备监控看板,方便用户直观的看到设备的运行状态和趋势。
告警规则模块允许用户定义、配置和管理监控中心的告警规则,包含多指标关联配置、告警收敛配置、指标汇聚函数配置、防抖策略配置、告警内容自定义、告警通知自定义。此外,目前系统文持阈值、波动率告警配置,未来会融入智能告警,根据智能算法推算指标未来趋势,系统自动判断告警是否产生。为用户提供了一个灵活而强大的工具,确保系统能够及时响应潜在的性能或状态异常。
4. 告警设置
告警设置模块允许用户灵活配置,可以定义告警屏蔽规则,以防止特定类型的告警对系统产生干扰,包括指定IP、实例指标、屏蔽类型以及屏蔽的时间段;可以配置通知屏蔽规则,屏蔽特定情境下的通知;可以基于告警的持续时间定义告警升级规则;可以定义各种告警级别,以便更好地区分不同程度的告警。
告警看板提供了一个集中查看和管理告警信息的平台,帮助用户实时监控系统的状态、快速响应告警事件。该模块包括告警列表、筛选、统计信息、实时监控和告警处理等功能。在告警看板上,用户可以查看实时的告警列表,显示每个告警的关键信息,如告警级别、告警类型、触发时间等,并对告警进行认领、忽略、建单处理,跟踪告警处理进度。帮助用户更全面地了解系统的告警状况。