智象智能运维系统在新能源行业的应用
背景
随着信息时代的持续发展以及企业IT不断建设,IT运维已经成为IT服务管理中重要的组成部分。面对越来越多复杂的业务、多样化的用户需求,不断扩展的IT应用需要越来越合理的模式来保障IT服务能灵活便捷、安全稳定地持续保障,面对复杂的数据中心,单靠人工已无法满足在技术、业务、管理等方面的需求,如何实现标准化、自动化、架构优化、过程优化等IT运维服务成为重要的研究课题。
建设目标
Ø 集中化管理
能解决新能源行业跨网闸问题,通过CMDB集中纳管全网30+数据中心、300+新能源场站、10w+资源的配置管理,并建立资源管理的标准规范,实现实时掌握最新资源数据。
Ø 精益化监控
通过监控预警、运行分析、安全分析等,实现各资源运行的精益化管理,提升监控预警准确性,故障快速定位,运维安全化。
Ø 自动化运维
结合标准化资源、流程化服务,通过自动化工具实现巡检自动化、合规自动化、部署自动化、配置自动化、监控分析自动化、资源分配自动化。
Ø 可视化呈现
采用数字孪生技术,完成运维数据的可视化,使管理人员能够清楚自身所掌握的资源,对外部的用户也实现了透明服务,更有效地对业务部门进行运维支撑。
Ø 标准化运维流程
以流程为导向、以业务为中心,通过服务级别协议(SLA)来保证IT 服务的质量,融合了请求、事件、发布、变更、问题、排班等许多流程的管理和实践,改变原有纸质单据签字或邮件审批模式,有效提高运维的质量、规范并降低成本。
解决方案
1、 部署架构
电力系统信息基础架构的分区结构原则上可划分为生产控制大区(控制Ⅰ区、非控制Ⅱ区)和关系信息大区(生产管理Ⅲ区、办公管理系统Ⅳ区),大区之间使用专用隔离装置进行物理隔离,小区之间使用防火墙进行安全隔离。通过对不同区域的独立安全保护,使得电力系统的安全性大大提高。
基于此网络架构,本次建设方案中系统部署架构如下:
考虑安全性,在跨安全区域传输数据时,采用数据转换服务进行数据转换,将实施数据转为异步数据通过网闸进行传输,以满足电力行业对安全性的要求。
2、 功能架构
构建公司“1+5+N”IT运营保障体系:1套管理平台统一纳管关键业务流程、应用系统、基础软硬件、运维服务,建立可观测、可量化的预防、感知、定位、恢复、改进5大保障能力,基于数据获取和自动化能力持续构建N个保障场景。
Ø 1套管理平台:实现采集、监视、控制、告警、自动化一体管理平台。
Ø 5大保障能力:从生产型模式走向运营型模式,从建设升级走向迭代演进,帮助运维团队以数字化的方式构建运营核心竞争能力。
Ø N个业务场景:基于灵活监控基座,跟随业务变化动态调整,覆盖各类业务。
3、资源台账管理
一、解决方案:
1. 打造台账管理数据库为整个运维平台的支撑系统,将所有IT资源进行统一管理,强化数据共享能力。
2. 台账系统具备强大的扩展性、灵活性,可根据用户未来的需求进行功能扩展;同时可灵活配置台账系统中的各项内容,如自定义配置项及属性、关系、展示页面等。
3. 台账系统具备自动化功能,支持自动发现网元、自动采集配置信息、自动生成拓扑、自动关联虚拟机与宿主机间的关系等。
4. 台账系统可对传统IDC资源与云平台资源进行统一的管理。
5. 台账系统可对资源数据变更进行审核,确保数据的准确性与唯一性,同时具备安全审计管理,可对台账中的任意操作进行安全审计。
二、实现效果:
通过智能运维管理系统的资源管理模块实现自定义资产模型、自定义属性、以及支持设备资源的自动采集、补齐、校验等操作,确保数据的准确性。统计人员预统计数据时,可通过模型中设置的单个或多个属性进行组合查询,可对查询出的数据可查看具体信息及导出操作。
4、监控告警管理
一、解决方案:
监控架构拆分为四层价格:数据源、数据采集、应用功能、展示;
数据源:主要用于存储台账对象对应的数据源,包括数据获取方式、协议、执行代码等;
数据采集:用于存储台账对象与采集模型的匹配关系,包括关系、采集周期、保存时间、数据计算、数据展示等各项功能;
应用功能:该层级主要用于对台账对象的数据展示,页面配置等;
展示层:用于集中展示,如大屏、3D等;
二、 实现效果:
5、 IT运营流程管理
一、解决方案:
1. 可快速实现自助服务台、事件管理、问题管理、变更管理、发布管理、配置管理、SLA管理等ITIL核心流程;
2. 系统提供图形化工作流程制作工具,用户可根据需求灵活自定义和调整流程,无需二次开发;
3. 可帮助企业明确各运维管理流程的角色和职责,梳理业务过程,保证运维管理流程的快速交付;
4. 基于标准的流程、表单、报表、SLA等IT服务模型,可快速制定行业最佳实践;
5. 提供灵活的自定义管理,支持流程自定义、表单自定义、权限自定义、报表自定义等;
6. 提供标准开放的API,可与台账管理、监控平台、自动化平台、消息通知平台等系统进行对接,让IT服务管理更加严谨而高效。
二、 实现效果:
6、 自动化作业管理
一、 解决方案
自动化平台提供任务流程编排功能,可将周期性、重复性、规律性的运维工作实现运维过程流程化,也支持将复杂的作业节点编排成任务,同时支持主流程嵌套子流程,可与操作管理中的脚本配合使用,设定触发条件和时间,即可执行相关脚本处理相关问题,可根据运维需求满足更多灵活应用场景。
任务流程与自动化工具完整对接,用户根据实际情况在流程中设计每个环节所输入的字段,类型等,所有流程数据最终落地相关工具,实现流程数据可追溯、可落地。还可根据用户在每个任务环节均可设置对应动作,实现对任务环节的数据自动处理,从而实现灾备切换、版本部署、系统运维、自动巡检等自动化功能以及自助化设计自动化任务。
二、 实现效果
方案价值
1. 成本
Ø 通过自动化方式实现数据的自动采集,规避人工维护,降低数据维护成本,降低因数据维护产生的人工成本;
Ø 告警分析,提高运维故障定位效率的同时,降低时间成本、人力成本;
Ø 通过流程实现对人员的工作管控,使工作可度量,可考核,发挥人员更高效的能力;
Ø 自动化系统,毫秒级响应,毫秒级处理,提供处理效率的同时降低时间成本;
Ø 自动化系统,规避人工带来的人为风险,降低因人为导致的系统故障连带的综合成本;
2. 效率
Ø 通过构建台账管理模块,通过自动采集实现运维统一数据管理,资产等进行统一管理,对外提供数据订阅服务,从而实现高效的数据同步及发布服务,较传统烟囱式数据维护方式效率提升数倍
Ø 统一监控实现环境、网络、主机、应用、IOT等的全链路监控,通过监控数据分析,实现对业务系统性能瓶颈进行分析,通过数据反推系统进行优化,实现定点优化,提供业务系统优化效果
Ø 通过流程管控,实现流程与监控、流程与自动化、流程与数据的闭环衔接,提供数据流转效率。
Ø 自动化平台实现对网络、OS、应用、业务的联动处理,降低传统运维多团队配合耗时,提供负载任务处理效率
3. 管理
Ø 采用自动化数据采集,极大程度提高数据准确都,为后续运维管理提供数据基础,实现运维精细化管理
Ø 系统自动流转、自动跟催、自动督办,提高对团队作业效率,便于管理,流程驱动人工,以流程的方式推动人员变动,便于制度的执行及考核
Ø 全域监控,实现对业务端到端性能管理,以数据推动人员,促进团队责任边界,规避因推卸责任导致的成本浪费
Ø 自动化系统,替代人工完成任务,降低对人的依赖,促进人员管理