以智能运维加速IT与业务融合,助力电力数字化转型

2019-12-24 余恺威 IT之家
浏览

2016年,埃森哲在世界经济论坛上发表电力行业数字化转型白皮书中作出预测:从2016到2025年间,全球范围内电力部门将通过充分利用数字化,创造1.3万亿美元的行业价值,而这些价值的产生既依托于数字化基础设施投入,更来自于长期高效、稳定的运维和运营,智能运维的规划和建设尤为重要。

百年电力行业的新挑战

1882年第一盏电灯在上海点亮,在过去的100多年里,中国电力行业跨越式发展。进入二十一世纪,数字经济成为大国博弈的新战场,电力作为承载着能源的基础性枢纽产业,以能源流、业务流、数据流为载体的能源互联网与数字经济紧密融合,为中国经济的再次腾飞提供蓬勃动力。

数字化技术与电力企业的深入融合,不仅提高了运营效率,其平台化、共享化的趋势也给传统电力供应模式带来了巨大挑战。

电网企业要实现高度的互动化、透明化、信息化、智能化,需要建立精确的供需数据监控系统、有效的大数据分析系统和透明的多边交易系统;输配电部门要实现平台化,不仅要为用户、分布式能源、分布式储能、综合能源服务、需求侧管理、电动汽车充电管理建立管理平台,还需要不断优化用电负荷,提高响应能力和主动应对能力。

在这样的大背景下,国网与南网分别出台了建设“数字国网”与“数字南网”建设行动方案,为中国能源互联网发展提供“央企样本”,为世界能源转型呈现“中国方案”。

当下,构建新型电力业务和数字化IT基础设施间管控桥梁的智能运维,不仅将成为企业数字化转型的必然选择,对电力企业未来几十年的全球化发展也将产生深远影响。

用AI解救传统运维中的背锅侠

现阶段,电力企业的数字化建设以保障电力供应、提高运营效率、降低管理成本、改善客户服务、综合创造价值为基本任务。

电网企业为了提供更好的用户访问体验和实时业务感知,提升IT运维效率,提高产品升级管理质量,针对目前运维保障的各类应用系统、基础设施、网络环境、服务器性能及系统运行环境的状态监控、配置管理、故障修复、应用维护等内容,从自身业务特点与典型应用场景出发,规划建立了一体化的IT平台系统。

但是,随着数字化业务线的增加和规模的扩大,无论是电网管理平台、客户服务平台、调度运行平台还是云平台、数字化电网背后的IT系统规模和运维管理难度都在迅速增长,传统的IT监控工具和运维管理手段难以满足“实战、实用、实时”的互联网级运营要求。一旦出现IT故障影响业务指标,作为“背锅侠”的IT部门和运维人员通常会首先被质疑。

对于传统运维难题,曾经在能源企业负责过运维的云智慧总裁刘洪涛感同身受:“一家大型电力企业的IT系统往往有数百套之多,应用类型千差万别,过去只能采用紧耦合的IT运维解决方案,不但部署困难,出现故障后还需要依靠IT管理者的经验和人力去逐一排查,解决问题的时间通常需要数天、甚至数周之久。随着电力行业上云进程的全面推进,以及大数据和人工智能技术在运维领域的应用,云智慧智能运维解决方案成为数字化电企的新选择。”

云智慧的智能运维解决方案采用松耦合的分布式高可用扩展架构,可做到线性且实时横向扩展,运维数据的采集和处理能力达到TB级。在整个架构中,对于可能的单点都进行了双活冗余的设计,达到了真正的高可用,防止单台宕机影响整个系统,做到安全生产。系统采用自定义数据采集架构,根据数据体量,分布式部署数据采集器,分解采集任务,实现并行多任务采集,提高数据采集效率及准确性。

智能运维平台不但能有效减少电力系统告警的误报率和错报率,通过业务链自动追踪和故障根因分析,第一时间发现问题根源,把MTTA平均故障接手时间和MTTR平均故障修复时间这两个数字化运维关键指标由过去的数天缩短到数个小时之内。

泛在电力物联网背后的“智慧大脑”

云智慧的智能运维解决方案不仅应用于“传统”的IT架构之上,在扑面而来的物联网、边缘计算世界中同样发挥着举足轻重的作用。

在上海,基于泛在电力物联网技术改造的35千伏蔡伦变电站顺利投运。与传统变电站不同的是,该变电站以数字镜像评价系统构建出自己的“智慧大脑”——结合前端传感器采集数据以及历史运维数据开展分析,在线评估站内每台设备的健康状态并滚动更新针对性的检修策略,有效前移设备安全预警防线,在保证安全的前提下尽可能减少计划停电。

数字镜像评价系统运用类脑人工智能技术,结合实时状态感知数据及海量历史数据,开展设备健康状态在线诊断,主动推送设备异常报警、设备健康体检报告和差异化检修策略,让设备会“说话”,变电站会“思考”,而这正是以数据为基础、算法为支撑、场景为导向的云智慧智能运维的核心能力。

云智慧利用大数据和人工智能技术,为IT赋予了统一数据管控和智能化数据分析能力,全面提升运维管理效率,化被动运维为主动运维。

可信赖的全栈智能运维专家

2009年,云智慧推出国内第一款IT监控SaaS产品——监控宝,至今仍被许多运维工程师誉为“神器”;随后推出端到端应用性能管理产品——透视宝,依靠用户间的口口相传,成为几十万企业用户倍加信赖的ITOM服务商。2016年,为了谋求更大的发展,云智慧从ITOM向ITOA延伸,率先提出业务运维概念,开始为企业提供全栈智能运维解决方案。

正是这一年,刘洪涛惊喜的发现,他们规划的业务运维落地路线与Gartner发布的AIOps实现路径几乎完全一致。这让他意识到,在数字化的赛场上,云智慧正与国际友商并肩在同一条起跑线前,蓄势待发。

“市场的变革,使新兴技术不断涌现并颠覆,技术与应用的边界逐渐消失。我们一直在思考,如何才能洞悉未来的市场方向,如何才能更好的支撑客户数字化转型和业务创新。”刘洪涛自豪的说,“过去3年云智慧的高速成长,证明我们选择了正确的道路和正确的事情。”

围绕用户体验和业务运营,云智慧从提供一站式的IT资源管控、应用性能诊断和实时业务健康分析入手,依托智能业务运维平台加速客户数字化转型。在基础设施领域,他们实现了全量IT运行数据的采集和分析,建立统一监控和告警平台。在应用领域,提供深入到代码级的跨系统性能问题跟踪、诊断和根因分析。在业务范围,致力于消除业务与IT系统之间的断层,持续提升IT管理与业务分析能力。

目前,云智慧已经成为国内AIOps市场最领先的公司,获得了CMMI、ISO9001/ ISO20000/ ISO 27001、可信云、ITSS等数十项资质认证。同时,拥有300人研发团队的云智慧经过持续投入,形成了300+骨干网监测节点,全地域、全网络用户体验持续监测;PB级大数据处理能力和TB级运维数据实时分析能力;GB级海量告警信息收敛,告警压缩和消噪比超过95%;率先实现故障预警和业务预测,准确率超过90%;数字化业务关键指标MTTR、MTBF缩短超过80%等多项智能运维领域的技术创新和产品优势。

连续两年,云智慧在Gartner的研究报告中,与华为、百度、阿里等国内云计算巨头并列为智能运维领域的佼佼者。云智慧与清华大学软件学院联合成立的“智能运维研究中心”也在2019年12月正式挂牌成立,充分发挥清华大学的学科优势和云智慧的产业优势,促进大数据科学、人工智能科学与运维、物联网、图像识别等应用深度交叉与融合发展。

站在“万物互联”的潮头浪尖,能源科技创新一日千里,智能运维在电力行业的应用也越来越广泛。截止目前,云智慧已经为国网及多家直属企业提供了大数据和智能运维服务。而蔡伦变电站项目的成功,更让刘洪涛看到了云智慧在泛在电力物联网建设中的广阔前景。

刘洪涛强调:“目前,云智慧通过与国网信通产业集团的合作,参与了泛在电力物联网智能运维统一监控平台的讨论、规划工作。未来,随着越来越多的电力企业迁移上云、拥抱物联网、享受数字化带来的价值、效率和体验,中国电企的数字化转型和泛在电力物联网建设将会成为全世界的标杆,整个行业都会充满增长潜力和发展机遇。我们希望成为行业领跑者中的一员,伴随中国电力企业一同发展、携手并进。”(作者:杨娜)