位置:编程技术网 > 区块链 > 正文 >

智能运维:从场景中积蓄运维变革的未来

2019年05月25日 00:08来源:未知手机版

端午节为什么要吃粽子

智能运维:从场景中积蓄运维变革的未来 2019-05-24 17:10:19 中华网

伴随金融机构数字化转型的加速,IT运维从理念到模式正在向智能运维全面迈进。作为率先实现智能运维工程化落地的全栈IT运维服务商,云智慧(北京)科技有限公司总裁刘洪涛先生为《新金融世界》分享了智能运维对于金融数字化和FinTech的意义,以及智能运维在金融机构落地过程中的注意要点。

金融数字化的运维变革

数字化时代,IT对金融业务的重要程度与日俱增,是推动机构进行智能运维变革的关键。

举例而言,在几年前,很多金融机构会在半夜12点-1点暂停交易进行系统维护,这在今天是绝不允许的。现在的金融客户怎么可能接受零点秒杀却无法完成支付的情况?!

如今的金融交易必须达到24小时不间断的秒级响应要求。这就意味着,IT对于金融而言已经由业务支撑系统转变为业务本身。

刘洪涛表示:“我们在跟金融行业用户交流的时候,大家谈的都是业务,关注的也是业务。”在这样的应用环境下,传统运维针对IT系统或者单独IT平台的监控已经不能满足需求。“客户关心的是交易是否成功,用户交易的体验怎么样,所以对运维要求与过去相比有很大的不同。过去,IT从底层设备、操作系统、应用、到业务这么几层,运维的关注点在于底层设备的高可用和稳定性,衡量指标是SLA能达到几个9。今天,大家的关注点集中到业务层面,衡量IT对业务影响程度的指标变成了MTTR(Mean Time to Recovery,平均故障修复时间),这就需要从业务的视角,实现覆盖所有业务链路的端到端全局监控、管理和分析,把监控的点和面都做完整,还要与业务指标进行关联,这就比传统运维复杂度高很多”,刘洪涛说。

当前金融运维的另外一个挑战来自于数字化转型的推进。区块链、虚拟化、容器、IoT等FinTech新技术的应用,导致IT规模和复杂度呈指数增长。过去,传统运维收到不明原因的告警信息,可以把相关设备一台台关掉,再逐一重启来进行排查,解除故障。但在金融系统如此庞大的今天,这类单纯依靠人工的故障修复方法显然是不可取的。不仅如此,随着IT运行环境越来越复杂,每时每刻产生的IT数据量更加惊人,依靠人工设定告警阈值、分析处理海量告警信息同样不现实。这就需要利用大数据和AI技术的助力,通过模式识别和算法对历史数据进行学习,设置更加有效的动态告警阈值,同时对海量告警信息进行实时压缩、收敛和关联分析,利用根因分析追踪导致事件发生的根本原因,实现告警事件的及时处置,有效降低MTTR。

智能运维的认知和核心技术

到目前为止,业界针对AIOps(智能运维)的认知尚未统一,有人说AIOps就是算法,有的则认为是自动化运维。刘洪涛表示:“其实AIOps并不是像APM那样的产品,而是一种理念。用AI技术去提升金融机构的运维能力和效率,让它具有更好的智能化,更高效的解决金融业务运行过程中遇到的种种问题。同时,AI是一种可以工程化的实用科技,AIOps就是AI在IT运维领域的落地,通过AI技术的工程化,全面提升现有ITOM、ITSM 和ITOA产品和解决方案能力。”

>云智慧金融行业智能运维管控中心

谈到AIOps(智能运维)的核心技术,刘洪涛认为:“目前,智能运维的关键不是算法,因为很多算法都已经非常成熟而且开源了。但是,客户的应用场景千差万别,需求也各不相同,到底哪种算法用什么样的模式匹配到客户场景中,这才是核心。这是一个 技术工程化 落地的过程,对于智能运维提供商来说,既要有非常好的算法能力,又要对客户的应用场景有非常好的理解力,还要有工程化落地的能力。这几种能力都具备,才能帮客户解决问题。”

此外,AIOps需要完整的历史数据、日志数据和实时监测数据。因此,要实现AIOps落地,数据采集能力同样必不可少,只有这样才能通过AI得到有价值的结果。

本文地址:http://www.reviewcode.cn/qukuailian/49669.html 转载请注明出处!

今日热点资讯