智能运维的概念是Gartner在2016年率先提出,当初的英文全称为Algorithmic IT Operations,意指基于算法的IT运维。随着人工智能技术的发展,2018年Gartner将其英文全称更改为Artificial Intelligence for IT Operations,表明人工智能在IT运维领域的应用。至今短短六年,其概念还在不断融入新的认知。
当前IT运维难度增加,依靠人力堆积的传统方式运维已经无法满足数字化时代对IT运维的要求,借助更先进工具和技术手段成为应对这些挑战的必然选择。数据中心面临着从制度和流程为主驱动的时代,快速向数据与算法为主驱动的智能运维时代迈进。智能运维,已然成为迎接挑战不可或缺的科技力量和解决方案。
AIOps(Artficial Intelligence for Operations),是一种将大数据、人工智能或机器学习技术赋能传统IT运维管理的平台(技术)。AIOps智能运维可以将全栈式的运维数据进行集中化管理,不同数据领域也可以进行智能算法根因定位。其次它可以从业务场景进行跟踪,了解交易路径,对于数据进行智能分析与预测。所以智能运维是一种全新的数字化运维能力,可以配合企业的数字化转型,保障企业的业务应用能够安全稳定且高效的运行。
智能运维即是AIOps,根据Gartner最新解释,指整合大数据和机器学习能力,通过松耦合、可扩展方式去提取和分析数据量(volume)、种类(variety)和速度(velocity)这三个维度不断增长的IT数据,进而为IT运维管理产品提供支撑。
运维发展至今,Ops已经从手工运维、流程化标准化运维、平台化自动化运维,来到了DevOps。近几年,Ops已经和大数据、AI融合,延伸出DataOps、AIOps。这是历史必然,也将为企业IT运维带来极高的效率,对于企业而言。AIOps意味着效率更高、成本更低、解决时间更短。
对比于传统运维工具,AIOps的优势非常明显:传统运维工具的指标采集维度过于单一,在判断故障时,会通过非常多的运维指标进行排查,这样会造成时间的浪费,对于传统运维数据更多的是依靠专家经验判断;
而AIOps可以通过底层的大数据平台进行分析,通过AI技术的充分学习判断,对告警进行直接的溯源、降噪,第一时间对运维人员展示故障的根本原因及定位,大大提高了工作效率和处理故障的时间。
AIOps也就是基于算法的IT运维,是由Gartner定义的新类别,源自业界之前所说的ITOA。在过去的几年间,一些新技术不断涌出,利用数据科学和机器学习来推进日益复杂的企业数据化进程,AIOps因此应运而生。AIOps的解决方案专注于解决问题,而且是通过使用基于算法的技术来高度模仿人类。比如第一线阵营听云,就是国内就有AIOps能力的厂商,业务覆盖政府、金融、运营商、互联网、能源电力等等行业,合作了多家知名企业,如淘宝网、京东、融360、银客网等等。