自2016年Gartner提出AiOps概念到如今快十年了,之前并未引起普罗大众的注意。随着近两年人工智能的快速发展,AI已经不局限于一个小范围,开始慢慢地渗透进大家地生活中。这不由让运维人想到:干掉我们的东西要诞生了吗?曾经号称干掉运维的Devops,至今都还未在大部分的中小企业完美地落地实践呢,那么我们还要去迎接更加“科幻”的AiOps吗?
文章导航
一、OPS的发展历程
截止到目前运维的发展应该大致分为三个阶段:人工运维、自动化运维、智能运维:
1. 人工运维
自互联网诞生,直到后来很长一段时间,人工运维都是最主要的运维手段,这一时期靠着运维人包浆的键盘和鼠标在一定程度上推动着互联网发展。运维人的双手就是主要的运维工具,一个个简单或复杂的命令就是运维人的致富密码。随着互联网的飞速发展,人工运维就无法满足环境需求了,自然而然运维也就往自动化的方向发展。
2. 自动化运维
最开始大家也就通过编写一些自动化脚本,之后又慢慢诞生一些自动化运维工具如:Ansible、Puppet以及Fabric等,再到后来容器化的应用、CICD和Devops等概念的提出并落地、各种CMDB平台的诞生等都推动着运维自动化的发展,这一时期的确很大程度上解放了运维人的双手,只需要动脑去学习使用各种工具就好,算是运维人的福音。
3. 智能运维
不过人总是贪婪的嘛,解放双手之后又还想要解放头脑。于是智能运维(AiOps)应运而生,在大量运维数据的基础上,通过机器学习去让机器自主完成问题排查分析解决等常规运维工作。这一阶段依赖的不再是运维人的双手和大脑,而是运维数据的积累和计算机的能力,按照其完美的设想的确能够淘汰掉运维人员,但这样完美的设想又能够实现吗?
二、OPS现状
如今的运维现状可以简单总结为:人工未淘汰、自动化不彻底、智能不成熟。智能运维虽已经提出多年,但是毕竟人工智能无论是硬件算力还是软件算法都还未发展到一个很完善的地步,仅有极少个别的大型企业在一定程度上有一些应用,基本都可以忽略。自动化运维在那些大型企业中落地建设的已经相当完善了,但是在中心型企业里面就参差不齐了,多少都受到业务的体量不足以支撑其投入大量的各种成本去建设,这就导致自动化程度有的深有的浅了,也正因为如此那些没有实现自动化的运维工作,就离不开人工运维了。所以目前大多数的企业都应该是以自动化运维为主、人工运维为辅的一个状态。那么在这种都还没有把Devops全面普及的情况下,还应该去探索AiOps吗?
三、AiOps分析
1. AiOps的优势与挑战
AiOps的显著优势
AiOps这个概念不可否认是相当美好的,他的优点也显而易见:解放我们的双手和大脑,也就是解放人力,就这一个优点就是非常大的,而且这也应该是AI在绝大多数应用领域的优点。
AiOps面临的主要挑战
首先就是落地实践比较困难,这有不低的门槛,解放了运维人力的同时需要投入可能更多的研发人力,这仅是软件层面的,那还有硬件层面的成本问题,还有大量有效数据做为基础,这对于绝大多数的企业来说都有不小的困难;另外从当前AI应用的现状来看,都需要人们对AI的错误具有一定的容忍度,这样的状态或将持续很长的一段时间,可能是几十年也可能是一直存在。然而面对运维那些需要一丝不苟的工作内容,并不具备容错度,就是相悖的。
2. 应用场景
虽然目前AiOps的应用落地案例少见,但是仍然不妨碍我们可以结合实际的工作场景进行一些设想。比如下面这些能想象到的一些比较实际的应用场景:
- 日志采集工具采集特定日志后输入给AiOps工具,AiOps分析日志后做出预警、给出处理意见、甚至直接进行一些运维操作等
- 任何人员像聊天一样向AiOps发出一些操作指令,由AiOps去执行诸如配置修改、服务发布、资源扩缩容等常见的运维工作内容
- AiOps和常见的数据库、消息队列、网关等服务存在联系,当某些服务出现故障时,AiOps自行分析故障并进行处理以恢复服务
四、结语
一个不可否认的现实情况就是:在绝大多数情况下,人工运维不能被完全淘汰,人工运维和自动化运维混合的状态就持续到未来的很长一段时间。如今AI既然都已经来到了我们面前,我们就不要躲开,将其利用起来以带给运维新的元素,毕竟实际的工作场景中确有可利用AI之处,即使落地有所困难但也非不现实;即使可能无法完全解放我们的双手,能空出一只也是好的,再其次对于我们工作效率的提高也是大有益处;即使AiOps的完美设想可能无法完美实现,我们也应该积极地去探索Ai带给Ops的变革、推动AiOps的发展,万一实现了呢。
咨询方案 获取更多方案详情