未来已来 大模型下的一体化运维管理平台

2023-10-27 09:34:49

01 我们看到什么

 

从国际形势上看,

据Gartner推测,2020年到2025年,全球智能运维市场规模复合年增长率为15% ;到2024年,将有30%的企业领导将依靠智能运维的AI技术来推动与业务相关的决策。

 

从国内形势上看,

国内智能运维的市场规模与增速要强于全球水平,我国每年上千亿级的市场需求,正以每年30%的幅度在增长。

 

新的变革早已开始

大模型的到来奠定了智能运维的基础,

明易达一体化运维管理平台正是在此背景下应运而生,

深度智能运维,自主运维的实现指日可待!

 

运维也可以更美好!

IT承载的业务不断上升,IT规模和复杂度不断上升,为了保障系统稳定,业务连续,导致了运维成本成指数的上升,拖累主营业务。

明易达基于产品、技术、运维经验形成海量运维知识库,打造一款具有主动学习思考、自动分析、可控行动和不断自动提升能力的一体化运维管理平台。

 

02 我们有什么

——产品特性

明易达一体化运维管理平台具有专业、自主学习、主动处理三大特点。

专业:管理海量运维大数据,运维专业经验遥遥领先。

自主学习:积累大量的运维知识、运维指标、运维场景、算法模型、自动化工具库,并且引入生成式大模型实现自主学习与自我完善。 

自动处理:自动分析、排查解决运维问题。

——核心技术

明易达一体化运维管理平台的核心技术是将内、外部的运维知识库、故障工单、知识图谱、文档方案等知识源数据进行采集与清洗,通过生成式大模型对数据进行分析与学习,不断的迭代与调优,并将新产生的知识整合至企业知识库中,实现系统自主式持续改进。

 

——技术路线

我们将大模型与行业知识体系相结合,通过知识的一致性表示,形成知识体系与模型体系的表达互通,实现知识互认,同时,对大模型进行统一训练,实现运维会话场景和自主学习能力,进而实现推理能力主动增强

 

① 运维知识(库)表示技术

通过对大模型与知识(工单、结构化知识库、知识图谱)进行知识统一表示, 实现知识一致性表达。

 

② 模型自主学习

通过对大模型与运维知识结合,进行大模型自主学习。

 

③ 运维会话场景化

通过会话模式,与模型进行交互文档,进行日常运维问题应答与方案制定。

 

④ 知识主动增强与推理能力主动增强

通过模型生成能力,再造新知识;基于知识积累与会话历史微调模型,增强推理能力。

 

——技术先进性

#自动学习、主动演进、可信赖、可解释

① 自主学习

大模型预训练实现全量运维知识的零样本自主学习

② 知识多模态对齐

实现大模型的通用性和对多类型数据统一 处理的能力 ,能够增强多模态知识对齐 ,包括故障工单、电子书籍、结构化/半结构化知识库、知识图谱。

③ 模型主动自我演进

实现运维知识的再造生成能力,包括生成结构化/半结构化知识,知识补全,生成解决方案;微调增量知识与问答历史自主提升覆盖度与准确性

④ 提高知识可信度

依托知识库,通过隐形、显性反馈机制,进行质量评估的知识 ,可帮助大模型提高信息的质量和可信度 ,并保障知识的正确性和时效性。

⑤ 提高可解释性

知识库的显性知识与大模型的隐形知识相结合,提高模型应用的可解释性。

⑥ 交叉式验证

结合多个知识来源与多模型能力,进行交叉式验证。

 

03 我们能做什么

——应用场景

明易达一体化运维管理平台覆盖数据中心管理、云服务运维、应用程序监控、安全运维、网络运维、物联网运维等全栈运维场景

① 数据中心管理

数据中心管理、云服务运维、应用程序监控、安全运维、网络运维、物联网运维

② 云服务运维

自动化云资源的管理和优化,包括弹性资源分配、成本控制等

③ 应用程序监控

监测和管理企业应用程序的性能、可用性和安全性

④ 安全运维

自动化安全事件检测、威胁响应和漏洞管理

⑤ 网络运维

监控和优化企业网络,确保数据流畅和网络安全

⑥ 物联网运维

自动检测设备故障、优化设备通信,并提供实时数据分析

 

——建设过程演进

第一阶段:各类数据知识汇聚集中,形成多元的通过知识的一致化表示,形成了各个知识体系与模型体系的表达互通;

第二阶段:利用大模型预训练全部知识,无需标注,自主学习;

第三阶段:形成各种终端应用以及标准服务;

第四阶段:基于模型的服务对知识实现增强;

第五阶段:实现知识增强对模型的主动提升并自我优化。

 

——成熟度模型及评估

明易达一体化运维管理平台,可以帮助用户从平台应用和模型应用两个方面进行量化管理,快速提升IT管理成熟度,实现持续改进和创新,使企业成为行业领导者。

 

——经典案例

项目背景

2023年,某头部证券公司开展了智能监测业务,经过3个月的知识收集和训练,达到一个可用、适应的运维模型。

 

解决痛点

运维人员能力弱、运维知识欠缺、经验不足、误操作等

 

项目进展

当前机器人每天会主动告之其负责人,当前系统状况,发生了什么,是否已解决,怎么解决的,以后如何不再发生等等;通过人机交互查看待办、创建工单。

机器自学

机器自主学习运维知识

运维知识

实况数据

对象识别

关系识别

时空分析

自学知识库

 

主动发起检测

机器24小时监测和分析数据,不定期告之负责人业务实况

正常和不正常实时呈现 50%自动处置,50%提供处置方案

机器发起工作

 

新一代工作模式

机器指导业务人员工作

机器互动式工作模式

标准化的工作模式

创新模式,未来趋势

有做价值的高效工作

科技照进现实