腾讯] 运维自动化新途径--标准运维企业应用案例分享
标准运维是一套通过成熟稳定的任务调度引擎,把多系统间的工作整合到一个流程,助力运维实现跨系统调度自动化的SaaS。
作为蓝鲸体系中兼顾运维操作和运维流程的标准化、自动化的利器,标准运维通过几大功能点去实现它的价值:
1、调度编排服务:基于蓝鲸PaaS平台的API网关服务,不仅集成了腾讯蓝鲸产品各大原子平台的能力;而且能够无侵入地对接企业内部已有系统的功能,将企业内部多系统间的工作整合到一个流程模版中,实现一键自动化调度。
2、自助化服务:标准运维通过与蓝鲸PaaS平台的深度整合,为用户提供了“轻应用”和“职能化”功能,通过有效的权限控制,简化入口通道、操作界面,让用户可以将业务日常的运维工作交给产品和职能化人员执行,实现业务的发布、变更等工作自助化。
Ps:“轻应用”的执行人员,在业务中的角色称为“职能化”(区别于“运维人员”、“产品人员”等的一个角色标签)。
3、标准插件自主开发:标准插件提供一套完整的开发流程规范,通过丰富的表单界面和验证逻辑将企业内部各个系统、各个平台的API组装成一个标准插件模板。使其他的系统通过标准插件的开发模板来调动不同系统间的功能。
企业实际场景
场景实例1——社区用户-龙拳风暴-刘宝星
【功能】标准运维“并行网关”实现流程同步进行,并将通用流程编入“子流程”,实现一次编排,多次使用的效果。减少时间耗费,简化流程编排,美观界面。
【背景】用户所在企业是一家游戏公司,众所周知,游戏有一套完整的生命周期,游戏的上线、更新、维护、停服每一个步骤都需要运维人员完整的参与,而游戏的“更新”更是一个高频率的运维操作。
以下是用户梳理的游戏更新步骤:
用户将所有的更新操作封装成一个脚本,针对执行更新操作的每一台服务器遍历执行。
【问题】
1、如何对多台服务器同时“更新”,提高操作效率呢?
2、人工执行脚本流程繁琐,是否有更简便的方式呢?
通过标准运维的可视化流程编排可以解决上述问题,实现“更新”操作的自主化。下面是社区用户通过标准运维的功能实现了一个游戏业务更新的流程模板。 使用标准运维在可视化的界面下,将提前写好的脚本编入标准插件,再串联标准插件进行流程编排,中间能够减少脚本的逻辑编写,实现自动化执行任务,同时也能避免手工执行脚本带来的失误。
针对不同的更新方式,用户还通过标准运维制定了更多调度编排的操作场景,编排出更多的流程模板。
【结语】对于游戏的更新,不同的企业会有不同的执行标准,任何企业都可以根据自身的需求,结合标准运维产品的灵活性,制定一套满足企业标准的运维自动化流程,即可带来明显的效益。
场景实例2——合作伙伴-嘉为公司运营同学提供
【功能】使用标准运维的“分支网关“中分支节点的条件进行判断,确定下一步执行的节点。执行任务期间如果出现“异常情况”,则通过分支条件给负责人发送邮件提示,并且暂停任务,通过一步步的编排实现完整的软件自动化部署。
【背景】近期看到社区群有些同学想通过标准运维实现组件安装、快速开发,不知如何下手,下面给大家带来蓝鲸技术合作伙伴嘉为科技运营同学分享的企业场景——企业初始化安装Nginx。
黑板,下面开始要讲重点啦!!
Nginx初始化安装的流程可以划分为5个重要的节点:
通过组装官方内置的标准插件,就可以形成一套完整的Nginx初始化安装流程,实现自动化安装Nginx。
我们可以看到上图中清晰展示了Nginx组件的安装过程,对于异常情况也做了对应的措施,一目了然。所以,其它安装过程类似的组件(Apache、MySQL、Tomcat等)同样可以适用这套流程模板,只需要针对环境变化,对流程节点的编排和标准插件参数做一些调整即可实现。
根据嘉为同学的反馈,在此基础上,他们参照Nginx流程模板将其他组件的初始化安装流程以相同的模式编排完成,通过子流程节点串联好所有初始化安装组件的流程,形成一套企业级标准的资源交付流程。
那么,这套交付流程能够为企业实质上带来的改善有多少呢?
以下是嘉为科技资源交付流程不同方案的对比图:
使用传统的方法(人工安装软件包)导致操作步骤复杂流程冗长,交付效率低下,使用标准运维提供的企业级标准的资源交付方案(实现流程化编排的安装和发布),具有如下特点:
-
规范标准的安装包,降低技术管理风险;(统一企业标准,便于管理)
-
端到端的流程编排,实现多种复杂流程编排;(编排流程,顺序执行)
-
全自动化的操作执行,提高软件交付效率;(运维自动化,节省成本)
-
交互式的执行,直观管控任务的进度。(页面美观,操作简便)
【结语】 原本需要花费几天时间的资源交付,通过标准运维标准化、流程化的建设后,只需半个小时的时间即可实现自动化的资源交付,这样的提升对于企业的效益是显而易见的。
蓝鲸智云简介
腾讯蓝鲸智云(简称蓝鲸)软件体系是一套基于PaaS的技术解决方案,致力于打造行业领先的一站式自动化运维平台。目前已经推出社区版、企业版,欢迎体验。了解更多:bk.tencent.com/
上一篇: 蓝鲸
下一篇: 从 0 到 1 建立 CMDB 的思路
推荐阅读
-
腾讯] 运维自动化新途径--标准运维企业应用案例分享
-
openEuler郑州用户组成立!openEuler与hyperfusion携手共建河南地区用户生态 - 开幕致辞 超融合操作系统业务总经理、openEuler委员会成员蒋振华先生为本次活动致辞。 在本次活动的致辞中,他提到,作为openEuler社区早期的成员,超融合见证了openEuler从成立到在各行业商业落地,再到跨越生态拐点的过程,感谢openEuler提供了一个全产业链共同创新的平台,共同推动创新技术的商业落地。 同时,本次活动得到了郑州市郑东新区大数据管理局、郑州中原科技城投资服务局的大力支持。 郑东新区大数据管理局曹光远 在活动致辞中表示,openEuler的应用和*应用设施的深度优化,为郑东新区数字化转型提供了安全、可靠、高性能的技术基础;郑州中原科技城招商服务局王林表示,郑东新区欢迎所有openEuler生态相关企业扎根当地,围绕openEuler社区共同发展,形成合力。 openEuler社区及运维功能介绍 openEuler技术委员会委员胡峰 openEuler技术委员会委员胡峰先生在本次活动中介绍了openEuler社区目前发展的整体情况,并重点从技术层面介绍了openEuler的运维功能。 openEuler 晚会 胡峰先生介绍智能运维工具 A-Ops 和 openEuler gala、 阿波罗 Apollo、智能漏洞管理解决方案等新功能,以及涵盖各种运维场景的精品运维组件。在*交流环节,许多用户就目前使用的 openEuler 在*交流环节,许多用户就自己在使用openEuler过程中遇到的一些问题与胡峰先生进行了进一步的交流。 软硬结合,构建多样化算力操作系统 Hyperfusion 基于 openEuler 的基础上,结合自身软硬件技术积累,推出了富讯服务器操作系统 FusionOS FusionOS. FusionOS 首席架构师张海亮 分享了 FusionOS FusionOS首席架构师张海亮分享了FusionOS的软硬件协同优势、卓越的性能和可靠性,以及FusionOS在金融、运营商、*、互联网等行业的实践案例,引起了众多用户的兴趣,分享结束后,不少参会者就FusionOS的特点向讲师提问并进行了交流。
-
纯干货分享 | 研发效能提升——敏捷需求篇-而敏捷需求是提升效能的方式中不可或缺的模块之一。 云智慧的敏捷教练——Iris Xu近期在公司做了一场分享,主题为「敏捷需求挖掘和组织方法,交付更高业务价值的产品」。Iris具有丰富的团队敏捷转型实施经验,完成了企业多个团队从传统模式到敏捷转型的落地和实施,积淀了很多的经验。 这次分享主要包含以下2个部分: 第一部分是用户影响地图 第二部分是事件驱动的业务分析Event driven business analysis(以下简称EDBA) 用户影响地图,是一种从业务目标到产品需求映射的需求挖掘和组织的方法。 在软件开发过程中可能会遇到一些问题,比如大家使用不同的业务语言、技术语言,造成角色间的沟通阻碍,还会导致一些问题,比如需求误解、需求传递错误等;这会直接导致产品的功能需求和要实现的业务目标不是映射关系。 但在交付期间,研发人员必须要将这些需求实现交付,他们实则并不清楚这些功能需求产生的原因是什么、要解决客户的哪些痛点。研发人员往往只是拿到了解决方案,需要把它实现,但没有和业务侧一起去思考解决方案是否正确,能否真正的帮助客户解决问题。而用户影响地图通常是能够连接业务目标和产品功能的一种手段。 我们在每次迭代里加入的假设,也就是功能需求。首先把它先实现,再逐步去验证我们每一个小目标是否已经实现,再看下一个目标要是什么。那影响地图就是在这个过程中帮我们不断地去梳理目标和功能之间的关系。 我们在软件开发中可能存在的一些问题 针对这些问题,我们如何避免?先简单介绍做敏捷转型的常规思路: 先做团队级的敏捷,首先把产品、开发、测试人员,还有一些更后端的人员比如交互运维的同学放在一起,组成一个特训团队做交付。这个团队要包含交付过程中所涉及的所有角色。 接着业务敏捷要打通整个业务环节和研发侧的一个交付。上图中可以看到在敏捷中需求是分层管理的,第一层是业务需求,在这个层级是以用户目标和业务目标作为输入进行规划,同时需要去考虑客户的诉求。业务人员通过获取到的业务需求,进一步的和团队一起将其分解为产品需求。所以业务需求其实是我们真正去发布和运营的单元,它可以被独立发布到我们的生产环境上。我们的产品需求其实就是产品的具体功能,它是我们集成和测试的对象,也就是我们最终去部署到系统上的一个基本单元。产品需求再到了我们的开发团队,映射到迭代计划会上要把它分解为相应的技术任务,包括我们平时所说的比如一些前端的开发、后端的开发、测试都是相应的技术任务。所以业务敏捷要达到的目标是需要去持续顺畅高质量的交付业务价值。 将这几个点串起来,形成金字塔结构。最上层我们会把业务目标放在整个金字塔的塔尖。这个业务目标是通过用户的目标以及北极星指标确立的。确认业务目标后再去梳理相应的业务流程,最后生产。另外产品需求包含了操作流程和业务规则,具需求交付时间、工程时间以及我们的一些质量标准的要求。 谈到用户影响的地图,在敏捷江湖上其实有一个传说,大家都有一个说法叫做敏捷需求的“任督二脉”。用户影响地图其实就是任脉,在黑客马拉松上用过的用户故事地图其实叫督脉。所以说用户影响地图是在用户故事地图之前,先帮我们去梳理出我们要做哪些东西。当我们真正识别出我们要实现的业务活动之后,用户故事地图才去梳理我们整个的业务工作流,以及每个工作流节点下所要包含的具体功能和用户故事。所以说用户影响地图需要解决的问题,我们包括以下这些: 首先是范围蔓延,我们在整张地图上,功能和对应的业务目标是要去有一个映射的。这就避免了一些在我们比如有很多干系人参与的会议上,那大家都有不同想法些立场,会提出很多需求(正确以及错误的需求)。这个时候我们会依据目标去看这些需求是否真的是会影响我们的目标。 这里提到的错误需求,比如是利益相关的人提出的、客户认为产品应该有的、某个产品经理需求分析师认为可以有的....但是这些功能在用户影响地图中匹配不到对应目标的话,就需要降低优先级或弃掉。另外,通常我们去制定解决方案的时候,会考虑较完美的实现,导致解决方案括很多的功能。这个时候关键目标至关重要,会帮助我们梳理筛选、确定优先级。 看一下用户影响到地图概貌 总共分为一个三层的结构: 第一层why,你的业务目标哪个是最重要的,为什么?涉及到的角色有哪些? 第二层how ,怎样产生影响?影响用户角色什么样的行为? (不需要去列出所有的影响,基于业务目标) 第三层what,最关键的是在梳理需求时不需一次把所有细节想全,这通常团队中经常遇到的问题。 我们用这个例子来看一下 这是一个客服中心的影响地图,业务目标是 3个月内不增加客服人数的前提下能支持1.5倍的用户数。此业务目标设定是符合 smart 原则的,specific非常的具体,miserable 是可以衡量的,action reoriented是面向活动的, real list 也是很实际的。 量化的目标会指引我们接下来的行动,梳理一个业务目标,尽量去量化,比如 :我们通过打造一条什么样的流水线,能够提高整个部署的效率,时间是原来的 1/2 。这样才是一个能量化的有意义的目标。 回到这幅图, how 层级识别出来的内容,客服角色:想要对它施加的影响,把客户引导到论坛上,帮助客户更容易的跟踪问题,更快速的去定位问题。初级用户:方论坛上找到问题。高级用户:在论坛上回答问题。通过我们这些用户角色,进行活动,完成在不增加客户客服人数的前提下支持更多的用户数量。 最后一个层级,才是我们日常接触比较多的真正的功能的特性和需求,比如引导到客户到论坛上,其实这个产品就需要有一个常见问题的论坛的链接。这个层次需要我们团队进一步地在交付,在每个迭代之前做进一步的梳理,细化成相应的用户故事。 这个是云智慧团队中,自己做的影响地图的范例,可以看下整个的层级结构。序号表示优先级。 那我们用户影响地图可以总结为:
-
澎湃新闻对话腾讯丁珂:从 "治已病 "到 "治未病",企业需快速构建 "安全免疫力"--丁珂指出,对企业而言,安全不是成本而是生命线 丁珂指出,对企业而言,安全不是成本而是生命线,也是商业 "硬币 "的另一面。在数字智能化的新阶段,发展驱动安全建设已成为普遍共识,企业需要转变安全思维,从被动建设到主动防御,构建一套新的安全范式和框架,以更加积极、主动的安全观来提升数字安全免疫力,以 "治未病 "的理念取代 "治已病",前置安全,快速构建 "安全免疫力"。对 "已病",前置预判,及时应对处置安全风险,才能维护品牌价值,保障健康发展。 与此同时,安全建设还普遍存在 "不知道往哪投、怎么投 "的痛点。对此,腾讯安全提出,企业可以按照数字安全免疫模型的框架进行安全全局部署,重点在业务安全、数据安全、安全运维管理、边界安全、终端安全、应用开发安全等薄弱环节的关键领域注入 "免疫增强针"。 今年进入公众视野的AIGC还在产业化、产品化的过程中,但大量攻击者已经利用它生成攻击脚本、钓鱼邮件,甚至伪造身份进行诈骗。"人工智能本身是否安全,会不会让网络更不安全? 腾讯安全研究认为,AIGC的风险主要集中在 "无法解释 "和 "无法追踪 "的特点上,但这在技术上是能够找到应对方法的。丁珂谈到,AIGC作为生产力的巨大提升,确实会带来更复杂的攻防态势和更大的防御难度。但任何新技术都要经历这样的周期。而法律法规也会随着技术的演进而不断更新,使新技术的发展更加规范和健全。 丁珂认为,随着我国网络安全法律法规体系的不断完善,合规性将给企业推进网络安全带来很大的推动力,并很直观地展现在需求端。未来,伴随着数据要素市场的建立或企业对数据价值的挖掘,也将带动数据安全市场的快速增长。 对于腾讯安全的商业逻辑和运营,丁珂表示,不谋求建立竞争壁垒,而是期望与生态共同发展,腾讯安全希望通过能力开放,实现安全与业务相伴的生态模式。 谈到未来,丁磊表示,安全领域已经进入加速发展期,在蓝海中会持续关注很多新的业务领域,希望孵化出新的商业模式,腾讯安全团队也会持续关注并抓住机会做好产品。 以下为采访实录(在不改变原意的基础上略有删减): 冲浪新闻:当前,以人工智能、大数据等新技术为驱动的第四次工业革命正向纵深推进,给人类生产生活带来深刻变革。而互联网作为新技术的载体,面临的安全挑战不仅数量越来越多,形式也越来越复杂。从互联网安全从业者的角度,腾讯观察到近年来国内外网络安全形势发生了哪些变化?这些变化呈现出怎样的趋势?
-
1. 故障管理在运维中的重要性及处理流程 2. 标准化和自动化的运维规划:BCM、BCP和DRP的应用