什么是云计算?什么是边缘计算?我们为什么需要云边合作?
一、云计算的发展有哪些弊端?
云计算(cloud computing) 是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。、
近年来,云计算赋能大数据处理,用户仅需要将数据上传至云端,利用云计算中心的超强高效计算平台,便可以集中处理计算需求。目前的智能物联网设备,通常也是通过将数据通过网络上发至云端,由云端进行统一的处理这种模式进行的。
然而,物联网设备与日俱增所带来的智能数据的爆炸增长,无疑使得云计算这种集中处理的计算模式暴露出各种问题。其中主要是问题显现在两个方面。
一方面,云计算在集中处理数据前,需要各个边缘侧的设备将数据全部上传,这意味着,数据传输的过程将占用巨大的带宽。尤其是在人工智能应用如火如荼发展的现状下,模型的训练与推理所需要的巨大数据加剧了核心网络的压力。物联网的高速发展更使得数据的増长远远甩开网络带宽的增速,传统的云计算模式遇到了带宽与延迟的瓶颈。延迟不仅仅严重影响了用户体验,更是对无人驾驶等对延迟零容忍的产业产生致命打击。
另一方面,云计算模式将数据都传输至云端大大增加了隐私泄漏的风险,无论是云运营商的恶意使用还是数据被截取,都将造成严重的危害。基于对计算模式的新的需求,催生了边缘计算模型的产生。
二、边缘计算的产生及局限性有哪些?
边缘计算(Edge Computing) 是利用网络边缘侧的计算能力进行数据的处理。
边缘计算目前还没有一个公认的定义,不同的研究者都在试图描述和理解边缘计算,边缘计算产业联盟进行了如下描述:边缘计算是提供网络、计算、存储、应用核心能力的靠近数据产生处的网络边缘的开发平台。这个平台可以满足行业在快速联接、实时响应、数据处理、安全与隐私保护等各个方面的需求。
来自韦恩州立大学的施巍松教授进行了如下描述:边缘计算是一种新的计算模型,它在网络边缘执行计算,其中边缘是指数据产生处和云端各种路径之间的任意计算和网络资源。边缘的数据一边连接云服务,另一边连接物联网服务。所有相关的对边缘计算的描述之中,都倾向于把边缘计算定义为一种新的计算范式,它使得数据的计算从网络剧里或者空间距离上更接近数据的采集端。
其中所提及的边缘侧,则是指从数据产生的设备到云端这一条通路中,任意的一个具有计算等功能实体。边缘计算因为其新的特性,相对于云计算,也有了一些优势,最突出的优点就是边缘侧由于更加接近数据产生的设备,相比于需要进行无法预计的数据传输成本的云计算,这天生便增加了其实时性。一旦数据的计算处理工作由边缘侧承担,那么从前需要上传至云端的数据将变少或者消失至零,这又大大减少了核心网络的流量从而释放网络带宽的压力。对于数据隐私的保护,则也是在数据源头处处理的巨大优势。
随着物联网技术的发展,集中式的云计算架构无法把资源利用、数据融合、应用兼容、统一运维等物联网问题全部解决,给网络带宽、计算能力、存储容量带来巨大压力。
边缘计算模型的优点就凸显出来:
(1)在网络边缘处理大量临时数据,不再全部上传云端,这极大地减轻了网络带宽和数据中心功耗的压力;
(2)在靠近数据生产者处做数据处理,不需要通过网络请求云计算中心的响应,大大减少了系统延迟,增强了服务响应能力;
(3)边缘计算将用户隐私数据不再上传,而是存储在网络边缘设备上,减少了网络数据泄露的风险,保护了用户数据安和隐私。
三、为什么需要云边协同?
随着物联网趋势的不断加深和 5G 等网络建设的持续发展,消费物联网和产业物联网设备都将与日俱增。目前的智能物联网设备大都采取通过将数据通过网络上发至云端,由云端进行统一的处理。然而广泛的智能终端接入和海量的感知数据在传输过程中占用的巨大带宽,将数据直接传输至云端也增加了隐私泄漏的风险。在边缘侧进行计算可以减少了核心网络的流量从而释放网络带宽的压力,也完成了一定的数据保护,但是其资源受限会导致的无法满足模型精度需求。
云边协同计算继承了云计算与边缘计算的优势,以同时达到高精度、低消耗、快响应、低延时的应用场景需求。
云计算负责边缘节点难以胜任的计算任务,同时,通过大数据分析,负责非实时、长周期数据的处理,优化输出的业务规则或模型,并下放到边缘侧,使边缘计算更加满足本地的需求,完成应用的全生命周期管理。
边缘计算主要负责那些实时、短周期数据的处理任务以及本地业务的实时处理与执行,为云端提供高价值的数据;
在更多的场景下,云计算与边缘计算形成一种互补、协同的关系,边缘计算需要与云计算紧密协同才能更好地满足各种应用场景的需求。
云边协同是融合通信、算力、数据存储、应用服务的分布式开放平台,相对于云侧的全局性、长周期、高时延、大数据的计算特点。边缘计算的短周期特性可以更好地支持本地业务。因此边缘侧与云侧并不是简单的替代关系,而是互补协同的合作关系。通过对资源协同、数据协同、应用协同、服务协同等协同领域构建统一高效的协同框架,实现云边互补,资源融合。
云边协同的推理机制不同于传统的云边协同,除业务、数据、服务等协同外增加了算法协同。算法协同具备算力资源分配、准确率验证、模型分区调用等机制。云边协同的推理机制弥补边缘侧算力不足导致的低准确率现象,避免数据短时增长带来的算力波峰,减少云侧带宽压力,提升服务速率,解决数据不出域问题,有效地提高了系统稳定性和资源的整体使用效率。
云边协同,架构如图 1.1所示,即云计算和边缘计算互相协同,彼此优化补充,就好像章鱼大脑和爪子的关系。通常可以将章鱼与边缘计算进行类比,章鱼的大脑可以与云计算进行类比,章鱼的神经元分布在脑部的仅有四成左右,足部则可以类比边缘计算,占据六成的神经元。那么章鱼的足部思考并就地解决问题,大脑则专注于处理“更高层次”的问题。由于物联网设备,天生具有在边缘侧采集数据的特性,一旦为其计算进行赋能,使得应用在数据源处进行数据的处理,从而减少与云端的交互,将大大解放传统的云计算模式下的网络压力;边缘侧处理了大多的数据,那么当需要借助云端能力时,只需要传输数据运算的中间结果取代之前直接的数据传输,隐私泄漏的风险也因此大大降低.
四、云边协同有哪些协同方式?
1、关系划分
边缘计算的快速发展,并不意味着要彻底放弃云计算。相反,越来越多的应用场景需要在云计算的基础上协同边缘计算技术,才能发挥更好的效果。云计算的优势在于处理长周期、计算密集的任务数据,因此可以有效应对需要大量数据分析的业务领域;而边缘计算的优势在于处理短周期、实时性的任务数据,因此可以更好地应用于注重实时性的本地业务领域。针对于云计算与边缘计算之间的协同关系,主要有两种协同方式。
(1)中心云主导的云边协同。
在这种模式下,由云计算中心负责接收终端设备所上传的任务数据,并进行数据计算、模型训练,以及任务预测。然后,中心云将部分计算与预测结果发送至边缘服务层,并指导边缘层进行资源部署与任务调度。
(2)边缘服务层主导的云边协同。
在这种模式下,首先由边缘服务层来接收终端用户所上传的任务数据,并对其进行计算;然后,边缘服务层会及时将任务的处理结果回传至终端设备。若边缘服务层的计算能力有限,不能满足用户任务的实际需求,则边缘服务层会将任务继续卸载至中心云服务器中处理。
2、层次划分
云边协同的设计应该兼顾传统云计算与新兴边缘计算两种计算范式,因此对其架构进行直接进行设计太过于庞大,同时也忽略了其作为一个新的计算平台的基本需求。由于云边协同源于云端与边缘端,云与边缘的设计并非单一的层次,因此云边协同的研究也应该结合云的多层次与边缘计算的多层次。其中云计算的发展相对成熟,应用也更为广泛,现代的云计算通常被划分为基础设施即服务的IaaS 与平台即服务的 PaaS 两个领域,广义上还包括软件即服务的 SaaS。边缘计算层次的划分通常也与云计算对应,即边缘侧的基础设施即服务、平台即服务以及软件即服务。本文依据云计算与边缘计算的层次对目前云边协同的研究进行了划分,如图 1.3 所示,分为基础设施协同、平台协同与软件协同。
(1) 基础设施协同
云端和边缘端因为其物理实体的存在,都对应着相应的资源提供相应的能力,比如计算能力,存储能力等。但是又由于每个设备的资源与能力并不相同,想要调度起来或者进行能耗的评估就需要统一的管理。
Li等人对云边协同下基于负载平衡的资源管理问题进行了研究,为了保证数据完整性以及降低成本,提出了基于成本的资源扩展和收缩模型,又为了改善负载不平衡问题,提出了新的数据迁移模型。
Li等人提出了接入云、分布式微云与核心云的划分,在城市中部署微云系统,将远程的核心云上的服务迁移至本地,终端用户即可从微云获取之前在核心云的服务。而为了优化微云间的调度,提出了一种基于粒子群优化的多节点系统的资源调度与分配策略。
Li 等人也提出了一种资源管理策略,以保证边缘设备不过载,并优化成本消耗。同时也提出了一种副本分配策略,更好的保证数据一致性。
(2) 平台协同
平台层一般包括数据管理以及应用的管理。云边协同架构下数据处理通常由边缘节点承担,而数据处理作为后续数据问题工作的第一步是十分重要的。
Carrizales 等人设计了一种方法,对每个内容的哈希值进行索引,从而进行重复消除。这样处理可以为后续的数据分析等工作减轻工作量,也同时增加了数据的安全性与可靠性。经过验证,该方法对于降低风险有一定的可行性。
Lopez等人基于特征选择,提出了一种基于特征相关性和特征归一化的网络流量分类快速预处理方法,该方法减少了数据处理的时间,对数据进行实时处理,以有效的防御网络攻击。
Zhao 等人出了一种面向自动驾驶的边缘流数据处理框架,该框架基于Spark-Streaming的建立,可以预测传感器数据到达率的变化,提前调整流批量间隔,并通过边缘节点实现实时流处理。该框架可以在边缘计算节点区域的地理覆盖范围内,实现对自主驾驶车辆传感器数据的数据流变化的监控和预测,同时最小化端到端延迟,同时满足应用吞吐量要求。
除了数据预处理,数据存储也是数据管理中重要的部分,考虑到边缘节点的存储能力有限,深度学习应用部署于云边协同框架时,如果减少模型大小以适应边缘受限是很重要的研究方向。
Tao等人在物联网数据框架—云边缘协作存储(CECS)基础上进行了改进,提出了一种新的数据搜索与共享的方案,它允许用户生成公钥和私钥对,并自行管理私钥,并且使用可搜索公钥加密来实现更安全、高效和灵活的数据搜索,该方案在保护数据安全的情况下,也同时降低了通信与计算的成本。
应用管理方面
由于应用的部署需要特定的运行环境,但是云边协同框架下,由于普通边缘节点通常采用一些低功耗的处理器,而边缘基站等也会采用高版本的处理器,云端可提供的能力远远超过一个边缘节点,那么不同位置不同类型的应用,都会提供不同的部署环境。容器的出现,颠覆了传统云厂商应用的部署与调度,也催生了一些优秀的容器编排工具,如 Kubernetes。
为了使得应用更好的在不同配置的设备间更好的部署与调度,以适应云边协同这种分布式的架构,研究者们也进行了大量的研究。
Xiong 等人介绍了一种类似于 Kubernetes 边缘计算环境中的基础设施 KubeEdge,其在边缘上提供了网络协议基础设施和与云中相同的运行时环境,允许应用程序与运行在边缘节点和云服务器上的组件进行无缝通信,实现了云边协同架构下容器在云与边缘间的调度。
Zhang等人则是提出了一种动态规划的算法 E-ODD。在应用部署的过程中,当设备没有足够的计算资源时,它会将一些可移动的任务卸载到云上,以占用额外的资源。但是,当难以占用云资源或设备上的计算资源过多时,设备会将任务迁移回去。
Deng 等人参照目前云端微服务的部署模式,提出以微服务形式在云边协同框架下部署应用,并设计了一种在资源约束和性能要求下优化应用程序部署成本的方法。
(3) 软件协同
对应传统云计算直接提供相应应用部署环境的 SaaS 平台,许多的云厂商也在边缘计算这种计算范式出现之后,提供了专门针对边缘计算的服务,Google在全球范围内部署了 1000 多边缘服务器,并推出了针对边缘的方案;Alibaba 在我国部署了 500 多边缘服务器,也可以针对低延迟需求应用提供边缘服务; Amazon 则是针对低延迟需求应用提供边缘服务。众多云厂商都在边缘开始发力。
边缘资源的增长,平台的搭建,无疑为特定应用环境的部署提供了极大的便利。Bhattacharjee 等人设计了一款事件驱动的大数据即服务产品,用于物联网分析生命周期管理,简化了物联网应用的部署。
Chen 等人则针对资源有限的边缘服务之间的协作进行了研究,提出了一种协作服务部署和应用程序分配算法来描述最终的边缘服务部署策略,涉及边缘节点和服务的放置,以及应用程序在边缘节点的分配,它通过设计最小资源占比获得最少的边缘节点数量,然后平衡计算负载。
五、云边协同有哪些应用?
实际中,在电力物联网领域,图像视频相关应用已经越来越广泛,智能化图像的处理、任务调度将成为未来的关键。广泛的智能终端接入和海量的感知数据在促进电力物联网智能化应用进一步提升的同时,也带来了带宽资源约束和网络传输延迟等技术瓶颈。
在应用过程中,如果使用基于云数据中心的智能云计算方式,无法满足就地处理与实时智能分析的业务需求;如果使用边缘计算,由于边缘设备的算力有限,无法满足延时约束和模型精度需求。采用基于云边协同的智慧物联体系,以同时达到高精度、低消耗、快响应、低延时的应用场景目标,实 现新型电网物联体系。
同样,在正在高速发展的车联网领域,如今海量实时数据,车辆行驶安全服务需要在毫秒级延时的情况下处理,而车载设备有限的计算和存储能力难以满足大量计算需求和低时延的限制,不仅如此,车联网还具有节点高速移动、拓扑结构动态变化等特点,传统的云计算并不能满足其时延敏感型计算任务。车联网借助云边协同,可以根据实际的环境条件和限制对计算任务进行选择,在构建的云边协同网络中完成绝大部分的计算,并通过路侧单元等传输手段,实时将结果发送给请求车辆。
云边协同中,边缘侧负责实时处理的部分,并与云端交互关键数据,云侧则负责实时性需求低的密集计算任务等。云边协同由于其继承了云计算算力强大与边缘计算延迟低等的优势引起一众研究。目前,针对云边协同的研究大都在物联网,智能交通等方面,它和传统应用的目标一致,即减少延迟、降低消耗最终实现更好的用户体验。
上一篇: 云计算的优势和未来趋势
下一篇: 模拟退火模板和 "我问你答"。
推荐阅读
-
纯干货分享 | 研发效能提升——敏捷需求篇-而敏捷需求是提升效能的方式中不可或缺的模块之一。 云智慧的敏捷教练——Iris Xu近期在公司做了一场分享,主题为「敏捷需求挖掘和组织方法,交付更高业务价值的产品」。Iris具有丰富的团队敏捷转型实施经验,完成了企业多个团队从传统模式到敏捷转型的落地和实施,积淀了很多的经验。 这次分享主要包含以下2个部分: 第一部分是用户影响地图 第二部分是事件驱动的业务分析Event driven business analysis(以下简称EDBA) 用户影响地图,是一种从业务目标到产品需求映射的需求挖掘和组织的方法。 在软件开发过程中可能会遇到一些问题,比如大家使用不同的业务语言、技术语言,造成角色间的沟通阻碍,还会导致一些问题,比如需求误解、需求传递错误等;这会直接导致产品的功能需求和要实现的业务目标不是映射关系。 但在交付期间,研发人员必须要将这些需求实现交付,他们实则并不清楚这些功能需求产生的原因是什么、要解决客户的哪些痛点。研发人员往往只是拿到了解决方案,需要把它实现,但没有和业务侧一起去思考解决方案是否正确,能否真正的帮助客户解决问题。而用户影响地图通常是能够连接业务目标和产品功能的一种手段。 我们在每次迭代里加入的假设,也就是功能需求。首先把它先实现,再逐步去验证我们每一个小目标是否已经实现,再看下一个目标要是什么。那影响地图就是在这个过程中帮我们不断地去梳理目标和功能之间的关系。 我们在软件开发中可能存在的一些问题 针对这些问题,我们如何避免?先简单介绍做敏捷转型的常规思路: 先做团队级的敏捷,首先把产品、开发、测试人员,还有一些更后端的人员比如交互运维的同学放在一起,组成一个特训团队做交付。这个团队要包含交付过程中所涉及的所有角色。 接着业务敏捷要打通整个业务环节和研发侧的一个交付。上图中可以看到在敏捷中需求是分层管理的,第一层是业务需求,在这个层级是以用户目标和业务目标作为输入进行规划,同时需要去考虑客户的诉求。业务人员通过获取到的业务需求,进一步的和团队一起将其分解为产品需求。所以业务需求其实是我们真正去发布和运营的单元,它可以被独立发布到我们的生产环境上。我们的产品需求其实就是产品的具体功能,它是我们集成和测试的对象,也就是我们最终去部署到系统上的一个基本单元。产品需求再到了我们的开发团队,映射到迭代计划会上要把它分解为相应的技术任务,包括我们平时所说的比如一些前端的开发、后端的开发、测试都是相应的技术任务。所以业务敏捷要达到的目标是需要去持续顺畅高质量的交付业务价值。 将这几个点串起来,形成金字塔结构。最上层我们会把业务目标放在整个金字塔的塔尖。这个业务目标是通过用户的目标以及北极星指标确立的。确认业务目标后再去梳理相应的业务流程,最后生产。另外产品需求包含了操作流程和业务规则,具需求交付时间、工程时间以及我们的一些质量标准的要求。 谈到用户影响的地图,在敏捷江湖上其实有一个传说,大家都有一个说法叫做敏捷需求的“任督二脉”。用户影响地图其实就是任脉,在黑客马拉松上用过的用户故事地图其实叫督脉。所以说用户影响地图是在用户故事地图之前,先帮我们去梳理出我们要做哪些东西。当我们真正识别出我们要实现的业务活动之后,用户故事地图才去梳理我们整个的业务工作流,以及每个工作流节点下所要包含的具体功能和用户故事。所以说用户影响地图需要解决的问题,我们包括以下这些: 首先是范围蔓延,我们在整张地图上,功能和对应的业务目标是要去有一个映射的。这就避免了一些在我们比如有很多干系人参与的会议上,那大家都有不同想法些立场,会提出很多需求(正确以及错误的需求)。这个时候我们会依据目标去看这些需求是否真的是会影响我们的目标。 这里提到的错误需求,比如是利益相关的人提出的、客户认为产品应该有的、某个产品经理需求分析师认为可以有的....但是这些功能在用户影响地图中匹配不到对应目标的话,就需要降低优先级或弃掉。另外,通常我们去制定解决方案的时候,会考虑较完美的实现,导致解决方案括很多的功能。这个时候关键目标至关重要,会帮助我们梳理筛选、确定优先级。 看一下用户影响到地图概貌 总共分为一个三层的结构: 第一层why,你的业务目标哪个是最重要的,为什么?涉及到的角色有哪些? 第二层how ,怎样产生影响?影响用户角色什么样的行为? (不需要去列出所有的影响,基于业务目标) 第三层what,最关键的是在梳理需求时不需一次把所有细节想全,这通常团队中经常遇到的问题。 我们用这个例子来看一下 这是一个客服中心的影响地图,业务目标是 3个月内不增加客服人数的前提下能支持1.5倍的用户数。此业务目标设定是符合 smart 原则的,specific非常的具体,miserable 是可以衡量的,action reoriented是面向活动的, real list 也是很实际的。 量化的目标会指引我们接下来的行动,梳理一个业务目标,尽量去量化,比如 :我们通过打造一条什么样的流水线,能够提高整个部署的效率,时间是原来的 1/2 。这样才是一个能量化的有意义的目标。 回到这幅图, how 层级识别出来的内容,客服角色:想要对它施加的影响,把客户引导到论坛上,帮助客户更容易的跟踪问题,更快速的去定位问题。初级用户:方论坛上找到问题。高级用户:在论坛上回答问题。通过我们这些用户角色,进行活动,完成在不增加客户客服人数的前提下支持更多的用户数量。 最后一个层级,才是我们日常接触比较多的真正的功能的特性和需求,比如引导到客户到论坛上,其实这个产品就需要有一个常见问题的论坛的链接。这个层次需要我们团队进一步地在交付,在每个迭代之前做进一步的梳理,细化成相应的用户故事。 这个是云智慧团队中,自己做的影响地图的范例,可以看下整个的层级结构。序号表示优先级。 那我们用户影响地图可以总结为:
-
什么是云计算?什么是边缘计算?我们为什么需要云边合作?
-
远算云计算-为什么西门子是自动驾驶仿真行业的NO.1?
-
计算机视觉中,究竟有哪些好用的目标跟踪算法(下)-快速变形主要因为CF是模板类方法。容易跟丢这个比较好理解,前面分析了相关滤波是模板类方法,如果目标快速变形,那基于HOG的梯度模板肯定就跟不上了,如果快速变色,那基于CN的颜色模板肯定也就跟不上了。这个还和模型更新策略与更新速度有关,固定学习率的线性加权更新,如果学习率太大,部分或短暂遮挡和任何检测不准确,模型就会学习到背景信息,积累到一定程度模型跟着背景私奔了,一去不复返。如果学习率太小,目标已经变形了而模板还是那个模板,就会变得不认识目标。(举个例子,多年不见的同学,你很可能就认不出了,而经常见面的同学,即使变化很大你也认识,因为常见的同学在你大脑里面的模型在持续更新,而多年不见就是很久不更新) 快速运动主要是边界效应(Boundary Effets),而且边界效应产生的错误样本会造成分类器判别力不够强,下面分训练阶段和检测阶段分别讨论。 训练阶段,合成样本降低了判别能力。如果不加余弦窗,那么移位样本是长这样的: 除了那个最原始样本,其他样本都是“合成”的,100*100的图像块,只有1/10000的样本是真实的,这样的样本集根本不能拿来训练。如果加了余弦窗,由于图像边缘像素值都是0,循环移位过程中只要目标保持完整那这个样本就是合理的,只有目标中心接近边缘时,目标跨越边界的那些样本是错误的,这样虽不真实但合理的样本数量增加到了大约2/3(padding= 1),即使这样仍然有1/3(3000/10000)的样本是不合理的,这些样本会降低分类器的判别能力。再者,加余弦窗也不是“免费的”,余弦窗将图像块的边缘区域像素全部变成0,大量过滤掉分类器本来非常需要学习的背景信息,原本训练时判别器能看到的背景信息就非常有限,我们还加了个余弦窗挡住了背景,这样进一步降低了分类器的判别力(是不是上帝在我前遮住了帘。不是上帝,是余弦窗)。 检测阶段,相关滤波对快速运动的目标检测比较乏力。相关滤波训练的图像块和检测的图像块大小必须是一样的,这就是说你训练了一个100*100的滤波器,那你也只能检测100*100的区域,如果打算通过加更大的padding来扩展检测区域,那样除了扩展了复杂度,并不会有什么好处。目标运动可能是目标自身移动,或摄像机移动,按照目标在检测区域的位置分四种情况来看: 如果目标在中心附近,检测准确且成功。 如果目标移动到了边界附近但还没有出边界,加了余弦窗以后,部分目标像素会被过滤掉,这时候就没法保证这里的响应是全局最大的,而且,这时候的检测样本和训练过程中的那些不合理样本很像,所以很可能会失败。 如果目标的一部分已经移出了这个区域,而我们还要加余弦窗,很可能就过滤掉了仅存的目标像素,检测失败。 如果整个目标已经位移出了这个区域,那肯定就检测失败了。 以上就是边界效应(Boundary Effets),推荐两个主流的解决边界效应的方法,但速度比较慢,并不推荐用于实时场合。