ETCD(3):多节点集群部署
最编程
2024-05-03 12:50:28
...
0. 引入
在实际生产环境中,为了整个集群的高可用,etcd通常都会以集群方式部署,以避免单点故障。
etcd构建自身高可用集群主要有三种形式:
-
静态配置
:预先已知etcd集群中有哪些节点,在启动时通过--initial-cluster参数直接指定好各节点地址 -
etcd动态发现
:静态配置前提是在搭建集群之前已经提前知道各节点的信息,而实际应用中可能存在预先并不知道各节点ip的情况,这时可通过已经搭建的etcd来辅助搭建新的etcd集群。通过已有的etcd集群作为数据交互点,在扩展新的集群时,通过已有集群进行服务发现的机制。 -
DNS动态发现
:通过DNS查询方式获取其他节点地址信息
以下内容都是在三台虚拟机上运行
name | ip |
---|---|
infra1 | 192.168.99.131 |
infra2 | 192.168.99.132 |
infra3 | 192.168.99.133 |
1. 静态配置
#etcd1
etcd --name infra1 --listen-client-urls http://192.168.99.131:2379 --advertise-client-urls http://192.168.99.131:2379 --listen-peer-urls http://192.168.99.131:2380 --initial-advertise-peer-urls http://192.168.99.131:2380 --initial-cluster-token etcd-cluster-1 --initial-cluster 'infra1=http://192.168.99.131:2380,infra2=http://192.168.99.132:2380,infra3=http://192.168.99.133:2380' --initial-cluster-state new
#etcd2
etcd --name infra2 --listen-client-urls http://192.168.99.132:2379 --advertise-client-urls http://192.168.99.132:2379 --listen-peer-urls http://192.168.99.132:2380 --initial-advertise-peer-urls http://192.168.99.132:2380 --initial-cluster-token etcd-cluster-1 --initial-cluster 'infra1=http://192.168.99.131:2380,infra2=http://192.168.99.132:2380,infra3=http://192.168.99.133:2380' --initial-cluster-state new
#etcd3
etcd --name infra3 --listen-client-urls http://192.168.99.133:2379 --advertise-client-urls http://192.168.99.133:2379 --listen-peer-urls http://192.168.99.133:2380 --initial-advertise-peer-urls http://192.168.99.133:2380 --initial-cluster-token etcd-cluster-1 --initial-cluster 'infra1=http://192.168.99.131:2380,infra2=http://192.168.99.132:2380,infra3=http://192.168.99.133:2380' --initial-cluster-state new
访问任意一个etcd server获取集群member信息
etcdctl --endpoints=192.168.99.131:2379 member list
2. etcd动态发现
使用已有的 etcd cluster 来注册和启动
实现机制
Discovery Service Protocol
帮助新的Etcd成员使用共享URL在集群引导阶段发现其他成员。该协议使用新的发现令牌来引导一个唯一的etcd集群,一个发现令牌只能代表一个etcd集群,只要此令牌上的发现协议启动,即使它中途失败,也不能用于引导另一个etcd集群。
协议的工作流程
Discovery protocol 使用内部etcd集群来协调新集群的引导程序。首先,所有新成员都与发现服务交互,并帮助生成预期的成员列表。然后每个新成员使用此列表引导其服务器,该列表执行与--initial-cluster标志相同的功能,即设置所有集群的成员信息。
Discovery service protocol 仅用于集群引导阶段,不能用于运行时重新配置或集群监视。
先使用公共etcd发现服务生成url
$ curl https://discovery.etcd.io/new?size=3
https://discovery.etcd.io/21c592d56701d2d081f78277348e87b8
#etcd1
etcd --name infra1 --listen-client-urls http://192.168.99.131:2379,http://127.0.0.1:2379 --advertise-client-urls http://192.168.99.131:2379 --listen-peer-urls http://192.168.99.131:2380 --initial-advertise-peer-urls http://192.168.99.131:2380 --discovery https://discovery.etcd.io/21c592d56701d2d081f78277348e87b8
#etcd2
etcd --name infra2 --listen-client-urls http://192.168.99.132:2379,http://127.0.0.1:2379 --advertise-client-urls http://192.168.99.132:2379 --listen-peer-urls http://192.168.99.132:2380 --initial-advertise-peer-urls http://192.168.99.132:2380 --discovery https://discovery.etcd.io/21c592d56701d2d081f78277348e87b8
#etcd3
etcd --name infra3 --listen-client-urls http://192.168.99.133:2379,http://127.0.0.1:2379 --advertise-client-urls http://192.168.99.133:2379 --listen-peer-urls http://192.168.99.133:2380 --initial-advertise-peer-urls http://192.168.99.133:2380 --discovery https://discovery.etcd.io/21c592d56701d2d081f78277348e87b8
获取节点列表,由于我们在listen-client-urls中添加了127.0.0.1,所以不用添加endpoints
etcdctl member list
3.DNS动态发现
略
推荐阅读
-
etcd v3 集群备份和恢复
-
ETCD(3):多节点集群部署
-
纯干货分享 | 研发效能提升——敏捷需求篇-而敏捷需求是提升效能的方式中不可或缺的模块之一。 云智慧的敏捷教练——Iris Xu近期在公司做了一场分享,主题为「敏捷需求挖掘和组织方法,交付更高业务价值的产品」。Iris具有丰富的团队敏捷转型实施经验,完成了企业多个团队从传统模式到敏捷转型的落地和实施,积淀了很多的经验。 这次分享主要包含以下2个部分: 第一部分是用户影响地图 第二部分是事件驱动的业务分析Event driven business analysis(以下简称EDBA) 用户影响地图,是一种从业务目标到产品需求映射的需求挖掘和组织的方法。 在软件开发过程中可能会遇到一些问题,比如大家使用不同的业务语言、技术语言,造成角色间的沟通阻碍,还会导致一些问题,比如需求误解、需求传递错误等;这会直接导致产品的功能需求和要实现的业务目标不是映射关系。 但在交付期间,研发人员必须要将这些需求实现交付,他们实则并不清楚这些功能需求产生的原因是什么、要解决客户的哪些痛点。研发人员往往只是拿到了解决方案,需要把它实现,但没有和业务侧一起去思考解决方案是否正确,能否真正的帮助客户解决问题。而用户影响地图通常是能够连接业务目标和产品功能的一种手段。 我们在每次迭代里加入的假设,也就是功能需求。首先把它先实现,再逐步去验证我们每一个小目标是否已经实现,再看下一个目标要是什么。那影响地图就是在这个过程中帮我们不断地去梳理目标和功能之间的关系。 我们在软件开发中可能存在的一些问题 针对这些问题,我们如何避免?先简单介绍做敏捷转型的常规思路: 先做团队级的敏捷,首先把产品、开发、测试人员,还有一些更后端的人员比如交互运维的同学放在一起,组成一个特训团队做交付。这个团队要包含交付过程中所涉及的所有角色。 接着业务敏捷要打通整个业务环节和研发侧的一个交付。上图中可以看到在敏捷中需求是分层管理的,第一层是业务需求,在这个层级是以用户目标和业务目标作为输入进行规划,同时需要去考虑客户的诉求。业务人员通过获取到的业务需求,进一步的和团队一起将其分解为产品需求。所以业务需求其实是我们真正去发布和运营的单元,它可以被独立发布到我们的生产环境上。我们的产品需求其实就是产品的具体功能,它是我们集成和测试的对象,也就是我们最终去部署到系统上的一个基本单元。产品需求再到了我们的开发团队,映射到迭代计划会上要把它分解为相应的技术任务,包括我们平时所说的比如一些前端的开发、后端的开发、测试都是相应的技术任务。所以业务敏捷要达到的目标是需要去持续顺畅高质量的交付业务价值。 将这几个点串起来,形成金字塔结构。最上层我们会把业务目标放在整个金字塔的塔尖。这个业务目标是通过用户的目标以及北极星指标确立的。确认业务目标后再去梳理相应的业务流程,最后生产。另外产品需求包含了操作流程和业务规则,具需求交付时间、工程时间以及我们的一些质量标准的要求。 谈到用户影响的地图,在敏捷江湖上其实有一个传说,大家都有一个说法叫做敏捷需求的“任督二脉”。用户影响地图其实就是任脉,在黑客马拉松上用过的用户故事地图其实叫督脉。所以说用户影响地图是在用户故事地图之前,先帮我们去梳理出我们要做哪些东西。当我们真正识别出我们要实现的业务活动之后,用户故事地图才去梳理我们整个的业务工作流,以及每个工作流节点下所要包含的具体功能和用户故事。所以说用户影响地图需要解决的问题,我们包括以下这些: 首先是范围蔓延,我们在整张地图上,功能和对应的业务目标是要去有一个映射的。这就避免了一些在我们比如有很多干系人参与的会议上,那大家都有不同想法些立场,会提出很多需求(正确以及错误的需求)。这个时候我们会依据目标去看这些需求是否真的是会影响我们的目标。 这里提到的错误需求,比如是利益相关的人提出的、客户认为产品应该有的、某个产品经理需求分析师认为可以有的....但是这些功能在用户影响地图中匹配不到对应目标的话,就需要降低优先级或弃掉。另外,通常我们去制定解决方案的时候,会考虑较完美的实现,导致解决方案括很多的功能。这个时候关键目标至关重要,会帮助我们梳理筛选、确定优先级。 看一下用户影响到地图概貌 总共分为一个三层的结构: 第一层why,你的业务目标哪个是最重要的,为什么?涉及到的角色有哪些? 第二层how ,怎样产生影响?影响用户角色什么样的行为? (不需要去列出所有的影响,基于业务目标) 第三层what,最关键的是在梳理需求时不需一次把所有细节想全,这通常团队中经常遇到的问题。 我们用这个例子来看一下 这是一个客服中心的影响地图,业务目标是 3个月内不增加客服人数的前提下能支持1.5倍的用户数。此业务目标设定是符合 smart 原则的,specific非常的具体,miserable 是可以衡量的,action reoriented是面向活动的, real list 也是很实际的。 量化的目标会指引我们接下来的行动,梳理一个业务目标,尽量去量化,比如 :我们通过打造一条什么样的流水线,能够提高整个部署的效率,时间是原来的 1/2 。这样才是一个能量化的有意义的目标。 回到这幅图, how 层级识别出来的内容,客服角色:想要对它施加的影响,把客户引导到论坛上,帮助客户更容易的跟踪问题,更快速的去定位问题。初级用户:方论坛上找到问题。高级用户:在论坛上回答问题。通过我们这些用户角色,进行活动,完成在不增加客户客服人数的前提下支持更多的用户数量。 最后一个层级,才是我们日常接触比较多的真正的功能的特性和需求,比如引导到客户到论坛上,其实这个产品就需要有一个常见问题的论坛的链接。这个层次需要我们团队进一步地在交付,在每个迭代之前做进一步的梳理,细化成相应的用户故事。 这个是云智慧团队中,自己做的影响地图的范例,可以看下整个的层级结构。序号表示优先级。 那我们用户影响地图可以总结为:
-
2019 年倾斜摄影 3D 建模 - 桌面、便携式、多集群配置建议
-
云服务器+家用电脑(无公网 IP)Pinode 节点部署教程--理论上,无论你身在何处,只要能上网,就能运行一个固定 IP 的 Pi 节点节点!(注:不能直接部署独立云服务器)本方案相对运营商公网 IP 有以下优势:拥有稳定的固定 IP(阿里云 IP),解决了运营商不分配公网 IP 或分配动态 IP 的问题 ②节点部署在本地电脑上,相对安全。因为是使用阿里云的专网,稳定性也很强。希望对大家有用,帮助大家解决没有公网的节点部署问题。第一步:环境准备 1、本地电脑配置: ①操作系统:推荐 WIN10 专业版(目前节点容器只支持 2004 专业版) ②内存:推荐 4G 及以上 建议:https://item.taobao.com/item.htm?spm=a2126o.success.0.0.61 b94831SbZESt&id=6346663414282,阿里云服务器租用:阿里云(推荐1核2G以上,ECS共享s6,带宽3-5M即可,以下两个链接都可以,选择一个合适的即可)https://www.aliyun.com/minisite/ goods?userCode=is7i4iav
-
趣谈留言队列,搞清楚留言队列到底是什么!-说到消息队列,洪觉大概能猜到人们听到消息队列的反应,大致可以分为以下几类人。 第一类人,懵懵懂懂,刚上大学接触编程,还没用过消息队列,甚至还以为消息队列就是代码里面要新建一个List之类的;第二类人,听过消息队列,了解消息队列,但具体是什么还不是太明白,只知道一说到消息队列,脑海里马上出现了三组词,削峰、异步、解耦;第三类人,用过消息队列,对它有一定了解,但不知道为什么要这样设计,消息队列有什么样的前世今生,是如何演化到现在的模式的?**第四类人,已经对消息队列有了足够的了解,可以阅读本帖作为复习和温习。**你属于哪一类?无论你对消息队列了解多少,读完这篇文章后,我相信你都会有所收获。 什么是消息队列?我们为什么要使用消息队列?真的只是因为它看起来很勉强、很常用吗?当然不是,一项技术的出现往往是为了解决某种痛点,我们就从这个痛点出发,看看消息队列到底是为了解决什么问题而诞生的。 相信大家在工作之前,或者工作中接触单片机的次数会多一点,不管什么业务都一股脑塞进一个系统里,这种情况下接触消息队列的场景会比较少。但随着业务的增长,量上去了,单机系统就很难维护了,也扛不住并发量的增长,就需要把原来的单体应用拆分成多个服务。例如,牛奇网采用分布式架构,将原来的单体系统拆分成用户服务、题库服务、求职服务、论坛服务等,每个分布式节点都有一个集群,保证高可用性。 那虽然在这样的微服务架构下,如果某个核心业务并发量过大,系统就扛不住了。比如淘宝、淘票票、拼多多、京东等电商场景中的支付场景,你在某宝下单并支付后,调用支付服务,完成支付后,还需要更新订单的状态,这个时候就需要调用订单服务,那我们平时也下单,除了简单完成这些操作外,还会给你相应的积分;商家也会收到订单消息,并给您发送旺旺消息,确认订单无误;同时,也会给您发送消息,确认订单无误。确认订单无误;同时您还可以查看您的物流状态;还有系统为了给您推荐更适合您的商品,会根据您的订单做类似的推荐等等,我说的这些都是当我们下单后,肉眼可以感知到系统所做的动作。 **一个支付动作如果还需要调用那么多服务,等他们响应成功,最后再告诉用户你支付成功了,用户在系统中的整个体验会非常糟糕。**设想一下,假设请求服务+处理请求+响应总共需要 50ms,我们上面列出的场景:支付服务、订单服务、积分服务、商家服务、物流服务、推荐服务,总共需要 300ms。
-
阿里巴巴 NACOS (3) - 为 Nacos 部署生产集群环境
-
实战!Kubernetes(k8s)企业级Docker容器集群管理——四步部署master/node节点组件
-
如何使用 kube-vip 实现 K3s 集群的高可用部署
-
Hadoop 3.x 学习心得:第六章 - 高可用性集群的部署