技术分享|RocketMQ 跨集群消息同步(消息路由)的实现与应用
一、背景
RocketMQ作为一款分布式的消息中间件,不管是采用Master/Slave的主从模式,还是采用Dledger的多副本模式,均保证了在同一个地域集群中的可靠性和可用性。但不同RocketMQ集群的Broker之间无法进行数据备份,如果单个资源池中的RocketMQ集群出现机房毁坏、磁盘故障、服务器损毁等非可预见性重大问题时,就会导致整个集群的可靠性失效。
另一方面,随着消息队列RocketMQ陆续在上海、苏州、郑州等节点上线,RocketMQ得到了大范围应用。用户在使用过程中,可能存在跨资源池消息消费的业务需求,如业务系统A作为Producer部署于华东资源池,业务系统B作为Consumer部署于华北资源池,A发送消息需要B来进行消费。
基于以上两点,我们设计并实现了RocketMQ消息路由功能,即通过路由规则动态规划消息的传输路径,使消息按照过滤条件,从消息源节点路由到目标节点。RocketMQ消息路由(RocketMQ Connect)打通了多个地域RocketMQ集群之间的消息互通,使消息能够按照过滤规则从源集群同步到目标集群 ,高效地实现了分布在不同地域之间的RocketMQ集群的消息同步复制,保证地域之间的数据一致性。
二、方案实现
在现有的主流消息中间件中,如Pulsar、Kafka都有提供消息跨集群同步功能的实现方案。
2.1 Pulsar的Geo跨机房消息复制方案
Geo replication是消息队列Pulsar的一种跨机房复制方案,把分散在不同地域的集群通过一定的配置方式,让各集群之间可以相互复制。Geo replication工作原理是在Broker内部,为跨地域的数据复制启动了一组内嵌的额外的生产者和消费者。当一方集群消息被产生后,内嵌的消费者会读取消息,读取完成后,调用内嵌的生产者将消息立即发送到另一方集群。
(图片源自网络)http://pulsar.apache.org/docs/en/administration-geo/
2.2 Kafka的MirrorMaker跨集群消息复制方案
MirrorMaker是消息队列Kafka自带的集群镜像工具,用来实现Kafka集群间的数据同步。MirrorMaker包含了一组消费者,并为每个消费者分配一个线程,这些消费者属于同一个Group,从多个Topic上读取数据,所有的Topic均使用该Group进行消息消费,每个MirrorMaker进程仅有一个生产者,该生产者将数据发送到目标集群上。在数据同步过程中,可以启动多个MirrorMaker进程,即使某个进程挂掉,Topic的同组消费者也可以进行Rebalance,提高容错性。
和上述两种跨集群消息复制方案原理类似,RocketMQ遵循了OpenMessaging Connect规范,通过一个第三方消息中间件对消息进行生产和消费来实现源和目标集群消息的同步。
三、OpenMessaging Connect
OpenMessaging是消息中间件领域和流计算领域的一个消息规范,旨在创立与厂商无关、平台无关的分布式消息及流处理领域的应用开发标准。同其他标准(MQTT、JMS、AMQP)不同的是OpenMessaging不仅仅提供了领域模型,还提供了消息领域几种常见的接口(OMOI、OMRI、OMSI、OMCI、OMBI),旨在与其他的生态打通。OpenMessaging Connect的整体目标是解决不同源之间的异构数据拷贝问题,它解决的思路是在各个数据源之间加一层消息中间件,所有的数据都经过消息中间件进行存储和分发。
OpenMessaging作为分布式消息传递的开放标准,其他支持OpenMessaging的消息中间件只需要实现相应的接口就会具有Connect的能力。下文提到的RocketMQ Connect就是OpenMessaging Connect的一个实现,但和上面不一样的是,RocketMQ Connect需要同步的双方是同构数据源,都是RocketMQ集群。
从整体架构上来说,OpenMessaging Connect包含了三个重要的领域模型:Connector、Worker以及Runtime,分别抽象了数据解析,服务运行以及服务调度等具体逻辑。
Connector从整体上规定了一个数据同步服务的生命周期以及拆解了数据同步的具体阶段,其中包含两个核心概念,Source Connector以及Sink Connector,Source负责将数据从源集群数据同步到消息中间件,Sink则负责将数据从消息中间件提取到目标集群。Connector可以创建和管理多个任务(Task),每一个Task执行具体的数据解析和转储任务;
Worker抽象了Connector的运行环境,是所有Connector任务调度的基础。一个Worker可以理解为一个进程,Connector和Task都运行在Worker之上。
Runtime 为Connector提供了高可用,可伸缩,快速容错保障,是所有connector运行的调度中心,为其上运行的各种类型Connector及其关联的Task任务提供统一的运行时环境(包括负载均衡,实例间的调度,配置管理以及集群管理)。
四、RocketMQ Connect
RocketMQ Connect(RocketMQ消息路由)遵循OpenMessaging Connect的设计理念,依托RocketMQ实现。主要包括Replicator以及Runtime,Replicator是运行在RocketMQ Runtime上的消息同步Connector,其主要实现了Connector的机制,能够同步两个独立RocketMQ集群之间的消息 。Runtime是Replicator的运行时环境,负责加载SourceConnector、SinkConnector,并提供RESTful接口,启动Task任务 ,同时,它也是一个分布式系统,支持集群节点之间的服务发现、配置同步、负载均衡等功能,总体架构如下:
在Runtime进程组成的集群中,将源RocketMQ集群各个用户创建Topic中的业务数据,通过端到端Replicator和Task以数据解析和转储的方式异步复制至目标RocketMQ集群,完成跨消息队列集群的消息复制和备份。其中Runtime集群中每个Worker节点启动Replicator相关的配置信息,也会像集群信息一样在集群中每个节点全量同步,同时会持久化到每个节点。集群中如果有某个Worker节点挂掉,集群信息会发生变化,当每个节点检查到集群信息发生了变化就会触发负载均衡,对集群中运行的Replicator和Task重新分配,从而保证故障节点的任务分配到其它节点处理,保证高可用。
4.1 RocketMQ Runtime
Runtime为Connector提供了高可用,可伸缩,快速容错保障,是所有Connector运行的调度中心,负责将不同的数据同步任务均衡的调度到不同的Worker上执行,其核心类如下所示:
Runtime启动后,运行Connector所需的所有环境,包含多个模块。首先,Runtime集群配置相关的实现都在ConfigManagementService中,当有新的节点上线会将其配置发送到RocketMQ进行全量同步,以便其他节点获取并更新配置。每个Runtime在参数storePathRootDir所指定的本地文件夹中都会有四个配置文件,其中connectorConfig.json包含了当前Connector运行的Topic、集群和任务等信息,taskConfig.json中保存了Task执行的具体任务配置。PositionManagementSevice和OffsetManagementSevice是一对相互的服务,分别对应SourceConnector和SinkConenctor的处理进度。RestHandler采用Javalin(用于Java和Kotlin的轻量级Web框架)内置了一系列RESTful接口,负责Connector的创建、停止以及获取Runtime集群的节点和负载信息。RebalanceService负载均衡服务与RocketMQ Consumer以及Queue之间的负载均衡类似,每个节点都运行相同的负载均衡算法来计算该节点应该处理的Task。Runtime启动流程各模块执行流程如下:
4.2 RocketMQ Replicator
Replicator是运行在RocketMQ Runtime上的RocketMQ集群消息同步Connector的别称,其主要功能从源RocketMQ集群同步指定Topic消息数据到目标RocketMQ集群中。在消息同步的过程中,Replicator首先会加载到Runtime中,然后通过Runtime提供的RESTful接口来创建新的Replicator实例和同步Task来实现源和目标RocketMQ集群消息的同步。具体步骤如下:
1、调用Runtime提供的/connectors/:connectorName?config={config}接口发送创建Connector请求,请求参数如下:
2、参数配置过程中,读取接口中目标和源的集群信息(如Namesrv地址,需要同步消息的Topic、消息同步过滤规则等)添加到ConnectorConfig中, 加载Repliactor实现的类文件,同步Repliactor配置和Task配置。
3、触发Connector配置更新,从而触发负载均衡,并启动对应的Task执行消息数据的读取和写入。相关时序图如下:
目前RocketMQ消息路由功能已成功上线,方便用户在不同资源池之间按需同步消息,实现数据跨资源池的一致性。
END
作者简介
章及第
中国移动云能力中心中间件产品组开发工程师,中移云消息队列RocketMQ研发负责人,负责中移云RocketMQ产品设计、开发和维护工作。
推荐阅读
-
技术分享|RocketMQ 跨集群消息同步(消息路由)的实现与应用
-
windows下进程间通信的(13种方法)-摘 要 本文讨论了进程间通信与应用程序间通信的含义及相应的实现技术,并对这些技术的原理、特性等进行了深入的分析和比较。 ---- 关键词 信号 管道 消息队列 共享存储段 信号灯 远程过程调用 Socket套接字 MQSeries 1 引言 ---- 进程间通信的主要目的是实现同一计算机系统内部的相互协作的进程之间的数据共享与信息交换,由于这些进程处于同一软件和硬件环境下,利用操作系统提供的的编程接口,用户可以方便地在程序中实现这种通信;应用程序间通信的主要目的是实现不同计算机系统中的相互协作的应用程序之间的数据共享与信息交换,由于应用程序分别运行在不同计算机系统中,它们之间要通过网络之间的协议才能实现数据共享与信息交换。进程间通信和应用程序间通信及相应的实现技术有许多相同之处,也各有自己的特色。即使是同一类型的通信也有多种的实现方法,以适应不同情况的需要。 ---- 为了充分认识和掌握这两种通信及相应的实现技术,本文将就以下几个方面对这两种通信进行深入的讨论:问题的由来、解决问题的策略和方法、每种方法的工作原理和实现、每种实现方法的特点和适用的范围等。 2 进程间的通信及其实现技术 ---- 用户提交给计算机的任务最终都是通过一个个的进程来完成的。在一组并发进程中的任何两个进程之间,如果都不存在公共变量,则称该组进程为不相交的。在不相交的进程组中,每个进程都独立于其它进程,它的运行环境与顺序程序一样,而且它的运行环境也不为别的进程所改变。运行的结果是确定的,不会发生与时间相关的错误。 ---- 但是,在实际中,并发进程的各个进程之间并不是完全互相独立的,它们之间往往存在着相互制约的关系。进程之间的相互制约关系表现为两种方式: ---- (1) 间接相互制约:共享CPU ---- (2) 直接相互制约:竞争和协作 ---- 竞争——进程对共享资源的竞争。为保证进程互斥地访问共享资源,各进程必须互斥地进入各自的临界段。 ---- 协作——进程之间交换数据。为完成一个共同任务而同时运行的一组进程称为同组进程,它们之间必须交换数据,以达到协作完成任务的目的,交换数据可以通知对方可以做某事或者委托对方做某事。 ---- 共享CPU问题由操作系统的进程调度来实现,进程间的竞争和协作由进程间的通信来完成。进程间的通信一般由操作系统提供编程接口,由程序员在程序中实现。UNIX在这个方面可以说最具特色,它提供了一整套进程间的数据共享与信息交换的处理方法——进程通信机制(IPC)。因此,我们就以UNIX为例来分析进程间通信的各种实现技术。 ---- 在UNIX中,文件(File)、信号(Signal)、无名管道(Unnamed Pipes)、有名管道(FIFOs)是传统IPC功能;新的IPC功能包括消息队列(Message queues)、共享存储段(Shared memory segment)和信号灯(Semapores)。 ---- (1) 信号 ---- 信号机制是UNIX为进程中断处理而设置的。它只是一组预定义的值,因此不能用于信息交换,仅用于进程中断控制。例如在发生浮点错、非法内存访问、执行无效指令、某些按键(如ctrl-c、del等)等都会产生一个信号,操作系统就会调用有关的系统调用或用户定义的处理过程来处理。 ---- 信号处理的系统调用是signal,调用形式是: ---- signal(signalno,action) ---- 其中,signalno是规定信号编号的值,action指明当特定的信号发生时所执行的动作。 ---- (2) 无名管道和有名管道 ---- 无名管道实际上是内存中的一个临时存储区,它由系统安全控制,并且独立于创建它的进程的内存区。管道对数据采用先进先出方式管理,并严格按顺序操作,例如不能对管道进行搜索,管道中的信息只能读一次。 ---- 无名管道只能用于两个相互协作的进程之间的通信,并且访问无名管道的进程必须有共同的祖先。 ---- 系统提供了许多标准管道库函数,如: pipe——打开一个可以读写的管道; close——关闭相应的管道; read——从管道中读取字符; write——向管道中写入字符; ---- 有名管道的操作和无名管道类似,不同的地方在于使用有名管道的进程不需要具有共同的祖先,其它进程,只要知道该管道的名字,就可以访问它。管道非常适合进程之间快速交换信息。 ---- (3) 消息队列(MQ) ---- 消息队列是内存中独立于生成它的进程的一段存储区,一旦创建消息队列,任何进程,只要具有正确的的访问权限,都可以访问消息队列,消息队列非常适合于在进程间交换短信息。 ---- 消息队列的每条消息由类型编号来分类,这样接收进程可以选择读取特定的消息类型——这一点与管道不同。消息队列在创建后将一直存在,直到使用msgctl系统调用或iqcrm -q命令删除它为止。 ---- 系统提供了许多有关创建、使用和管理消息队列的系统调用,如: ---- int msgget(key,flag)——创建一个具有flag权限的MQ及其相应的结构,并返回一个唯一的正整数msqid(MQ的标识符); ---- int msgsnd(msqid,msgp,msgsz,msgtyp,flag)——向队列中发送信息; ---- int msgrcv(msqid,cmd,buf)——从队列中接收信息; ---- int msgctl(msqid,cmd,buf)——对MQ的控制操作; ---- (4) 共享存储段(SM) ---- 共享存储段是主存的一部分,它由一个或多个独立的进程共享。各进程的数据段与共享存储段相关联,对每个进程来说,共享存储段有不同的虚拟地址。系统提供的有关SM的系统调用有: ---- int shmget(key,size,flag)——创建大小为size的SM段,其相应的数据结构名为key,并返回共享内存区的标识符shmid; ---- char shmat(shmid,address,flag)——将当前进程数据段的地址赋给shmget所返回的名为shmid的SM段; ---- int shmdr(address)——从进程地址空间删除SM段; ---- int shmctl (shmid,cmd,buf)——对SM的控制操作; ---- SM的大小只受主存限制,SM段的访问及进程间的信息交换可以通过同步读写来完成。同步通常由信号灯来实现。SM非常适合进程之间大量数据的共享。 ---- (5) 信号灯 ---- 在UNIX中,信号灯是一组进程共享的数据结构,当几个进程竞争同一资源时(文件、共享内存或消息队列等),它们的操作便由信号灯来同步,以防止互相干扰。 ---- 信号灯保证了某一时刻只有一个进程访问某一临界资源,所有请求该资源的其它进程都将被挂起,一旦该资源得到释放,系统才允许其它进程访问该资源。信号灯通常配对使用,以便实现资源的加锁和解锁。 ---- 进程间通信的实现技术的特点是:操作系统提供实现机制和编程接口,由用户在程序中实现,保证进程间可以进行快速的信息交换和大量数据的共享。但是,上述方式主要适合在同一台计算机系统内部的进程之间的通信。 3 应用程序间的通信及其实现技术 ---- 同进程之间的相互制约一样,不同的应用程序之间也存在竞争和协作的关系。UNIX操作系统也提供一些可用于应用程序之间实现数据共享与信息交换的编程接口,程序员可以通过自己编程来实现。如远程过程调用和基于TCP/IP协议的套接字(Socket)编程。但是,相对普通程序员来说,它们涉及的技术比较深,编程也比较复杂,实现起来困难较大。 ---- 于是,一种新的技术应运而生——通过将有关通信的细节完全掩盖在某个独立软件内部,即底层的通讯工作和相应的维护管理工作由该软件内部来实现,用户只需要将通信任务提交给该软件去完成,而不必理会它的具体工作过程——这就是所谓的中间件技术。 ---- 我们在这里分别讨论这三种常用的应用程序间通信的实现技术——远程过程调用、会话编程技术和MQSeries消息队列技术。其中远程过程调用和会话编程属于比较低级的方式,程序员参与的程度较深,而MQSeries消息队列则属于比较高级的方式,即中间件方式,程序员参与的程度较浅。 ---- 4.1 远程过程调用(RPC)