jdk的Selector源代码分析(二)投票方式实现
1系列内容
- jdk Selector设计情况
- jdk nio poll在linux平台下的实现
- jdk nio epoll在linux平台下的实现
- netty 原生epoll在linux平台下的实现
- epoll的2种通知模式边缘触发、水平触发
2 linux的poll实现
linux中有系统调用poll方法,定义如下:
int poll (struct pollfd *fds, unsigned int nfds, int timeout);
上述pollfd结构体定义如下:
typedef struct pollfd {
int fd;
short events;
short revents;
} pollfd_t;
int fd:一个文件描述句柄,代表一个Channel连接
short events:该文件描述符感兴趣的事件,如POLLIN表示该文件描述符有读事件,POLLOUT表示该文件描述符可写。
short revents:代表该文件描述符当前已有的事件,如有读事件则值为POLLIN,有读写事件则为POLLIN和POLLOUT的并集
整体的意思就是:你指定了结构体列表的起始地址和要监控的结构体个数,linux系统就会为你在timeout时间内监控上述结构体列表中的文件描述符的相关事件,并把发生的事件写入到上述的short revents属性中。
所以我们在执行一次poll之后,要想获取所有的发生了事件的文件描述符,则需要遍历整个pollfd列表,依次判断上述的short revents是否不等于0,不等于0代表发生了事件。
3 jdk的poll实现概述
jdk要做的事情就是准备参数数据,然后去调用上述poll方法,这就要用到JNI来实现。jdk使用PollSelectorImpl来实现上述poll调用。
3.1 pollfd参数
jdk需要将java层面接收到的一个Channel连接映射到一个pollfd结构体,PollSelectorImpl针对此创建了一个AllocatedNativeObject 对象,该对象不是在堆中,它内部使用Unsafe类直接操作内存地址。它就是专门用来存放上述一个个pollfd结构体的内容,通过固定的offset来获取每个结构体的数据内容。
所以在调用上述poll方法的时候,直接传递的是AllocatedNativeObject对象的内存地址
注册Channel要做的事:其实就是将Channel的相关数据填充到上述AllocatedNativeObject的内存地址上,下次调用poll的时候,自然就会被监控
取消Channel注册要做的事:其实就是从上述AllocatedNativeObject的内存地址上移除该Channel代表的pollfd结构体
3.2 nfds参数
上述注册和移除的过程,都会改变目前已注册的Channel数目,这个已注册的数目就是要传递给poll的int nfds参数
4 PollSelectorImpl代码分析
上述过程就可以简单理解整个实现原理,下面来详细看看具体的代码是怎么写的
4.1 概述
PollSelectorImpl的创建过程如下:
PollSelectorImpl(SelectorProvider sp) {
super(sp, 1, 1);
long pipeFds = IOUtil.makePipe(false);
fd0 = (int) (pipeFds >>> 32);
fd1 = (int) pipeFds;
pollWrapper = new PollArrayWrapper(INIT_CAP);
pollWrapper.initInterrupt(fd0, fd1);
channelArray = new SelectionKeyImpl[INIT_CAP];
}
有如下2个内容
- 1 创建了pipe,得到读写文件描述符,并注册到了PollArrayWrapper中
- 2 创建了PollArrayWrapper
PollArrayWrapper pollWrapper:内部创建了一个上述介绍的AllocatedNativeObject对象(用于存放注册的Channel),而pollWrapper则更像是一个工具类,来方便的用户操作AllocatedNativeObject对象,pollWrapper把普通的操作都转化成对内存的操作,如下图所示
我们知道PollSelectorImpl在select过程的阻塞时间受控于所注册的Channel的事件,一旦有事件才会进行返回,没有事件的话就一直阻塞,为了可以允许手动控制这种局面的话,就额外增加了一个监控,即对pipe的读监控。对pipe的读文件描述符即fd0注册到PollArrayWrapper中的第一个位置,如果我们对pipe的写文件描述符fd1进行写数据操作,则pipe的读文件描述符必然会收到读事件,即可以使PollSelectorImpl不再阻塞,立即返回。
来看下初始化注册f0的代码
void initInterrupt(int fd0, int fd1) {
interruptFD = fd1;
putDescriptor(0, fd0);
putEventOps(0, POLLIN);
putReventOps(0, 0);
}
即将fd0存放到PollArrayWrapper的AllocatedNativeObject中,并关注POLLIN即读事件。并将pipe的写文件描述符保存到interruptFD属性中
Selector对外提供了wakeup方法,来看下PollSelectorImpl的实现
public void interrupt() {
interrupt(interruptFD);
}
private static native void interrupt(int fd);
这里就是对上述pipe的写文件描述符执行interrupt操作,来看看底层实现代码是:
JNIEXPORT void JNICALL
Java_sun_nio_ch_PollArrayWrapper_interrupt(JNIEnv *env, jobject this, jint fd)
{
int fakebuf[1];
fakebuf[0] = 1;
if (write(fd, fakebuf, 1) < 0) {
JNU_ThrowIOExceptionWithLastError(env,
"Write to interrupt fd failed");
}
}
这里就是简单的对pipe的写文件描述符写入数据用来触发pipe的读文件描述符的读事件而已。
至此,PollSelectorImpl的初始化过程就完成了。
4.2 注册和取消注册Channel过程
注册Channel其实就是向PollSelectorImpl中的PollArrayWrapper存放该Channel的fd、关注的事件信息,来看下实现代码
一点就是容量大了就需要进行对PollArrayWrapper中的AllocatedNativeObject进行扩容
另一点就是存储到PollArrayWrapper中的AllocatedNativeObject中,如下
void addEntry(SelChImpl sc) {
putDescriptor(totalChannels, IOUtil.fdVal(sc.getFD()));
putEventOps(totalChannels, 0);
putReventOps(totalChannels, 0);
totalChannels++;
}
存储的信息是:Channel的fd,关注的事件(初始是0)
而channel的关注事件是后来才设置到PollArrayWrapper的AllocatedNativeObject中的,见
pollWrapper.putEventOps(sk.getIndex(), ops);
void putEventOps(int i, int event) {
int offset = SIZE_POLLFD * i + EVENT_OFFSET;
pollArray.putShort(offset, (short)event);
}
不同的Selector实现,上述实现过程也是不一样的。
再来看看取消注册Channel
其实就是将最后一个直接覆盖到要删除的那个,以及更新相关数据的变化。
4.3 doSelect实现过程
如下图
第一步:就是处理那些取消了的Channel,即遍历Selector的Set<SelectionKey> cancelledKeys,依次调用他们的取消注册和其他逻辑
第二步:就是使用pollWrapper执行poll过程,该过程即是准备好参数,然后调用linux的系统调用poll方法,如下
int poll(int numfds, int offset, long timeout) {
return poll0(pollArrayAddress + (offset * SIZE_POLLFD),
numfds, timeout);
}
private native int poll0(long pollAddress, int numfds, long timeout);
这里将AllocatedNativeObject的内存地址作为pollAddress,已注册的所有的Channel的数量作为numfds,timeout是用户传递的参数,然后就开始JNI调用
再看下native方法实现
JNIEXPORT jint JNICALL
Java_sun_nio_ch_PollArrayWrapper_poll0(JNIEnv *env, jobject this,
jlong address, jint numfds,
jlong timeout)
{
struct pollfd *a;
int err = 0;
a = (struct pollfd *) jlong_to_ptr(address);
if (timeout <= 0) { /* Indefinite or no wait */
RESTARTABLE (poll(a, numfds, timeout), err);
} else { /* Bounded wait; bounded restarts */
err = ipoll(a, numfds, timeout);
}
if (err < 0) {
JNU_ThrowIOExceptionWithLastError(env, "Poll failed");
}
return (jint)err;
}
先将内存地址作为address转换成pollfd结构体地址,然后调用ipoll,在ipoll中我们就会见到linux的系统调用poll
static int
ipoll(struct pollfd fds[], unsigned int nfds, int timeout)
{
jlong start, now;
int remaining = timeout;
struct timeval t;
int diff;
gettimeofday(&t, NULL);
start = t.tv_sec * 1000 + t.tv_usec / 1000;
for (;;) {
int res = poll(fds, nfds, remaining);
if (res < 0 && errno == EINTR) {
if (remaining >= 0) {
gettimeofday(&t, NULL);
now = t.tv_sec * 1000 + t.tv_usec / 1000;
diff = now - start;
remaining -= diff;
if (diff < 0 || remaining <= 0) {
return 0;
}
start = now;
}
} else {
return res;
}
}
}
至此linux系统开始为上述所有的Channel进行监控事件。
在发生了事件之后,会有2次遍历所有注册的Channel集合:
一次就是在linux底层poll调用的时候会遍历,将产生的事件值存放到pollfd结构体的revents地址中
另一次就是在java层面,获取产生的事件时,会遍历上述每一个结构体,拿到revents地址中的数据
第三步:一旦第二步返回就说明有事件或者超时了,一旦有事件,则linux的poll调用会把产生的事件遍历的赋值到poll调用指定的地址上,即我们指定的一个个pollfd结构体,映射到java对象就是PollArrayWrapper的AllocatedNativeObject,这时候我们获取事件就是遍历底层的每一个地址,拿到pollfd结构体中的revents,如果revents不为0代表发生了事件,还要与Channel关注的事件进行相&操作,不为0代表发生了Channel关注的事件了,并清空pollfd结构体中的revents数据供下次使用,代码如下
这里就是通过指针操作直接获取对应底层结构体的revents数据。
第四步:上面提到了Selector也会注册一个fd用于监听,并且注册的位置时第一个即0,这里会取出该fd的发生事件,然后读取内容忽略掉即可,不然后仍然会触发该事件。代码如下
static native boolean drain(int fd)
JNIEXPORT jboolean JNICALL
Java_sun_nio_ch_IOUtil_drain(JNIEnv *env, jclass cl, jint fd)
{
char buf[128];
int tn = 0;
for (;;) {
int n = read(fd, buf, sizeof(buf));
tn += n;
if ((n < 0) && (errno != EAGAIN))
JNU_ThrowIOExceptionWithLastError(env, "Drain");
if (n == (int)sizeof(buf))
continue;
return (tn > 0) ? JNI_TRUE : JNI_FALSE;
}
}
5 结束语
下一篇就来详细介绍下jdk与linux的epoll对接实现
欢迎关注微信公众号:乒乓狂魔
推荐阅读
-
jdk的Selector源代码分析(二)投票方式实现
-
纯干货分享 | 研发效能提升——敏捷需求篇-而敏捷需求是提升效能的方式中不可或缺的模块之一。 云智慧的敏捷教练——Iris Xu近期在公司做了一场分享,主题为「敏捷需求挖掘和组织方法,交付更高业务价值的产品」。Iris具有丰富的团队敏捷转型实施经验,完成了企业多个团队从传统模式到敏捷转型的落地和实施,积淀了很多的经验。 这次分享主要包含以下2个部分: 第一部分是用户影响地图 第二部分是事件驱动的业务分析Event driven business analysis(以下简称EDBA) 用户影响地图,是一种从业务目标到产品需求映射的需求挖掘和组织的方法。 在软件开发过程中可能会遇到一些问题,比如大家使用不同的业务语言、技术语言,造成角色间的沟通阻碍,还会导致一些问题,比如需求误解、需求传递错误等;这会直接导致产品的功能需求和要实现的业务目标不是映射关系。 但在交付期间,研发人员必须要将这些需求实现交付,他们实则并不清楚这些功能需求产生的原因是什么、要解决客户的哪些痛点。研发人员往往只是拿到了解决方案,需要把它实现,但没有和业务侧一起去思考解决方案是否正确,能否真正的帮助客户解决问题。而用户影响地图通常是能够连接业务目标和产品功能的一种手段。 我们在每次迭代里加入的假设,也就是功能需求。首先把它先实现,再逐步去验证我们每一个小目标是否已经实现,再看下一个目标要是什么。那影响地图就是在这个过程中帮我们不断地去梳理目标和功能之间的关系。 我们在软件开发中可能存在的一些问题 针对这些问题,我们如何避免?先简单介绍做敏捷转型的常规思路: 先做团队级的敏捷,首先把产品、开发、测试人员,还有一些更后端的人员比如交互运维的同学放在一起,组成一个特训团队做交付。这个团队要包含交付过程中所涉及的所有角色。 接着业务敏捷要打通整个业务环节和研发侧的一个交付。上图中可以看到在敏捷中需求是分层管理的,第一层是业务需求,在这个层级是以用户目标和业务目标作为输入进行规划,同时需要去考虑客户的诉求。业务人员通过获取到的业务需求,进一步的和团队一起将其分解为产品需求。所以业务需求其实是我们真正去发布和运营的单元,它可以被独立发布到我们的生产环境上。我们的产品需求其实就是产品的具体功能,它是我们集成和测试的对象,也就是我们最终去部署到系统上的一个基本单元。产品需求再到了我们的开发团队,映射到迭代计划会上要把它分解为相应的技术任务,包括我们平时所说的比如一些前端的开发、后端的开发、测试都是相应的技术任务。所以业务敏捷要达到的目标是需要去持续顺畅高质量的交付业务价值。 将这几个点串起来,形成金字塔结构。最上层我们会把业务目标放在整个金字塔的塔尖。这个业务目标是通过用户的目标以及北极星指标确立的。确认业务目标后再去梳理相应的业务流程,最后生产。另外产品需求包含了操作流程和业务规则,具需求交付时间、工程时间以及我们的一些质量标准的要求。 谈到用户影响的地图,在敏捷江湖上其实有一个传说,大家都有一个说法叫做敏捷需求的“任督二脉”。用户影响地图其实就是任脉,在黑客马拉松上用过的用户故事地图其实叫督脉。所以说用户影响地图是在用户故事地图之前,先帮我们去梳理出我们要做哪些东西。当我们真正识别出我们要实现的业务活动之后,用户故事地图才去梳理我们整个的业务工作流,以及每个工作流节点下所要包含的具体功能和用户故事。所以说用户影响地图需要解决的问题,我们包括以下这些: 首先是范围蔓延,我们在整张地图上,功能和对应的业务目标是要去有一个映射的。这就避免了一些在我们比如有很多干系人参与的会议上,那大家都有不同想法些立场,会提出很多需求(正确以及错误的需求)。这个时候我们会依据目标去看这些需求是否真的是会影响我们的目标。 这里提到的错误需求,比如是利益相关的人提出的、客户认为产品应该有的、某个产品经理需求分析师认为可以有的....但是这些功能在用户影响地图中匹配不到对应目标的话,就需要降低优先级或弃掉。另外,通常我们去制定解决方案的时候,会考虑较完美的实现,导致解决方案括很多的功能。这个时候关键目标至关重要,会帮助我们梳理筛选、确定优先级。 看一下用户影响到地图概貌 总共分为一个三层的结构: 第一层why,你的业务目标哪个是最重要的,为什么?涉及到的角色有哪些? 第二层how ,怎样产生影响?影响用户角色什么样的行为? (不需要去列出所有的影响,基于业务目标) 第三层what,最关键的是在梳理需求时不需一次把所有细节想全,这通常团队中经常遇到的问题。 我们用这个例子来看一下 这是一个客服中心的影响地图,业务目标是 3个月内不增加客服人数的前提下能支持1.5倍的用户数。此业务目标设定是符合 smart 原则的,specific非常的具体,miserable 是可以衡量的,action reoriented是面向活动的, real list 也是很实际的。 量化的目标会指引我们接下来的行动,梳理一个业务目标,尽量去量化,比如 :我们通过打造一条什么样的流水线,能够提高整个部署的效率,时间是原来的 1/2 。这样才是一个能量化的有意义的目标。 回到这幅图, how 层级识别出来的内容,客服角色:想要对它施加的影响,把客户引导到论坛上,帮助客户更容易的跟踪问题,更快速的去定位问题。初级用户:方论坛上找到问题。高级用户:在论坛上回答问题。通过我们这些用户角色,进行活动,完成在不增加客户客服人数的前提下支持更多的用户数量。 最后一个层级,才是我们日常接触比较多的真正的功能的特性和需求,比如引导到客户到论坛上,其实这个产品就需要有一个常见问题的论坛的链接。这个层次需要我们团队进一步地在交付,在每个迭代之前做进一步的梳理,细化成相应的用户故事。 这个是云智慧团队中,自己做的影响地图的范例,可以看下整个的层级结构。序号表示优先级。 那我们用户影响地图可以总结为: