深入理解仿函数(函数对象)
在C语言中我们是如何实现函数的传递呢?
没错就是函数指针!
template<class T>
void Say(T a)
{
cout << a << endl;
}
void All_Fuc(int arr[], int len,void(*say)(int))
{
for (int i = 0; i < len; i++)
say(arr[i]);
}
int main()
{
int arr[5] = { 1, 2, 3, 4, 5 };
All_Fuc(arr,5,Say);
return 0;
}
在C++中我们又可以如何去实现仿函数呢?
那就是仿函数(函数符、函数对象).
如何实现呢?
如果我们在一个类中重载了()运算符。那么这个类的对象就可以像调用函数一样去调用 。
template<class T>
class Say
{
public:
void operator() (T a)
{
cout << a << endl;
}
};
template<class T>
void All_Fuc(int arr[], int len,T func)
{
for (int i = 0; i < len; i++)
func(arr[i]);
}
int main()
{
int arr[5] = { 1, 2, 3, 4, 5 };
All_Fuc(arr, 5, Say<int>());
return 0;
}
当然大家可以看到以上两段代码中除了函数的定义方式不一样(一个是用的函数,一个是用的类重载() ), 在主函数中调用的时候也有一点点小区别,就是在传递的时候。如果是函数指针我们写的是函数名Say,但是如果是仿函数我们写的是Say<int>().其实相当于传递的是一个临时对象进去。
好,在上面两个例子中大家已经能够知道什么是仿函数,以及仿函数定义出来如何使用。那么现在问题来了,为什么要使用仿函数呢?它和普通函数区别在哪儿呢?
一.仿函数和普通函数的区别
仿函数是“smart functions”(智能型函数),一般来说我们让一个函数保存状态。使得每次调用函数会因状态不同而执行效果不同。我们一般的做法都是在函数内部定义static变量。但是这是全局变量!所以说,如果使用仿函数,其状态完全可以由自身的一个成员变量来记录。事实上,你还可以在程序中同时拥有两种状态的实体,而这个是用普通函数无法实现的。
template<class T>
class Functor
{
public:
enum Type{Plus,Sub};
Functor(Type t = Plus) :type(t){}
T operator()(T a, T b)
{
if (type == Plus) return a + b;
return a - b;
}
private:
Type type;
};
int main()
{
//同时定义了一个加法器和一个减法器。
Functor<int> plus(Functor<int>::Plus);
Functor<int> sub(Functor<int>::Sub);
int a = 5, b = 3;
cout << plus(a, b) << endl;
cout << sub(a, b) << endl;
return 0;
}
当然不是任何时候使用这种特效都是很好的。换句话就是说尽量不要在重载()函数中去改变对象的状态。我们通过举例来看:
class Average
{
public:
Average():count(0), sum(0){ }
void operator()(double num) //每次调用这个仿函数就相当于往里面添加了一个数
{
count++;
sum += num;
}
double GetAverage(){ return sum / count; } //最后由这个方法得到当前的平均值
private:
int count;
double sum;
};
template < class T ,class F>
void For_each(T begin, T end, F functor) //这是一个手动实现的一个简单的for_each.
{
for (T it = begin; it != end; it++)
functor(*it);
}
int main()
{
vector<int> arr = { 1, 2, 3, 4, 5 };
Average result;
For_each(arr.begin(), arr.end(), result);
cout << result.GetAverage() << endl;
return 0;
}
很显然,代码企图用Average和For_each达到对Vector中的元素求平均值的功能,但是事实上我们运行出来的结果是-1.#IND(不同的编译器可能不同,有的可能会直接运行错误)其实意思就是发生了0除。为什么为这样呢?其实原因很简单,就是我们的
For_each是使用的值传递而非引用。因为我们的仿函数调用的时候会改变对象内部的count和sum两个值的变化。那么在For_each改变的functor并没有带到main的result中。所以解决方法有两种:一.是使用引用,二.将functor返回出来。
这里提供第二个方法的实现(库函数的for_each也正是这样实现的):
class Average
{
//同上
};
template < class T ,class F>
F For_each(T begin, T end, F functor)
{
for (T it = begin; it != end; it++)
functor(*it);
return functor;
}
int main()
{
vector<int> arr = { 1, 2, 3, 4, 5 };
Average result = For_each(arr.begin(), arr.end(), Average()); //这里的Average()相当于一个临时对象
cout << result.GetAverage() << endl;
return 0;
}
我们可以看到其实有的时候我们会在不经意间使用的值传递或者是本身使用库函数的时候库函数参数使用的是值传递,这样就会导致对象信息丢失的问题。所以说我们尽可能的不要在重载()函数中去改变对象成员属性的值。
二.仿函数的一些基本概念
生成器(generator)是不用参数就可以调用的函数符(仿函数)。
一元函数(unary function) 是用一个参数就可以调用的函数符。
二元函数(binary function)是用两个参数就可以调用的函数符。
例如:供给给for_each()的函数符应该是一个一元函数,因为它每次用于一个容器元素。
当然,这些概念都有相应的改进版:
返回bool值的一元函数是谓词(predicate);
返回bool值的二元函数是二元谓词(binary predicate)。
例如:供给给sort函数的第三个参数就应该是一个二元谓词,表示一个优先级关系。
三.仿函数在STL中的定义
在STL中也为我们准备好了一些常用的仿函数。
这里是头文件 => #include<functional>
仿函数 |
效果 |
negate<type>() |
-param |
plus<type>() |
param1+param2 |
minus<type>() |
param1-param2 |
multiplies<type>() |
param1*param2 |
divides<type>() |
param1/param2 |
modulus<type>() |
param1%param2 |
equal_to<type>() |
param1==param2 |
not_equal_to<type>() |
param!=param2 |
less<type>() |
param1<param2 |
greater<type>() |
param1>param2 |
less_equal<type>() |
param1<=param2 |
greater_equal<type>() |
param1>=param2 |
logical_not<type>() |
!param |
logical_and<type>() |
param1&¶m2 |
logical_or<type>() |
param1||param2 |
四.自适应函数符
什么叫自适应呢?其实很简单,我举个例子来说,假如我想实现一个对Vector所有元素求积的功能.(假定元素类型为整数或者实数)
template<class T>
class Mul
{
public:
T operator()(T a,T b)
{
return a*b;
}
};
template < class T ,class F>
____ For_each(T begin, T end, F functor)
{
____ ans = 1;
for (T it = begin; it != end; it++)
ans = functor(*it,ans);
return ans;
}
int main()
{
vector<int> arr = { 1, 2, 3, 4, 5 };
int ans = For_each(arr.begin(), arr.end(), Mul<int>());
cout << ans << endl;
return 0;
}
写出来大概为这样,但是很显然在For_each中有两个地方没法写下去。就是如何知道求出来的积是什么类型呢?换句话意思说我如何在For_each中知道我的第三个参数F functor 这个仿函数的执行的返回值呢(也就是class Mul 的模板类型参数T)? 所以我们在这里我们需要对Mul这个类中引入三个类型。分别是first_argument_type,second_argument_type,result_type:
template<class T>
class Mul
{
public:
T operator()(T a, T b)
{
return a*b;
}
typedef T first_argument_type, second_argument_type, result_type;
};
这样就相当于对这个二元函数符记录了它的两个参数和返回类型。所以我们的For_each就可以这样相应的写:
template < class T, class F>
typename F::result_type For_each(T begin, T end, F functor) //因为在这里编译器不知道result_type是F的成员变量还是类型,所以要用关键字typename限定。
{
typename F::result_type ans = 1;
for (T it = begin; it != end; it++)
ans = functor(*it, ans);
return ans;
}
所以我们把有这样的记录了参数、返回值类型的仿函数称之为自适应的仿函数。在库函数中,为我们准备好了两个类型:std::unary_function 和 std::binary_function
我们先看看源码吧:
template<class _Arg,class _Result>
struct unary_function
{ // base class for unary functions
typedef _Arg argument_type;
typedef _Result result_type;
};
// TEMPLATE STRUCT binary_function
template<class _Arg1,class _Arg2,class _Result>
struct binary_function
{ // base class for binary functions
typedef _Arg1 first_argument_type;
typedef _Arg2 second_argument_type;
typedef _Result result_type;
};
template<class T>
class Mul : public unary_function<T,T>
{
public:
T operator()(T a, T b)
{
return a*b;
}
};
五.函数适配器(函数配接器)
对于函数适配器,书上比较正式的解释是:标准库提供了一组函数适配器(function adapter),用于特化和扩展一元和二元函数对象。
而我的理解:函数配适器就是改变函数符的输入或者输出使得原本的函数符功能特化。所以我觉得叫做函数修饰器更比较贴切吧(个人感觉)。
在库中提供的函数适配器分为两类:
(1)绑定器(binder),是一种函数适配器,它通过将一个操作数绑定到给定值而将二元函数对象转换为一元函数对象。
(2)求反器(negator),是一种函数适配器,它将谓词函数对象的真值求反。
先举例绑定器:例如上文中我写的Mul仿函数,这个仿函数是一个二元函数,他需要给出两个参数。但是如果其中一个参数已经确定了。那么其实这个二元函数就可以退化为一个一元函数。所以这时候就需要绑定器来实现"类型转换"。假如:Mul中第二个参数已经固定为3,那么退化后的一元函数就为:bind2nd(Mul<int>(),3); 其实返回的就是一个一元函数operator()(T a){ return Functor(a,3); } 可以看得到其实实质还是调用的Mul的重载()函数。所以绑定器只是在外面包了一层壳。
给出一个例子吧,假如我要实现这样一个代码:Vector存放了若干个整数,现在输入一个整数x,问Vector的所有整数在数轴上与x的距离和为多少?
( 假如Vector存放的是1,5,8,x = 3, 那么和为 abs(1-3)+abs(5-3)+abs(8-3) ) 我们可以看到求距离的这个仿函数应该是一个二元函数。需要提供两个整数。但是我们知道其中一个整数是固定为x的所以我们的代码可以这么写:
class Dis :public binary_function<int,int,int>
{
public:
int operator()(int a, int b) const //要用绑定器的函数符必须为const重载()函数.
{
if (a > b) return a - b;
return b - a;
}
};
template < class T, class F>
typename F::result_type For_each(T begin, T end, F functor)
{
typename F::result_type ans = 0;
for (T it = begin; it != end; it++)
ans += functor(*it);
return ans;
}
int main()
{
vector<int> arr = { 1, 3, 4, 5, 6, 9, 10 };
int x = 3;
//cin >> x;
int ans = For_each(arr.begin(), arr.end(), bind2nd(Dis(), x));
cout << ans << endl;
return 0;
}
常用绑定器有两个:bind1st, bind2nd,分别是把值绑定到二元函数的第一个参数或者是第二个参数。至于求反器我就不过多说明了。其实适配器并不只限定于这两种。完全可以根据我们自己的要求来写各种适配器。例如我这里写了一个适配器。Unity<Func1 H, Func2 F, Func3 G> 中 Func1是一个二元函数,Func2, Func3都是一元函数。而这个适配器返回的是一个一元函数 Unity(x).<p>其作用就是 这个复合函数(这里的函数是数学的中的复合函数) : H(F(x), G(x));
class Unity : unary_function < typename F::argument_type, typename H::result_type >
{
public:
Unity(const H &h, const F &f, const G &g) :m_h(h), m_f(f), m_g(g) { }
typename H::result_type operator() (typename F::argument_type x) const
{
return m_h(m_f(x), m_g(x));
}
private:
H m_h;
F m_f;
G m_g;
};
template<typename T>
class One : public unary_function < T, T >
{
public:
T operator()(T a)const
{
return a;
}
};
template<typename T>
class Two : public unary_function < T, T >
{
public:
T operator()(T a, T b)const
{
return a + b;
}
};
int main()
{
Two<int> b;
One<int>a;
Unity<Two<int>, One<int>, One<int>> m(b, a, a);
int num = 3;
cout << m(num);
return 0;
}
其实除了上面两种适配器还有一种可应当可以称之为适配器就是成员函数适配器。
有时候,你可能想让算法调用容器元素的成员函数,而不是外部函数。因为外部无法改变对象内的状态,且内部函数通常具有更高的效率。例如swap(string, string)总是没有string.swap(string)快速。又比如sort无法对list进行排序,这时候只能使用list.sort()来给链表排序。这时候就需要使用一定的方法将对象内部的函数“变成”函数对象,这样的函数对象叫做成员函数适配器。
其实成员函数适配器是一个一元函数,参数为调用这个成员函数的对象(或者对象指针)。当然如果是对象的话适配器就是mem_fun_ref如果是指针的话就是mem_fun。
我们来举例说明一下,例如:定义一个类Student,有个成员变量为学生名字,有一个成员函数为Say即是输出这个学生的名字。现在我们有一个vector<Student>.我们想对于For_each第三个参数传入Student这个类的成员函数。这样调用For_each就输出了每个学生的名字。代码如下:
class Student
{
public:
explicit Student(string n = "测试学生") :name(n){}
void Say(){ cout << name << endl; }
private:
string name;
};
template<class T,class F>
void For_each(T begin, T end, F functor)
{
for (T it = begin; it != end; it++)
functor(*it);
}
int main()
{
vector<Student> students = { Student("小明"), Student("小红"), Student("小芳") };
For_each(students.begin(), students.end(), mem_fun_ref(&Student::Say));
return 0;
}
参考资料:
c++中的函数对象: http://blog.****.net/bonchoix/article/details/8050627
函数对象(仿函数): http://www.cnblogs.com/weiqubo/archive/2011/02/16/1956552.html
仿函数: http://blog.****.net/ggz631047367/article/details/38058245
推荐阅读
-
Java 面向对象 (XII) - 构造函数方法(方法调用、内存映射)、this 关键字(调用构造函数方法、示意图)、超级关键字
-
JS 创建对象的三种方法,构造函数
-
Golang 面向对象编程的构造函数 [struct&new
-
深入研究 C 语言中的函数指针和左右规则
-
C++ 仿函数外设和封装器 - 绑定函数
-
35 岁实现财务*,腾讯程序员手握2300万提前退休?-1000万房产、1000万腾讯股票、加上300万的现金,一共2300万的财产。有网友算了一笔账,假设1000万的房产用于自住,剩下1300万资产按照平均税后20-50万不等进行计算,大约花上26-60年左右的时间才能赚到这笔钱。也就是说,普通人可能奋斗一辈子,才能赚到这笔钱。在很多人还在为中年危机而惶惶不可终日的时候,有的人的35岁,就已经安全着陆,试问哪个打工人不羡慕?但问题是有这样财富积累必然有像样的实力做靠山。没有人可以不劳而获。 看到这里,肯定有人说,那么对于普通人来说,卷可能真就成了唯一的出路。但是卷也有轻松的卷,“偷懒”的卷法,对于程序员而言,刨除掉一时无法改掉的开会传统占用的大部分时间,如何把有限的时间和精力放在真正重要的架构设计、需求设计上,而不是重复的造*,编码、改bug、手动测试。因此在科技改变生活的今天,学会使用AI工具成为程序员们的必备技能。 以全栈式全自动的软件开发工具飞算SoFlu软件机器人为例,作为全球首款面向微服务架构设计和最佳实践的软件机器人,SoFlu软件机器人改变了原来手工编码的作业模式,通过可视化拖拽方式以及参数配置就能实现等同于编写复杂代码的业务逻辑,在设计业务逻辑时就完成了微服务应用开发,做到“业务即图,图即代码”,实现“软件开发,十倍提效”。 而作为飞算SoFlu软件机器人的一个重要组成部分,FuncGPT(慧函数)支持所有类型函数创建。通过自然语言描述Java函数需求,实时生成高质量、高可读性的Java函数代码。生成代码可直接复制到IDEA,或一键导入Java全自动开发工具函数库。 FuncGPT(慧函数)具有五大核心能力: ● 自然语言:通过自然语言即可生成函数,降低软件开发门槛。 ● 秒级函数开发:全自动秒级开发函数,秒级完成,效率千倍提升。 ● 一站式函数开发应用:函数生成即可直接应用,效率、安全有保障。 ● 质量可靠:生成的函数代码符合业界规范、具备良好的可读性,符合最优解。 ● 灵活生成:可以根据开发人员的具体需求生成并支持调整和修改。 以“将文件流转换为File对象”这个需求为例,以下是FuncGPT(慧函数)秒级生成的代码: / 类名:FileConverter // 函数名:convertStreamToFile // 函数功能:将文件流转换为File对象 // POM依赖包:无 import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; public class FileConverter { /** * 将文件流转换为File对象 * @param inputStream 文件流 * @param filePath 文件路径 * @param fileName 文件名 * @return 转换后的File对象 * @throws IOException 如果发生I/O异常 */ public static File convertStreamToFile(InputStream inputStream, String filePath, String fileName) throws IOException { File file = new File(filePath + File.separator + fileName); // 创建File对象 try (FileOutputStream outputStream = new FileOutputStream(file)) { // 创建文件输出流 byte buffer = new byte[1024]; int bytesRead; while ((bytesRead = inputStream.read(buffer)) != -1) { // 从文件流读取数据并写入文件 outputStream.write(buffer, 0, bytesRead); } } return file; // 返回转换后的File对象 } } // 函数示例 // 将文件流转换为File对象示例 // 入参:inputStream,文件流 // 入参:filePath,文件路径 // 入参:fileName,文件名 // 出参:file,转换后的File对象 // 调用示例: // InputStream inputStream = new FileInputStream("example.txt"); // String filePath = "C:\\Users\\User\\Documents"; // String fileName = "example.txt"; // File file = FileConverter.convertStreamToFile(inputStream, filePath, fileName); // System.out.println(file.getAbsolutePath); // 输出结果:例如,将文件流转换为File对象后,文件的绝对路径为:C:\Users\User\Documents\example.txt // 则输出结果为:C:\Users\User\Documents\example.txt 通过分析,不难发现以上代码:
-
探索和构建 LLaMA 3 架构:深入了解组件、编码和推理技术 (VI) SwiGLU 激活函数
-
深入了解 PHP 函数的调用顺序
-
WScript.Shell 对象运行和执行函数使用详情
-
epoll简介及触发模式(accept、read、send)-epoll的简单介绍 epoll在LT和ET模式下的读写方式 一、epoll的接口非常简单,一共就三个函数:1. int epoll_create(int size);创建一个epoll的句柄,size用来告诉内核这个监听的数目一共有多大。这个参数不同于select中的第一个参数,给出最大监听的fd+1的值。需要注意的是,当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close关闭,否则可能导致fd被耗尽。2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);epoll的事件注册函数,它不同与select是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。第一个参数是epoll_create的返回值,第二个参数表示动作,用三个宏来表示:EPOLL_CTL_ADD:注册新的fd到epfd中;EPOLL_CTL_MOD:修改已经注册的fd的监听事件;EPOLL_CTL_DEL:从epfd中删除一个fd;第三个参数是需要监听的fd,第四个参数是告诉内核需要监听什么事,struct epoll_event结构如下:struct epoll_event { __uint32_t events; /* Epoll events */ epoll_data_t data; /* User data variable */};events可以是以下几个宏的集合:EPOLLIN :表示对应的文件描述符可以读(包括对端SOCKET正常关闭); EPOLLIN事件:EPOLLIN事件则只有当对端有数据写入时才会触发,所以触发一次后需要不断读取所有数据直到读完EAGAIN为止。否则剩下的数据只有在下次对端有写入时才能一起取出来了。现在明白为什么说epoll必须要求异步socket了吧?如果同步socket,而且要求读完所有数据,那么最终就会在堵死在阻塞里。 EPOLLOUT:表示对应的文件描述符可以写; EPOLLOUT事件:EPOLLOUT事件只有在连接时触发一次,表示可写,其他时候想要触发,那要先准备好下面条件:1.某次write,写满了发送缓冲区,返回错误码为EAGAIN。2.对端读取了一些数据,又重新可写了,此时会触发EPOLLOUT。简单地说:EPOLLOUT事件只有在不可写到可写的转变时刻,才会触发一次,所以叫边缘触发,这叫法没错的!其实,如果真的想强制触发一次,也是有办法的,直接调用epoll_ctl重新设置一下event就可以了,event跟原来的设置一模一样都行(但必须包含EPOLLOUT),关键是重新设置,就会马上触发一次EPOLLOUT事件。1. 缓冲区由满变空.2.同时注册EPOLLIN | EPOLLOUT事件,也会触发一次EPOLLOUT事件这个两个也会触发EPOLLOUT事件 EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);EPOLLERR:表示对应的文件描述符发生错误;EPOLLHUP:表示对应的文件描述符被挂断;EPOLLET: 将EPOLL设为边缘触发(Edge Triggered)模式,这是相对于水平触发(Level Triggered)来说的。EPOLLONESHOT:只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);等待事件的产生,类似于select调用。参数events用来从内核得到事件的集合,maxevents告之内核这个events有多大,这个maxevents的值不能大于创建epoll_create时的size,参数timeout是超时时间(毫秒,0会立即返回,-1将不确定,也有说法说是永久阻塞)。该函数返回需要处理的事件数目,如返回0表示已超时。-------------------------------------------------------------------------------------------- 从man手册中,得到ET和LT的具体描述如下EPOLL事件有两种模型:Edge Triggered (ET)Level Triggered (LT)假如有这样一个例子:1. 我们已经把一个用来从管道中读取数据的文件句柄(RFD)添加到epoll描述符2. 这个时候从管道的另一端被写入了2KB的数据3. 调用epoll_wait(2),并且它会返回RFD,说明它已经准备好读取操作4. 然后我们读取了1KB的数据5. 调用epoll_wait(2)......Edge Triggered 工作模式:如果我们在第1步将RFD添加到epoll描述符的时候使用了EPOLLET标志,那么在第5步调用epoll_wait(2)之后将有可能会挂起,因为剩余的数据还存在于文件的输入缓冲区内,而且数据发出端还在等待一个针对已经发出数据的反馈信息。只有在监视的文件句柄上发生了某个事件的时候 ET 工作模式才会汇报事件。因此在第5步的时候,调用者可能会放弃等待仍在存在于文件输入缓冲区内的剩余数据。在上面的例子中,会有一个事件产生在RFD句柄上,因为在第2步执行了一个写操作,然后,事件将会在第3步被销毁。因为第4步的读取操作没有读空文件输入缓冲区内的数据,因此我们在第5步调用 epoll_wait(2)完成后,是否挂起是不确定的。epoll工作在ET模式的时候,必须使用非阻塞套接口,以避免由于一个文件句柄的阻塞读/阻塞写操作把处理多个文件描述符的任务饿死。最好以下面的方式调用ET模式的epoll接口,在后面会介绍避免可能的缺陷。 i 基于非阻塞文件句柄 ii 只有当read(2)或者write(2)返回EAGAIN时才需要挂起,等待。但这并不是说每次read时都需要循环读,直到读到产生一个EAGAIN才认为此次事件处理完成,当read返回的读到的数据长度小于请求的数据长度时,就可以确定此时缓冲中已没有数据了,也就可以认为此事读事件已处理完成。Level Triggered 工作模式相反的,以LT方式调用epoll接口的时候,它就相当于一个速度比较快的poll(2),并且无论后面的数据是否被使用,因此他们具有同样的职能。因为即使使用ET模式的epoll,在收到多个chunk的数据的时候仍然会产生多个事件。调用者可以设定EPOLLONESHOT标志,在 epoll_wait(2)收到事件后epoll会与事件关联的文件句柄从epoll描述符中禁止掉。因此当EPOLLONESHOT设定后,使用带有 EPOLL_CTL_MOD标志的epoll_ctl(2)处理文件句柄就成为调用者必须作的事情。然后详细解释ET, LT:LT(level triggered)是缺省的工作方式,并且同时支持block和no-block socket.在这种做法中,内核告诉你一个文件描述符是否就绪了,然后你可以对这个就绪的fd进行IO操作。如果你不作任何操作,内核还是会继续通知你的,所以,这种模式编程出错误可能性要小一点。传统的select/poll都是这种模型的代表.ET(edge-triggered)是高速工作方式,只支持no-block socket。在这种模式下,当描述符从未就绪变为就绪时,内核通过epoll告诉你。然后它会假设你知道文件描述符已经就绪,并且不会再为那个文件描述符发送更多的就绪通知,直到你做了某些操作导致那个文件描述符不再为就绪状态了(比如,你在发送,接收或者接收请求,或者发送接收的数据少于一定量时导致了一个EWOULDBLOCK 错误)。但是请注意,如果一直不对这个fd作IO操作(从而导致它再次变成未就绪),内核不会发送更多的通知(only once),不过在TCP协议中,ET模式的加速效用仍需要更多的benchmark确认(这句话不理解)。在许多测试中我们会看到如果没有大量的idle -connection或者dead-connection,epoll的效率并不会比select/poll高很多,但是当我们遇到大量的idle- connection(例如WAN环境中存在大量的慢速连接),就会发现epoll的效率大大高于select/poll。(未测试)另外,当使用epoll的ET模型来工作时,当产生了一个EPOLLIN事件后,读数据的时候需要考虑的是当recv返回的大小如果等于请求的大小,那么很有可能是缓冲区还有数据未读完,也意味着该次事件还没有处理完,所以还需要再次读取: 这里只是说明思路(参考《UNIX网络编程》) while(rs) {buflen = recv(activeevents[i].data.fd, buf, sizeof(buf), 0);if(buflen < 0){// 由于是非阻塞的模式,所以当errno为EAGAIN时,表示当前缓冲区已无数据可读// 在这里就当作是该次事件已处理处.if(errno == EAGAIN)break; else return; }else if(buflen == 0) { // 这里表示对端的socket已正常关闭. } if(buflen == sizeof(buf) rs = 1; // 需要再次读取 else rs = 0; } 还有,假如发送端流量大于接收端的流量(意思是epoll所在的程序读比转发的socket要快),由于是非阻塞的socket,那么send函数虽然返回,但实际缓冲区的数据并未真正发给接收端,这样不断的读和发,当缓冲区满后会产生EAGAIN错误(参考man send),同时,不理会这次请求发送的数据.所以,需要封装socket_send的函数用来处理这种情况,该函数会尽量将数据写完再返回,返回-1表示出错。在socket_send内部,当写缓冲已满(send返回-1,且errno为EAGAIN),那么会等待后再重试.这种方式并不很完美,在理论上可能会长时间的阻塞在socket_send内部,但暂没有更好的办法. ssize_t socket_send(int sockfd, const char* buffer, size_t buflen) { ssize_t tmp; size_t total = buflen; const char *p = buffer; while(1) { tmp = send(sockfd, p, total, 0); if(tmp < 0) { // 当send收到信号时,可以继续写,但这里返回-1. if(errno == EINTR) return -1; // 当socket是非阻塞时,如返回此错误,表示写缓冲队列已满, // 在这里做延时后再重试. if(errno == EAGAIN) { usleep(1000); continue; } return -1; } if((size_t)tmp == total) return buflen; total -= tmp; p += tmp; } return tmp; } 二、epoll在LT和ET模式下的读写方式 在一个非阻塞的socket上调用read/write函数, 返回EAGAIN或者EWOULDBLOCK(注: EAGAIN就是EWOULDBLOCK) 从字面上看, 意思是: * EAGAIN: 再试一次 * EWOULDBLOCK: 如果这是一个阻塞socket, 操作将被block * perror输出: Resource temporarily unavailable 总结: 这个错误表示资源暂时不够, 可能read时, 读缓冲区没有数据, 或者, write时,写缓冲区满了 。 遇到这种情况, 如果是阻塞socket, read/write就要阻塞掉。 而如果是非阻塞socket, read/write立即返回-1, 同 时errno设置为EAGAIN. 所以, 对于阻塞socket, read/write返回-1代表网络出错了. 但对于非阻塞socket, read/write返回-1不一定网络真的出错了. 可能是Resource temporarily unavailable. 这时你应该再试, 直到Resource available. 综上, 对于non-blocking的socket, 正确的读写操作为: 读: 忽略掉errno = EAGAIN的错误, 下次继续读 写: 忽略掉errno = EAGAIN的错误, 下次继续写 对于select和epoll的LT模式, 这种读写方式是没有问题的. 但对于epoll的ET模式, 这种方式还有漏洞. epoll的两种模式 LT 和 ET