同伴关闭连接：常见原因与解决方案

最编程 2024-01-28 15:43:41

...

1，如果一端的Socket被关闭（或主动关闭，或因为异常退出而引起的关闭），另一端仍发送数据，发送的第一个数据包引发该异常(Connect reset by peer)。

Socket默认连接60秒，60秒之内没有进行心跳交互，即读写数据，就会自动关闭连接。

2，一端退出，但退出时并未关闭该连接，另一端如果在从连接中读数据则抛出该异常（Connection reset）。

简单的说就是在连接断开后的读和写操作引起的。

Connection reset by peer的常见原因：

1）服务器的并发连接数超过了其承载量，服务器会将其中一些连接关闭；如果知道实际连接服务器的并发客户数没有超过服务器的承载量，则有可能是中了病毒或者木马，引起网络流量异常。可以使用netstat -an查看网络连接情况。 2）客户关掉了浏览器，而服务器还在给客户端发送数据； 3）浏览器端按了Stop；这两种情况一般不会影响服务器。但是如果对异常信息没有特别处理，有可能在服务器的日志文件中，重复出现该异常，造成服务器日志文件过大，影响服务器的运行。可以对引起异常的部分，使用try…catch捕获该异常，然后不输出或者只输出一句提示信息，避免使用e.printStackTrace();输出全部异常信息。 4）防火墙的问题；如果网络连接通过防火墙，而防火墙一般都会有超时的机制，在网络连接长时间不传输数据时，会关闭这个TCP的会话，关闭后在读写，就会导致异常。如果关闭防火墙，解决了问题，需要重新配置防火墙，或者自己编写程序实现TCP的长连接。实现TCP的长连接，需要自己定义心跳协议，每隔一段时间，发送一次心跳协议，双方维持连接。 5）JSP的buffer问题。 JSP页面缺省缓存为8k，当JSP页面数据比较大的时候，有可能JSP没有完全传递给浏览器。这时可以适当调整buffer的大小。

第1个异常是java.net.BindException:Address already in use: JVM_Bind。

该异常发生在服务器端进行new ServerSocket(port)（port是一个0，65536的整型值）操作时。异常的原因是以为与port一样的一个端口已经被启动，并进行监听。此时用netstat –an命令，可以看到一个Listending状态的端口。只需要找一个没有被占用的端口就能解决这个问题。

第2个异常是java.net.ConnectException: Connection refused: connect。

该异常发生在客户端进行 new Socket(ip, port)操作时，该异常发生的原因是或者具有ip地址的机器不能找到（也就是说从当前机器不存在到指定ip路由），或者是该ip存在，但找不到指定的端口进行监听。出现该问题，首先检查客户端的ip和port是否写错了，如果正确则从客户端ping一下服务器，看是否能 ping通，如果能ping通（服务服务器端把ping禁掉则需要另外的办法），则看在服务器端的监听指定端口的程序是否启动，这个肯定能解决这个问题。

第3个异常是java.net.SocketException: Socket is closed，该异常在客户端和服务器均可能发生。

异常的原因是己方主动关闭了连接后（调用了Socket的close方法）再对网络连接进行读写操作。

第4个异常是java.net.SocketException: （Connection reset或者 Connect reset by peer:Socket write error）。

该异常在客户端和服务器端均有可能发生，引起该异常的原因有两个，第一个就是如果一端的Socket被关闭（或主动关闭或者因为异常退出而引起的关闭），另一端仍发送数据，发送的第一个数据包引发该异常 (Connect reset by peer)。另一个是一端退出，但退出时并未关闭该连接，另一端如果在从连接中读数据则抛出该异常（Connection reset）。简单的说就是在连接断开后的读和写操作引起的。

第5个异常是java.net.SocketException: Broken pipe。该异常在客户端和服务器均有可能发生。

在第4个异常的第一种情况中（也就是抛出SocketExcepton:Connect reset by peer:Socket write error后），如果再继续写数据则抛出该异常。前两个异常的解决方法是首先确保程序退出前关闭所有的网络连接，其次是要检测对方的关闭连接操作，发现对方关闭连接后自己也要关闭该连接。

客户端错误代码10053 Software caused connection abort（软件原因导致连接中断）

参考：https://blog.****.net/candyguy242/article/details/25699727 http://www.360doc.com/content/13/0722/10/11220452_301678390.shtml

rabbitMQ连接断开问题

猜测：pika客户端没有及时发送心跳，连接被server断开

一开始修改了heartbeat_interval参数值, 示例如下:

def test_main():
    s_conn = pika.BlockingConnection(
        pika.ConnectionParameters('127.0.0.1', 
            heartbeat_interval=10,
            socket_timeout=5,
            credentials=pika.PlainCredentials(USER, PWD)))
    # ....

去看它的api，看到heartbeat_interval的解析:

:param int heartbeat_interval: How often to send heartbeats.
                                  Min between this value and server's proposal
                                  will be used. Use 0 to deactivate heartbeats
                                  and None to accept server's proposal.

按这样说法，应该还是没有把心跳值给设置好。上面的程序期望是10秒发一次心跳，但是理论上发送心跳的间隔会比10秒多一点。所以艾玛，我应该是把heartbeat_interval的作用搞错了，它是指超过这个时间间隔不发心跳或不给server任何信息，server就会断开连接, 而不是说pika会按这个间隔来发心跳。结果我把heartbeat_interval值设置高一点(比实际发送心跳/信息的间隔更长)，比如上面设置成60秒，就正常运行了。

如果不指定heartbeat_interval，它默认为None，意味着按rabbitMQ server的配置来检测心跳是否正常。如果设置heartbeat_interval=0，意味着不检测心跳，server端将不会主动断开连接。但实际上设置heartbeat=0，并不起作用，这个心跳值时间间隔是由server端控制的，可以参考我的这篇文章就知道原因了，https://blog.****.net/xc_zhou/article/details/84033841。

究竟该如何彻底解决，这个问题也困扰我了好久，下面给出解决方法

import threading,time

#开启一个线程，每隔20s，执行一次心跳
 def timesleep(n):
     for i in range(n):
         time.sleep(20)
         # heartbeat=0,意味着不检测心跳，server端将不会主动断开连接。但是并不起作用，
         # process_data_events 方法，类似 heartbeat 操作，可以保持与 rabbitmq 的通信。
         # 在执行长时间任务时，定时调用 process_data_events 方法，就不会丢失连接
         self.connection.process_data_events()
 message_thread = threading.Thread(target=timesleep, args=(3600*24,))
 message_thread.start()

如还有问题，请看下篇文章，也许会帮到你

pika missed heartbeats from client timeout 60s 的问题

上一篇：把汉字数字转换成阿拉伯数字的方法

下一篇：腾讯云服务器连接突然断开的问题

同伴关闭连接：常见原因与解决方案

rabbitMQ连接断开问题

pika missed heartbeats from client timeout 60s 的问题

连接远程 mysql 数据库失败的常见原因和解决方案

剖析并提供解决方案：Odin线刷失败的常见问题与原因探究（改编自他文）

同伴关闭连接：常见原因与解决方案