在一篇文章中了解 Python 进程间通信的几种方式
为什么进程之间需要通信?
1.数据传输
一个进程需要将它的数据发送给另一个进程;
2.资源共享
多个进程之间共享同样的资源;
3.事件通知
一个进程需要向另一个或一组进程发送消息,通知它们发生了某种事件;
4.进程控制
有些进程希望完全控制另一个进程的执行(如Debug进程),该控制进程希望能够拦截另一个进程的所有操作,并能够及时知道它的状态改变。
基于以上的几个原因,所以就有了进程间通信的概念,那我们应该如何进行进程之间的通信呢?
进程间通信的原理
每个进程各自有不同的用户地址空间,任何一个进程的全局变量在另一个进程中都看不到,所以进程之间要交换数据必须通过内核,在内核中开辟一块缓冲区,进程1把数据从用户空间拷到内核缓冲区,进程2再从内核缓冲区把数据读走,内核提供的这种机制称为进程间通信机制。
进程间通信的几种方式
管道
匿名管道
管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。
命名管道
有名管道也是半双工的通信方式,但是它允许无亲缘关系进程间的通信。
消息队列
消息队列是由消息的链表,存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载无格式字节流以及缓冲区大小受限等缺点。
共享内存通信
共享内存就是映射一段能被其他进程所访问的内存,这段共享内存由一个进程创建,但多个进程都可以访问。共享内存是最快的 IPC 方式,它是针对其他进程间通信方式运行效率低而专门设计的。它往往与其他通信机制,如信号量,配合使用,来实现进程间的同步和通信。
信号量
信号量是一个计数器,可以用来控制多个进程对共享资源的访问。它常作为一种锁机制,防止某进程正在访问共享资源时,其他进程也访问该资源。因此,主要作为进程间以及同一进程内不同线程之间的同步手段。
套接字(socket)通信
套接口也是一种进程间通信机制,与其他通信机制不同的是,它可用于不同机器之间的进程通信。
信号
信号是一种比较复杂的通信方式,用于通知接收进程某个事件已经发生。
Python中如何实现进程通信?
进程彼此之间互相隔离,要实现进程间通信(IPC),multiprocessing模块支持两种形式:队列和管道,这两种方式都是使用消息传递的。
进程之间通信必须找到一种介质,该介质必须满足:
- 是所有进程共享的。
- 必须是内存空间,同时,帮我们自动处理好锁的问题。
通过消息队列交换数据,这样能够极大地减少了对使用锁定和其他同步手段的需求,
管道
from multiprocessing import Process, Pipe
import time
def consumer(p, name):
left, right = p
left.close()
while True:
try:
baozi = right.recv()
print('%s 收到包子:%s' % (name, baozi))
except EOFError:
right.close()
break
def producer(seq, p):
left, right = p
right.close()
for i in seq:
left.send(i)
time.sleep(1)
else:
left.close()
if __name__ == '__main__':
left, right = Pipe()
c1 = Process(target=consumer, args=((left, right), 'c1'))
c1.start()
seq = (i for i in range(10))
producer(seq, (left, right))
right.close()
left.close()
c1.join()
print('进程间通信-管道-主进程')
运行结果:
c1 收到包子:0
c1 收到包子:1
c1 收到包子:2
c1 收到包子:3
c1 收到包子:4
c1 收到包子:5
c1 收到包子:6
c1 收到包子:7
c1 收到包子:8
c1 收到包子:9
进程间通信-管道-主进程
注意:
管道可以用于双向通信,利用在客户端/服务器中使用的请求/响应模型或远程过程调用,就可以使用管道编写与进程交互的程序。
生产者和消费者都没有使用管道的某个端点,就应该将其关闭,如在生产者中关闭管道的右端,在消费者中关闭管道的左端。如果忘记执行这些步骤,程序可能在消费者中的recv()操作上挂起。管道是由操作系统进行引用计数的,必须在所有进程中关闭管道后才能生产EOFError异常。因此,在生产者中关闭管道不会有任何效果,消费者中也应该关闭相同的管道端点。
队列(推荐)
下面实现简单的生产者消费者模型。
from multiprocessing import Process, Queue, set_start_method
import time,random,os
def consumer(q):
while True:
res=q.get()
if res is None: break #收到结束信号则结束
time.sleep(random.randint(1,3))
print('\033[45m%s 吃 %s\033[0m' %(os.getpid(),res))
def producer(q):
for i in range(10):
time.sleep(random.randint(1,3))
res='包子%s' %i
q.put(res)
print('\033[46m%s 生产了 %s\033[0m' %(os.getpid(),res))
q.put(None) #发送结束信号
if __name__ == '__main__':
set_start_method('fork')
q=Queue()
#生产者们:即厨师们
p1=Process(target=producer,args=(q,))
#消费者们:即吃货们
c1=Process(target=consumer,args=(q,))
#开始
p1.start()
c1.start()
print('进程间通信-队列-主进程')
运行结果:
进程间通信-队列-主进程
25720 生产了 包子0
25720 生产了 包子1
25720 生产了 包子2
25721 吃 包子0
25720 生产了 包子3
25721 吃 包子1
25721 吃 包子2
25720 生产了 包子4
25721 吃 包子3
25720 生产了 包子5
25721 吃 包子4
25720 生产了 包子6
25721 吃 包子5
25721 吃 包子6
25720 生产了 包子7
25720 生产了 包子8
25721 吃 包子7
25721 吃 包子8
25720 生产了 包子9
25721 吃 包子9
注意:
生产者在生产完毕后发送结束信号None.
但结束信号None,不一定要由生产者发,主进程里同样可以发,但主进程需要等生产者结束后才应该发送该信号。
共享数据
虽然进程间数据独立,但可以通过Manager实现数据共享。
进程间通信应该尽量避免使用本节所讲的共享数据的方式。
from multiprocessing import Manager, Process,Lock
def work(d,lock):
with lock: # 不加锁而操作共享的数据,肯定会出现数据错乱
print(f"计数器减一,当前为:{d['count']}")
d['count']-=1
if __name__ == '__main__':
lock=Lock()
with Manager() as m:
dic=m.dict({'count':20})
p_l=[]
for i in range(20):
p=Process(target=work, args=(dic, lock))
p_l.append(p)
p.start()
for p in p_l:
p.join()
print(dic)
运行结果:
计数器减一,当前为:20
计数器减一,当前为:19
计数器减一,当前为:18
计数器减一,当前为:17
计数器减一,当前为:16
计数器减一,当前为:15
计数器减一,当前为:14
计数器减一,当前为:13
计数器减一,当前为:12
计数器减一,当前为:11
计数器减一,当前为:10
计数器减一,当前为:9
计数器减一,当前为:8
计数器减一,当前为:7
计数器减一,当前为:6
计数器减一,当前为:5
计数器减一,当前为:4
计数器减一,当前为:3
计数器减一,当前为:2
计数器减一,当前为:1
{'count': 0}
信号量(了解)
互斥锁是同时只允许一个线程更改数据,而Semaphore是同时允许一定数量的线程更改数据 ,比如厕所有3个坑,那最多只允许3个人上厕所,后面的人只能等里面有人出来了才能再进去,如果指定信号量为3,那么来一个人获得一把锁,计数加1,当计数等于3时,后面的人均需要等待。一旦释放,就有人可以获得一把锁。
信号量与进程池的概念很像,但是要区分开,信号量涉及到加锁的概念。
from multiprocessing import Process,Semaphore
import time,random
def go_wc(sem,user):
sem.acquire()
print('%s 占到一个茅坑' %user)
time.sleep(random.randint(0,3)) # 模拟每个人拉屎速度不一样,0代表有的人蹲下就起来了
sem.release()
if __name__ == '__main__':
sem=Semaphore(5)
p_l=[]
for i in range(13):
p=Process(target=go_wc,args=(sem,'user%s' %i,))
p.start()
p_l.append(p)
for i in p_l:
i.join()
print('============》')
运行结果:
user0 占到一个茅坑
user1 占到一个茅坑
user2 占到一个茅坑
user3 占到一个茅坑
user5 占到一个茅坑
user4 占到一个茅坑
user7 占到一个茅坑
user9 占到一个茅坑
user8 占到一个茅坑
user6 占到一个茅坑
user11 占到一个茅坑
user12 占到一个茅坑
user10 占到一个茅坑
============》
信号/事件(了解)
python进程的事件用于主进程控制其他进程的执行,事件主要提供了三个方法 set
、wait
、clear
。
事件处理的机制:
全局定义了一个“Flag”,如果“Flag”值为 False,那么当程序执行 event.wait
方法时就会阻塞,如果“Flag”值为True,那么event.wait
方法时便不再阻塞。
其中,clear
方法:将“Flag”设置为False,set
方法:将“Flag”设置为True。
import multiprocessing
import time
from multiprocessing import Process, Queue, set_start_method
event = multiprocessing.Event()
def xiao_fan(event):
print('小贩:生产...')
print('小贩:售卖...')
# time.sleep(1)
print('小贩:等待就餐')
event.set()
event.clear()
event.wait()
print('小贩:谢谢光临')
event.set()
event.clear()
def gu_ke(event):
print('顾客:准备买早餐')
event.set()
event.clear()
event.wait()
print('顾客:买到早餐')
print('顾客:享受美食')
# time.sleep(2)
print('顾客:付款,真好吃...')
event.set()
event.clear()
if __name__ == '__main__':
set_start_method('fork', True)
# 创建进程
xf = multiprocessing.Process(target=xiao_fan, args=(event,))
gk = multiprocessing.Process(target=gu_ke, args=(event, ))
# 启动进程
gk.start()
xf.start()
# time.sleep(2)
运行结果:
顾客:准备买早餐
小贩:生产...
小贩:售卖...
小贩:等待就餐
顾客:买到早餐
顾客:享受美食
顾客:付款,真好吃...
小贩:谢谢光临
总结
对于共享内存,数据操作最快,因为是直接在内存层面操作,省去中间的拷贝工作。但是共享内存只能在单机上运行,且只能操作基础数据格式,无法直接共享复杂对象。
管道和队列传递数据没有共享内存快,且每次传递的数据大小受限。但是使用队列可以在多个进程间传递,可以在不同主机上的进程间共享,以实现分布式。
匿名管道则只能在父子进程间共享,而命名管道可在同一台计算机的不同进程之间或在跨越一个网络的不同计算机的进程间共享。
参考文档
- 浅析进程间通信的几种方式(含实例源码)
- python并发编程之多进程(实践篇)
- 进程间通信的方式——信号、管道、消息队列、共享内存
你好,我叫果冻,创作不易,如果觉得我的博文能够帮助到你,期待你的点赞,祝好~~~
上一篇: 进程之间的六种通信
下一篇: 详细的安卓网络视图独立进程通信方法
推荐阅读
-
在一篇文章中了解 Python 进程间通信的几种方式
-
windows下进程间通信的(13种方法)-摘 要 本文讨论了进程间通信与应用程序间通信的含义及相应的实现技术,并对这些技术的原理、特性等进行了深入的分析和比较。 ---- 关键词 信号 管道 消息队列 共享存储段 信号灯 远程过程调用 Socket套接字 MQSeries 1 引言 ---- 进程间通信的主要目的是实现同一计算机系统内部的相互协作的进程之间的数据共享与信息交换,由于这些进程处于同一软件和硬件环境下,利用操作系统提供的的编程接口,用户可以方便地在程序中实现这种通信;应用程序间通信的主要目的是实现不同计算机系统中的相互协作的应用程序之间的数据共享与信息交换,由于应用程序分别运行在不同计算机系统中,它们之间要通过网络之间的协议才能实现数据共享与信息交换。进程间通信和应用程序间通信及相应的实现技术有许多相同之处,也各有自己的特色。即使是同一类型的通信也有多种的实现方法,以适应不同情况的需要。 ---- 为了充分认识和掌握这两种通信及相应的实现技术,本文将就以下几个方面对这两种通信进行深入的讨论:问题的由来、解决问题的策略和方法、每种方法的工作原理和实现、每种实现方法的特点和适用的范围等。 2 进程间的通信及其实现技术 ---- 用户提交给计算机的任务最终都是通过一个个的进程来完成的。在一组并发进程中的任何两个进程之间,如果都不存在公共变量,则称该组进程为不相交的。在不相交的进程组中,每个进程都独立于其它进程,它的运行环境与顺序程序一样,而且它的运行环境也不为别的进程所改变。运行的结果是确定的,不会发生与时间相关的错误。 ---- 但是,在实际中,并发进程的各个进程之间并不是完全互相独立的,它们之间往往存在着相互制约的关系。进程之间的相互制约关系表现为两种方式: ---- (1) 间接相互制约:共享CPU ---- (2) 直接相互制约:竞争和协作 ---- 竞争——进程对共享资源的竞争。为保证进程互斥地访问共享资源,各进程必须互斥地进入各自的临界段。 ---- 协作——进程之间交换数据。为完成一个共同任务而同时运行的一组进程称为同组进程,它们之间必须交换数据,以达到协作完成任务的目的,交换数据可以通知对方可以做某事或者委托对方做某事。 ---- 共享CPU问题由操作系统的进程调度来实现,进程间的竞争和协作由进程间的通信来完成。进程间的通信一般由操作系统提供编程接口,由程序员在程序中实现。UNIX在这个方面可以说最具特色,它提供了一整套进程间的数据共享与信息交换的处理方法——进程通信机制(IPC)。因此,我们就以UNIX为例来分析进程间通信的各种实现技术。 ---- 在UNIX中,文件(File)、信号(Signal)、无名管道(Unnamed Pipes)、有名管道(FIFOs)是传统IPC功能;新的IPC功能包括消息队列(Message queues)、共享存储段(Shared memory segment)和信号灯(Semapores)。 ---- (1) 信号 ---- 信号机制是UNIX为进程中断处理而设置的。它只是一组预定义的值,因此不能用于信息交换,仅用于进程中断控制。例如在发生浮点错、非法内存访问、执行无效指令、某些按键(如ctrl-c、del等)等都会产生一个信号,操作系统就会调用有关的系统调用或用户定义的处理过程来处理。 ---- 信号处理的系统调用是signal,调用形式是: ---- signal(signalno,action) ---- 其中,signalno是规定信号编号的值,action指明当特定的信号发生时所执行的动作。 ---- (2) 无名管道和有名管道 ---- 无名管道实际上是内存中的一个临时存储区,它由系统安全控制,并且独立于创建它的进程的内存区。管道对数据采用先进先出方式管理,并严格按顺序操作,例如不能对管道进行搜索,管道中的信息只能读一次。 ---- 无名管道只能用于两个相互协作的进程之间的通信,并且访问无名管道的进程必须有共同的祖先。 ---- 系统提供了许多标准管道库函数,如: pipe——打开一个可以读写的管道; close——关闭相应的管道; read——从管道中读取字符; write——向管道中写入字符; ---- 有名管道的操作和无名管道类似,不同的地方在于使用有名管道的进程不需要具有共同的祖先,其它进程,只要知道该管道的名字,就可以访问它。管道非常适合进程之间快速交换信息。 ---- (3) 消息队列(MQ) ---- 消息队列是内存中独立于生成它的进程的一段存储区,一旦创建消息队列,任何进程,只要具有正确的的访问权限,都可以访问消息队列,消息队列非常适合于在进程间交换短信息。 ---- 消息队列的每条消息由类型编号来分类,这样接收进程可以选择读取特定的消息类型——这一点与管道不同。消息队列在创建后将一直存在,直到使用msgctl系统调用或iqcrm -q命令删除它为止。 ---- 系统提供了许多有关创建、使用和管理消息队列的系统调用,如: ---- int msgget(key,flag)——创建一个具有flag权限的MQ及其相应的结构,并返回一个唯一的正整数msqid(MQ的标识符); ---- int msgsnd(msqid,msgp,msgsz,msgtyp,flag)——向队列中发送信息; ---- int msgrcv(msqid,cmd,buf)——从队列中接收信息; ---- int msgctl(msqid,cmd,buf)——对MQ的控制操作; ---- (4) 共享存储段(SM) ---- 共享存储段是主存的一部分,它由一个或多个独立的进程共享。各进程的数据段与共享存储段相关联,对每个进程来说,共享存储段有不同的虚拟地址。系统提供的有关SM的系统调用有: ---- int shmget(key,size,flag)——创建大小为size的SM段,其相应的数据结构名为key,并返回共享内存区的标识符shmid; ---- char shmat(shmid,address,flag)——将当前进程数据段的地址赋给shmget所返回的名为shmid的SM段; ---- int shmdr(address)——从进程地址空间删除SM段; ---- int shmctl (shmid,cmd,buf)——对SM的控制操作; ---- SM的大小只受主存限制,SM段的访问及进程间的信息交换可以通过同步读写来完成。同步通常由信号灯来实现。SM非常适合进程之间大量数据的共享。 ---- (5) 信号灯 ---- 在UNIX中,信号灯是一组进程共享的数据结构,当几个进程竞争同一资源时(文件、共享内存或消息队列等),它们的操作便由信号灯来同步,以防止互相干扰。 ---- 信号灯保证了某一时刻只有一个进程访问某一临界资源,所有请求该资源的其它进程都将被挂起,一旦该资源得到释放,系统才允许其它进程访问该资源。信号灯通常配对使用,以便实现资源的加锁和解锁。 ---- 进程间通信的实现技术的特点是:操作系统提供实现机制和编程接口,由用户在程序中实现,保证进程间可以进行快速的信息交换和大量数据的共享。但是,上述方式主要适合在同一台计算机系统内部的进程之间的通信。 3 应用程序间的通信及其实现技术 ---- 同进程之间的相互制约一样,不同的应用程序之间也存在竞争和协作的关系。UNIX操作系统也提供一些可用于应用程序之间实现数据共享与信息交换的编程接口,程序员可以通过自己编程来实现。如远程过程调用和基于TCP/IP协议的套接字(Socket)编程。但是,相对普通程序员来说,它们涉及的技术比较深,编程也比较复杂,实现起来困难较大。 ---- 于是,一种新的技术应运而生——通过将有关通信的细节完全掩盖在某个独立软件内部,即底层的通讯工作和相应的维护管理工作由该软件内部来实现,用户只需要将通信任务提交给该软件去完成,而不必理会它的具体工作过程——这就是所谓的中间件技术。 ---- 我们在这里分别讨论这三种常用的应用程序间通信的实现技术——远程过程调用、会话编程技术和MQSeries消息队列技术。其中远程过程调用和会话编程属于比较低级的方式,程序员参与的程度较深,而MQSeries消息队列则属于比较高级的方式,即中间件方式,程序员参与的程度较浅。 ---- 4.1 远程过程调用(RPC)
-
在uniapp中,如何轻松用echarts和renderjs方式完成echarts的封装,适用于兼顾H5和App场景,这一篇文章足够全面了解!