欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

Python pyttsx3|朗读文本(多种语言)

最编程 2024-04-22 14:42:35
...

 Python文字转语音

程序员,在其他人眼中往往都是高冷的存在,在他们的眼中能用代码解决的问题绝对不考虑其他的方法,本文让我们用Python来提升一下高冷的档次,让我们用代码来“说话”。

安装pyttsx3

安装

下面就让我们来看一下Python是怎样开口“说话“的。

我们先安装需要的库pyttsx3:

pip install pyttsx3

网络异常,图片无法展示
|

语音引擎工厂

类似于设计模式中的“工厂模式”,pyttsx3通过初始化来获取语音引擎。当我们第一次调用init操作的时候,会返回一个pyttsx3的engine对象,再次调用的时候,如果存在engine对象实例,就会使用现有的,否则再重新创建一个。

pyttsx.init([driverName : string, debug : bool])  pyttsx.Engine

网络异常,图片无法展示
|

从方法声明上来看,第一个参数指定的是语音驱动的名称,这个在底层适合操作系统密切相关的。如下:

     1.drivename:由pyttsx3.driver模块根据操作系统类型来调用,默认使用当前操作系统可以使用的最好的驱动。

           sapi5 - SAPI5 on Windows

           nsss - NSSpeechSynthesizer on Mac OS X

           espeak - eSpeak on every other platform

     2.debug: 这第二个参数是指定要不要以调试状态输出,建议开发阶段设置为True。

函数说明

本节我们再来了解一下pyttsx3.engine.Engine中所对应的函数说明。

- connect

参数:

 topic(string):要描述的事件名称;

 cb(callable):回调函数。

返回值:

 dict

函数说明:

 在给定的topic上添加回调通知

- disconnect

参数:

 token(dict):回调失联的返回标记

返回值:

 Void

函数说明:

 结束连接

- endLoop

函数说明:

 简单来说就是结束事件循环

- getProperty

参数:

 name(string):rate: 每分钟字数的语音速率,默认为每分钟200个。

  name(string):voice: 语音的字符串标识符。

  name(string):voices: pyttsx3.voice.Voice描述符对象列表。

  name(string):volume:音量的大小。

返回值:

 Object

函数说明:

 获取当前引擎实例的属性值。

- setProperty

参数:

 name(string):rate: 每分钟字数的语音速率,默认为每分钟200个。

  name(string):voice: 语音的字符串标识符。

  name(string):volume:音量的大小。

 value(int):rate: 设置每分钟读的字数。

 value:voice:设置发音,后文中会再讲到。

 valu(float):volume:设置音量大小,0.0-1.0之间;默认1.0。

返回值:

 Object

函数说明:

 获取当前引擎实例的属性值。

- say

参数:

 text(unicode):要进行朗读的文本数据。

 name(strin):关联发音人(一般用不到)

函数说明:

 预设要朗读的文本数据

- runAndWait

函数说明:

  当事件队列中事件全部清空的时候返回。

- startLoop

参数:

  [useDriverLoop(bool)]:是否启用驱动循环。

函数说明:

  开启事件队列

- stop

函数说明:

  停止当前讲话并清除命令队列。

简单的中文发音

先来让我们学习一下最简单的“说话”方法,我们不需要进行任何的设置,只要传入想要朗读的文本就可以了。

# 语音播报模块
import pyttsx3 
 
# 模块初始化
engine = pyttsx3.init() 
print('准备开始语音播报...')
engine.say('我高冷,我并不想说话~')
# 等待语音播报完毕 
engine.runAndWait()

网络异常,图片无法展示
|

设置参数的发音方式

在进行设置参数的发音方式的时候,我们需要注意一点,在该模块的内置声音选择函数执行的时候将并不能匹配中文发音,所以我们用英文来进行一下默认参数的尝试。

# 语音播报模块
import pyttsx3
# 模块初始化
engine = pyttsx3.init()
print('准备开始语音播报...')
# 设置发音速率,默认值为200
rate = engine.getProperty('rate')
engine.setProperty('rate', rate - 50)
# 设置发音大小,范围为0.0-1.0
volume = engine.getProperty('volume')
engine.setProperty('volume', 0.6)
# 设置默认的声音:voices[0].id代表男生,voices[1].id代表女生
voices = engine.getProperty('voices')
engine.setProperty('voice', voices[1].id)
# 添加朗读文本
engine.say('Not everyone can become a great artist.')
# 等待语音播报完毕
engine.runAndWait()

image.gif

有趣的中文方言发音

虽然在内置的发音方式中我们不能更换音色,但是经过一番查找后我发现,我们还可以去调用其他的语音播报API,这样就完美的解决了更改发音的问题,并且还能支持很多方言,来用我们最开始听到的语音播报来举个例子,代码如下:

# 语音播报模块
import pyttsx3
msg = '''今天我,寒夜里看雪飘过
怀着冷却了的心窝漂远方
风雨里追赶,雾里分不清影踪
天空海阔你与我
可会变(谁没在变)
多少次,迎着冷眼与嘲笑
从没有放弃过心中的理想
一刹那恍惚, 若有所失的感觉
不知不觉已变淡
心里爱(谁明白我)
原谅我这一生不羁放纵爱*
也会怕有一天会跌倒
背弃了理想 ,谁人都可以
哪会怕有一天只你共我
'''
# 模块初始化
engine = pyttsx3.init()
volume = engine.getProperty('volume')
# 标准的粤语发音
voices = engine.setProperty(
      'voice', "com.apple.speech.synthesis.voice.sin-ji")
# 普通话发音
# voices = engine.setProperty(
#     'voice', "com.apple.speech.synthesis.voice.ting-ting.premium")
# *甜美女生普通话发音
# voices = engine.setProperty(  
#     'voice', "com.apple.speech.synthesis.voice.mei-jia")
print('准备开始语音播报...')
# 输入语音播报词语
engine.setProperty('volume', 0.7)
engine.say(msg)
engine.runAndWait()
engine.stop()

image.gif

是不是很有趣,点个赞再走吧~

上一篇: lv_table

下一篇: 学习美式 KK 音标