用Python怎么实现识别语音并且播报出来的功能
Admin 2022-07-05 群英技术资讯 912 次浏览
今天这篇我们来学习和了解“用Python怎么实现识别语音并且播报出来的功能”,下文的讲解详细,步骤过程清晰,对大家进一步学习和理解“用Python怎么实现识别语音并且播报出来的功能”有一定的帮助。有这方面学习需要的朋友就继续往下看吧!首先下载需要用到的库:pip install pyttsx3 -i https://mirrors.aliyun.com/pypi/simple/
接下来直接上代码:
import win32com.client as win
# SpVoice类是支持语音合成(TTS)的核心类。通过SpVoice对象调用TTS引擎,从而实现朗读功能
speak = win.Dispatch("SAPI.SpVoice")
# 完成将文本信息转换为语音并按照指定的参数进行朗读。
# 该方法有Text和Flags两个参数,分别指定要朗读的文本和朗读方式(同步或异步等)。
speak.Speak("come on")
speak.Speak("你好")
最后运行代码,就会听到系统传出来的声音,读出了 come on 和 你好。
开始之前我们先得解析出来Yolo3的代码,从而获取到被识别出来的物体标签。
首先我们找到一个coco_classes.txt,发现里面有很多的英文单词,这些就是准备识别匹配的标签了。

然后我们在找到yolo.py,发现的我们的coco_classes.txt被传入进来了

关键的来了,我们通过Ctrl + F 搜索一下classes_path这个Key,发现这几行代码

这里就是读取了存放标签的那个文本,进行了处理,并且返回了名字。
最后找到这一行代码,此处代码就是一开始进行识别的时候,我们的控制台打印出来的代码。

运行代码的时候发现,打印的这个label,就是识别出的物体的标签了。
这个时候我们就可以将我们的语音播报的代码添加进行,把label传入进去,就会发现识别出来的物体就会通过语音返回。

Time~
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要介绍了python 中[0]*2与0*2的区别说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
Python三位数逆序输出的方法及代码是什么,有不少朋友对此感兴趣,下面小编给大家整理和分享了相关知识和资料,易于大家学习和理解,有需要的朋友可以借鉴参考,下面我们一起来了解一下吧。
这篇文章主要为大家介绍了Python处理yaml和嵌套数据结构技巧示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
Python在很大程度上可以对shell脚本进行替代。笔者一般单行命令用shell,复杂点的多行操作就直接用Python了。这篇文章就归纳一下Python的一些实用脚本操作。
这篇文章主要介绍了基于python使用OpenCV进行物体轮廓排序,在进行图像处理过程中,我们经常会遇到一些和物体轮廓相关的操作,我们直接使用Opencv的findContours函数可以很容易的得到每个目标的轮廓,但是可视化后, 这个次序是无序的,更多相关资料请参考下面文章内容
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 ICP核准(ICP备案)粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008