python调用pyaudio使用麦克风录制wav声音文件的教程

作者：迷茫小菜菜时间：2023-12-16 13:32:15　

python的pyaudio可以进行录音，播放，生成wav文件等等,WAVE是录音时用的标准的WINDOWS文件格式，文件的扩展名为WAV，数据本身的格式为PCM或压缩型，属于无损音乐格式的一种。在我们研究语音识别，自然语言处理的过程中，常常会使用到它，比如我们调用百度语音识别所以我们首先研究一下pyaudio库的安装与使用。

安装：

pip install pyaudio

调用pyaudio使用麦克风录制声音：

python中的pyaudio库可以直接通过麦克风录制声音，我们可以通过调用该库，获取到wav测试语音。具体代码如下所示：

#!/usr/bin/python3
# -*- coding: utf-8 -*-
from pyaudio import PyAudio, paInt16
import numpy as np
from datetime import datetime
import wave
class recoder:
NUM_SAMPLES = 2000 #pyaudio内置缓冲大小
SAMPLING_RATE = 8000 #取样频率
LEVEL = 500 #声音保存的阈值
COUNT_NUM = 20 #NUM_SAMPLES个取样之内出现COUNT_NUM个大于LEVEL的取样则记录声音
SAVE_LENGTH = 8 #声音记录的最小长度：SAVE_LENGTH * NUM_SAMPLES 个取样
TIME_COUNT = 60 #录音时间，单位s
Voice_String = []
def savewav(self,filename):
wf = wave.open(filename, 'wb')
wf.setnchannels(1)
wf.setsampwidth(2)
wf.setframerate(self.SAMPLING_RATE)
wf.writeframes(np.array(self.Voice_String).tostring())
# wf.writeframes(self.Voice_String.decode())
wf.close()
def recoder(self):
pa = PyAudio()
stream = pa.open(format=paInt16, channels=1, rate=self.SAMPLING_RATE, input=True,
frames_per_buffer=self.NUM_SAMPLES)
save_count = 0
save_buffer = []
time_count = self.TIME_COUNT
while True:
time_count -= 1
# print time_count
# 读入NUM_SAMPLES个取样
string_audio_data = stream.read(self.NUM_SAMPLES)
# 将读入的数据转换为数组
audio_data = np.fromstring(string_audio_data, dtype=np.short)
# 计算大于LEVEL的取样的个数
large_sample_count = np.sum( audio_data > self.LEVEL )
print(np.max(audio_data))
# 如果个数大于COUNT_NUM，则至少保存SAVE_LENGTH个块
if large_sample_count > self.COUNT_NUM:
save_count = self.SAVE_LENGTH
else:
save_count -= 1
if save_count < 0:
save_count = 0
if save_count > 0 :
# 将要保存的数据存放到save_buffer中
#print save_count > 0 and time_count >0
save_buffer.append( string_audio_data )
else:
#print save_buffer
# 将save_buffer中的数据写入WAV文件，WAV文件的文件名是保存的时刻
#print "debug"
if len(save_buffer) > 0 :
self.Voice_String = save_buffer
save_buffer = []
print("Recode a piece of voice successfully!")
return True
if time_count==0:
if len(save_buffer)>0:
self.Voice_String = save_buffer
save_buffer = []
print("Recode a piece of voice successfully!")
return True
else:
return False
if __name__ == "__main__":
r = recoder()
r.recoder()
r.savewav("test.wav")

pyaudio文档：http://people.csail.mit.edu/hubert/pyaudio/docs/

总结

以上所述是小编给大家介绍的python调用pyaudio使用麦克风录制wav声音文件的教程,网站的支持！
如果你觉得本文对你有帮助，欢迎转载，烦请注明出处，谢谢！

来源：https://blog.csdn.net/Berylxuan/article/details/80826533

标签：python,pyaudio,wav

投稿

python调用pyaudio使用麦克风录制wav声音文件的教程

猜你喜欢

详解Go语言Slice作为函数参数的使用

java连接mysql数据库乱码的解决方法

javascript 继承学习心得总结

如何解决因使用On Error Resume Next导致错误不正确的问题？

Python中list列表的一些进阶使用方法介绍

Windows server 2008 r2上安装MySQL5.7.10步骤

详解inet_pton()和inet_ntop()函数

VS2019 自定义项目模板的实现方法

pytorch: Parameter 的数据结构实例

JS数组去重的九种高阶方法（亲测有效）

Python编程中如何捕获警告ps不是捕获异常

Sql server中时间查询的一个比较快的语句

Python采用Django制作简易的知乎日报API

降低锁竞争减少MySQL用户等待时间

优化SQL Server的内存占用之执行缓存

git版本库创建拓展添加文件到版本库教程

pyqt5 从本地选择图片并显示在label上的实例

费茨法则在交互设计中的应用

oracle 触发器实现出入库

教你用Python查看茅台股票交易数据的详细代码

python调用pyaudio使用麦克风录制wav声音文件的教程

猜你喜欢

详解Go语言Slice作为函数参数的使用

java连接mysql数据库乱码的解决方法

javascript 继承学习心得总结

如何解决因使用On Error Resume Next导致错误不正确的问题？

Python中list列表的一些进阶使用方法介绍

Windows server 2008 r2上安装MySQL5.7.10步骤

详解inet_pton()和inet_ntop()函数

VS2019 自定义项目模板的实现方法

pytorch: Parameter 的数据结构实例

JS数组去重的九种高阶方法（亲测有效）

Python编程中如何捕获警告ps不是捕获异常

Sql server中时间查询的一个比较快的语句

Python采用Django制作简易的知乎日报API

降低锁竞争 减少MySQL用户等待时间

优化SQL Server的内存占用之执行缓存

git版本库创建拓展添加文件到版本库教程

pyqt5 从本地选择图片 并显示在label上的实例

费茨法则在交互设计中的应用

oracle 触发器 实现出入库

教你用Python查看茅台股票交易数据的详细代码

降低锁竞争减少MySQL用户等待时间

pyqt5 从本地选择图片并显示在label上的实例

oracle 触发器实现出入库