Python采集情感音频的实现示例

作者:极客飞虎 时间:2023-06-11 23:17:10 

前言

我最近喜欢去听情感类的节目,比如说,婚姻类,我可能老了吧。我就想着怎么把音乐下载下来了,保存到手机上,方便我们业余时间去听。

发送请求

首先,我们要确定我们的目标网址,我们想要获取到每一个音频的地址。

Python采集情感音频的实现示例

我们发送请求,获取网页源代码。我们相信大家这里的代码都会写了。

url = 'https://www.ximalaya.com/album/37453303'

headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36',
}

res = requests.get(url,headers=headers)

requests 是 Python 的一个内置模块,用于发送 HTTP 请求。在这个例子中,我们使用 requests.get() 函数向 https://www.ximalaya.com/album/37453303 发送一个 GET 请求,并将请求头和响应体作为参数传递给函数。

获取数据

info_list = re.findall('"tracks":[(.*?)]', res.text)[1]
print(info_list)

子字符串列表中的第一个元素就是我们要找的 tracks 字符串。我们将其存储在 info_list 变量中,并使用 print() 函数输出。

Python采集情感音频的实现示例我们发现,我们想要的数据,就在我们匹配的内容中。里面包含了每一个音乐的标题和其id,我们接下来把这个获取下来。

注意,这里,不是json数据,所以,我们只能正则去匹配。

Python采集情感音频的实现示例

解析数据

我们通过对比url发现,我们只需要拿到uid,就可以直接访问到音频。这里就不多解释。

audio = f'https://www.ximalaya.com/revision/play/v1/audio?id={trackId}&ptype=1'

我们只需要把trackID换掉,就可以了。请求上面的url,就可以拿到音频的地址。接下来,我们写代码。

for trackId, title in zip(trackIds, titles):
   audio = f'https://www.ximalaya.com/revision/play/v1/audio?id={trackId}&ptype=1'
   print(audio)
   audio_res = requests.get(audio, headers=headers)
   audio_url = audio_res.json()['data']['src']
   print(audio_url)

zip() 函数用于将两个列表合并成一个列表。在这个例子中,我们使用 zip() 函数将 trackIds 和 titles 两个列表合并成一个列表,并将其存储在 trackIds 变量中。

然后,我们将 trackId 和 title 转换为字符串格式,并将其存储在 audio 变量中。

接下来,我们使用 requests.get() 函数向 audio 发送一个 GET 请求,并将请求头和响应体作为参数传递给函数。最后,我们使用 json() 方法将响应体中的 data 字段转换为 JSON 格式,并使用 ['data']['src'] 取出了 src 属性,即 audio_url 的值,并将其存储在 audio_url 变量中。

保存数据

music_content = requests.get(audio_url, headers=headers).content

with open('music//' + f'{title}' + '.mp3', mode='wb') as filename:
   filename.write(music_content)
   print(title, '保存成功')

接下来,我们请求这个网页,保存二进制到本地。with open() 语句用于自动关闭文件,确保文件在使用完毕后被正确关闭。在这个例子中,我们使用 with open() 语句打开一个名为 music// + title + .mp3的文件,并将其保存到变量filename 中。

然后,我们使用 write() 方法将音频内容写入文件中。

来源:https://juejin.cn/post/7224418285798408252

标签:Python,采集,音频
0
投稿

猜你喜欢

  • python验证码识别的示例代码

    2023-08-04 03:20:24
  • MySQL中索引的优化的示例详解

    2024-01-26 21:31:25
  • Python面向对象程序设计之私有变量,私有方法原理与用法分析

    2022-04-17 01:37:50
  • SQL数据库连接超时时间已到的问题

    2024-01-20 15:05:53
  • MySQL Limit执行过程分析探索

    2024-01-14 05:44:31
  • Python办公自动化Word转Excel文件批量处理

    2022-06-24 21:02:23
  • 单步调试 step into/step out/step over 区别说明

    2022-03-09 20:03:26
  • C#如何在窗体程序中操作数据库数据

    2024-01-22 13:31:41
  • 全面解析Bootstrap表单使用方法(表单样式)

    2024-05-10 14:08:28
  • SQL Server重置IDENTITY属性种子值操作

    2024-01-27 22:50:11
  • Python自动化办公之Word文件内容的读取

    2021-04-06 18:18:18
  • Go语言题解LeetCode561数组拆分

    2023-06-20 22:49:14
  • vue监听页面中的某个div的滚动事件并判断滚动的位置

    2024-05-09 15:08:49
  • Django models.py应用实现过程详解

    2021-07-18 11:11:08
  • python使用pdfminer解析pdf文件的方法示例

    2023-07-31 00:36:47
  • python实现线程池的方法

    2023-03-10 14:08:06
  • Python3简单实例计算同花的概率代码

    2023-07-20 16:23:03
  • 分享python机器学习中应用所产生的聚类数据集方法

    2021-06-05 13:28:39
  • 选择utf-8还是GB2312?

    2009-06-19 13:05:00
  • 浅谈MySQL 有哪些死锁场景

    2024-01-13 13:45:54
  • asp之家 网络编程 m.aspxhome.com