Python实现批量下载音效素材详解

作者:嗨学编程 时间:2021-09-19 02:08:27 

序言

作为当代新青年,应该多少会点短视频制作吧?

Python实现批量下载音效素材详解

哈哈,那当代自媒体创作者好了~

制作视频的时候,多少需要一些搞怪的声音?或者奇怪的声音?音乐等等~

一个个下载多慢,我们今天就用python实现批量下载~

环境/模块/目标

1、目标

Python实现批量下载音效素材详解

2、开发环境

兄弟们,刚学Python的话,不要安装一些其它的软件,就装这两个就可以了~

Python      环境
Pycharm     编辑器

3、模块

本次使用的模块主要是这两个

requests  # 数据请求模块
re        # 正则表达式模块

流程讲解

这次我详细写流程,小白都能看懂的那种,看完大家记得三连,给我一点创作的动力吧 ,嘿嘿~

Python实现批量下载音效素材详解

首先我们打开网址后右键选择检查

Python实现批量下载音效素材详解

选择network ,刷新页面往下滑,会出现一个 page-4 和 page-5 的页面。

Python实现批量下载音效素材详解

这两个页面很多数据是直接在这里有的,我们随便找一个点击播放,然后点击media ,在headers里面会有一个音频文件,就是我标注的下载地址。

Python实现批量下载音效素材详解

可以直接播放也可以直接下载

Python实现批量下载音效素材详解

那想获得这个这个地址怎么搞呢?

我们直接复制这串数字,比如32716 ,然后点击左上角的这个搜索框,搜索一下。

Python实现批量下载音效素材详解

搜索之后我们可以看到page-5这里就有音频的声音链接地址。

Python实现批量下载音效素材详解

音频标题也在这里可以找到

Python实现批量下载音效素材详解

然后我们点击headers,直接对于这个url地址发送请求。

Python实现批量下载音效素材详解

首先导入requests模块

import requests

url就是刚刚的链接

url = 'https://手动替换一下/search/word-/page-5'

然后我们加一个headers进行伪装

这里直接复制 headers 下面的 user-agent 里面的内容就好了

Python实现批量下载音效素材详解

记得加上引号

headers = {
   'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36'
}

然后发送请求,打印一下看看结果

response = requests.get(url=url, headers=headers)
print(response.text)

打印出来的内容太多了,我们直接在上面搜索MP3,精准定位,它的标题就在mp3文件下面那个链接那里。

Python实现批量下载音效素材详解

然后我们把它复制过来,用正则去匹配中间这段内容,中间的url用(.*?)代替。

首先导入re模块

import re

刚刚那段内容复制过来,.*?用括号括起来。

从 response.text 里面去匹配,匹配到的内容用play_url_list这个变量接收。

play_url_list = re.findall('<div class="ui360 ui360-vis"><a href="(.*?)"></a></div>', response.text)

然后打印一下看看有没有匹配到内容

print(play_url_list)

可以看到直接匹配到了mp3文件,它包含在一个列表里面。

Python实现批量下载音效素材详解

那我们还需要它的标题名字,同样的复制过来。

Python实现批量下载音效素材详解

还是一样的操作,url和名字都替换为 .*?

从 response.text 里面去匹配,匹配到的内容用name_list这个变量接收。

name_list = re.findall('<a class="h6 text-white font-weight-bold" target="_blank" href=".*?" title="(.*?)">.*?</a>', response.text)

打印一下

print(name_list)

可以看到名字这些数据,都已经获取到了。

Python实现批量下载音效素材详解

遍历一下,把获取到的数据打包到一起,然后一个个提取出来,获取它的一个二进制数据内容,用mp3_content 这个变量接收一下

for play_url, name in zip(play_url_list, name_list):
   mp3_content = requests.get(url=play_url, headers=headers).content

然后直接保存,with open 给它一个文件夹的名字,加上名字,加上 .mp3的后缀,保存方式 mode = wb , 用 f.write 这个变量接收一下 mp3_content

with open('音效\\' + name + '.mp3', mode='wb') as f:
       f.write(mp3_content)

这里咱们没有写自动创建文件夹, 所以需要手动创建一下文件夹,然后把你命名的名字写入进来。

Python实现批量下载音效素材详解

然后我们打印一下,看看结果。

print(name)

Python实现批量下载音效素材详解

相关的数据内容就保存在你创建的文件夹了

Python实现批量下载音效素材详解

注:所有的url大家自己手动替换一下,我这里把它们删了,不然会误杀

全部代码

import requests
import re
url = 'https://这里大家自己替换一下/search/word-/page-5'
headers = {
   'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
# print(response.text)
play_url_list = re.findall('<div class="ui360 ui360-vis"><a href="(.*?)"></a></div>', response.text)
name_list = re.findall('<a class="h6 text-white font-weight-bold" target="_blank" href=".*?" title="(.*?)">.*?</a>', response.text)
print(play_url_list)
print(name_list)
for play_url, name in zip(play_url_list, name_list):
   mp3_content = requests.get(url=play_url, headers=headers).content
   with open('音效\\' + name + '.mp3', mode='wb') as f:
       f.write(mp3_content)
       print(name)

来源:https://blog.csdn.net/fei347795790/article/details/123094211

标签:Python,下载,音效,素材
0
投稿

猜你喜欢

  • python列表推导式入门学习解析

    2022-04-25 14:28:00
  • Python中函数参数匹配模型详解

    2022-01-01 20:39:59
  • window.showModalDialog()返回值的学习心得总结

    2024-05-09 10:35:39
  • Golang开发gRPC服务入门介绍

    2024-02-14 09:56:20
  • 如何使用Python 抓取和优化所有网站图像

    2022-05-18 12:36:00
  • Javascript实现的鼠标经过时播放声音

    2010-05-18 20:03:00
  • Pandas中Series的属性,方法,常用操作使用案例

    2021-11-22 05:00:47
  • 置信椭圆原理以及椭圆图形绘制方式

    2021-04-24 04:25:04
  • Python性能测试工具Locust安装及使用

    2021-08-17 23:22:56
  • python判定文件目录是否存在及创建多层目录

    2022-08-12 09:39:03
  • Jupyter notebook中5个有趣的魔法命令分享

    2021-11-28 23:26:30
  • js实现滑动进度条效果

    2023-08-24 03:47:39
  • linux下mysql链接被防火墙阻止的解决方法

    2024-01-16 17:31:27
  • 关于vue中根据用户权限动态添加路由的问题

    2024-05-05 09:25:11
  • ThinkPHP模板判断输出Empty标签用法详解

    2023-11-14 20:46:54
  • C#创建数据库及导入sql脚本的方法

    2024-01-23 04:08:04
  • 讲解Python中运算符使用时的优先级

    2022-12-28 14:40:17
  • 实例操作MySQL短链接

    2024-01-16 00:07:42
  • Pytorch数据读取之Dataset和DataLoader知识总结

    2023-11-02 22:57:37
  • sqlserver 复制表 复制数据库存储过程的方法

    2024-01-21 17:01:00
  • asp之家 网络编程 m.aspxhome.com