基于python实现的百度新歌榜、热歌榜下载器(附代码)
作者:风的姿态 时间:2022-10-29 10:16:12
前言
首先声明,本工具仅仅为学习之用,不涉及版权问题,因为百度音乐里面的歌曲本身是可以下载的,而且现在百度也提供了”百度音乐播放器”,可以通过这个工具进行批量下载。
我当时做这个工具的时候,百度还没有提供”百度音乐播放器”,而我又想批量下载,所以做了这样的一个下载工具。当然,主要还是为了学习。
工具采用Python2.7.3+PyQt开发。
功能:
1.集中展示百度新歌榜或热歌榜可下载的歌单。
2.支持单个、多个歌曲的下载。
3.可复制歌单中所有的链接内容,方便在迅雷等下载工具中创建下载组。
缺陷:
目前采用单线程,效率不高,UI界面容易假死。
本工具运行流程:
1.模拟用户登录百度。
2.若登录成功,采集并解析页面内容,加载歌单列表。
3.用户点击下载按钮或者批量下载按钮后,下载歌曲。
使用方法:
1.在配置文件setting.py的最后,配置可登录百度的账号和密码,及百度热歌榜或新歌榜的URL.
username = "your baidu acount" #配置你的百度账号
password = "your baidu password" #配置你的百度密码
musiclistUrl = "http://music.baidu.com/top/dayhot" # http://music.baidu.com/top/new
2.直接运行mainWindow.py文件即可,如果网速不给力的话可能要等上3、4分钟。
运行后如图:
用到的知识:
1.首先用到了PyQt的GUI编程,窗体布局及QTableWidget、QProgressBar、QPushButton等控件及控件的重写
2.用到了网络编程的部分内容,利用urllib,urllib2,cookielib请求网页,模拟登录百度。
3.利用HTMLParser解析网页内容,匹配网页元素。
4.利用codecs进行文件的读写。
遇到的问题:
1.编码问题,由于在创建文件时将文件编码设置为UTF-8,当需要向文件写入的内容为中文等非ASCII码内容时,总是提示编码问题。其实,百度音乐的网页全部为UTF-8格式,因此从网页中获取的内容也是UTF-8格式,但是,要讲内容写入UTF-8的文本中,必须将网页内容进行decode(“utf8”)解码为unicode格式,才能正常写入。
检测内容编码,可以用chardet模块的chardet.detect(“内容”)的方法。
另外,HTMLParser解析网页内容过程中,有的下载页面会出现问题,根据提示信息发现还是编码问题,将feed()方法中的内容参数进行decode(“utf8”)后,结果正常。
decode将内容根据参数内容解码为unicode类型,具体要根据所采集的页面的编码。
github下载地址:点这里
来源:https://www.cnblogs.com/fengzheng/p/3779828.html
![](/images/zang.png)
![](/images/jiucuo.png)
猜你喜欢
MySQL查询缓存优化示例详析
![](https://img.aspxhome.com/file/2023/9/109789_0s.jpg)
SQL 随机查询 包括(sqlserver,mysql,access等)
FileUpload上传图片预览不变形
Python批量生成字幕图片的方法详解
![](https://img.aspxhome.com/file/2023/5/101705_0s.png)
Python 使用@property对属性进行数据规范性校验的实现
php 删除一维数组中某一个值元素的操作方法
详解如何在阿里云上安装mysql
Python 如何批量更新已安装的库
![](https://img.aspxhome.com/file/2023/9/105269_0s.jpg)
详解pandas.DataFrame中删除包涵特定字符串所在的行
![](https://img.aspxhome.com/file/2023/6/76966_0s.png)
python实现的各种排序算法代码
这些关于Go中interface{}的注意事项你都了解吗
Javascript文本框脚本实现方法解析
详解Python中的条件判断语句
![](https://img.aspxhome.com/file/2023/2/99512_0s.jpg)
python如何将一个四位数反向输出
python图片合成的示例
![](https://img.aspxhome.com/file/2023/2/121442_0s.png)
Python中每次处理一个字符的5种方法
解决pycharm编辑区显示yaml文件层级结构遇中文乱码问题
![](https://img.aspxhome.com/file/2023/0/123840_0s.jpg)