Python反爬实战掌握酷狗音乐排行榜加密规则

作者:五包辣条! 时间:2021-05-29 08:05:57 

效果展示

Python反爬实战掌握酷狗音乐排行榜加密规则

爬取目标

网址:酷我音乐

Python反爬实战掌握酷狗音乐排行榜加密规则

工具使用

开发工具:pycharm

开发环境:python3.7, Windows10

使用工具包:requests,re

项目思路解析

找到需要解析的榜单数据

Python反爬实战掌握酷狗音乐排行榜加密规则

随意点击一个歌曲获取到音乐的详情数据 通过抓包的方式获取到音乐播放数据

Python反爬实战掌握酷狗音乐排行榜加密规则

找到MP3的数据提交地址 mp3数据来自于这个url地址

Python反爬实战掌握酷狗音乐排行榜加密规则

Python反爬实战掌握酷狗音乐排行榜加密规则

提交数据的网址:


https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery19102816534571347611_1626783818555&hash=A38449E76C74D45825F565C1FDB825C0&dfid=3dKstH1sJdRa44o6Vj0ZIryF&mid=4458f6d567640b39de367a394d69879e&platid=4&album_id=40437970&_=1626783818556

将多个网址数据进行对比看看哪些参数是需要自行修改的

Python反爬实战掌握酷狗音乐排行榜加密规则 

变化的url数据有3个

  • hash

  • album_id

  • _

_ 可以明显看出来是时间戳 需要获取到对应的hash以及album_id的值 来到主页找寻对应的歌曲id数据 发现数据来自网页源代码

Python反爬实战掌握酷狗音乐排行榜加密规则

歌曲的数据都是来自网页源代码

Python反爬实战掌握酷狗音乐排行榜加密规则

梳理整体思路:

  • 从首页源码里提取出对应的hash、album_id值

  • 组合成新的url地址

  • 获取到json数据总的歌曲播放地址

简易源码分享

本章内容只限学习,切勿用作其他用途!!!!!


import requests
import re
import time
def Tools(url):
   headers = {
       'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.70'
   }
   response = requests.get(url, headers=headers)
   return response
def Save(name, url):
   mp3 = Tools(url).content  # 请求mp3地址链接 返回格式是16进制
   f = open('./kugou/{}.mp3'.format(name), 'wb') # w 文件存在就写入  不存在就会创建  b进制读写
   f.write(mp3)
   f.close()
   print('{}下载完成....'.format(name))
url = 'https://www.kugou.com/yy/html/rank.html'
response = Tools(url).text
album_id = re.findall(r'"album_id":(\d*?),', response) # id
Hash = re.findall(r'"Hash":"(.*?)",', response)  # hash
for a, h in zip(album_id, Hash):
   # 生成时间戳
   time1 = int(time.time() * 1000)
   # 包含歌曲下载地址的url
   urls = 'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&hash={}&dfid=0zlWqK0UWNFa0weUnX0hjlFa&mid=f79511e2e86914b99e351c42ba1f8bc7&platid=4&album_id={}&_={}'.format(h, a, time1)
   response1 = Tools(urls).json()
   audio_name = response1['data']['audio_name'].split('-')[1]
   play_url = response1['data']['play_url']
   Save(audio_name, play_url)

来源:https://blog.csdn.net/AI19970205/article/details/118944328

标签:Python,反爬,酷狗,排行榜
0
投稿

猜你喜欢

  • Python3 利用face_recognition实现人脸识别的方法

    2023-11-05 05:08:02
  • 如何从IP获知其所在地?

    2009-11-15 19:54:00
  • 图像替换新技术:状态域方法[译]

    2009-08-06 16:41:00
  • :hover在IE6下的问题

    2009-06-18 21:09:00
  • Mysql数据库名和表名的大小写敏感性问题

    2010-06-07 14:07:00
  • 动网论坛的asp 数据库连接代码

    2011-04-06 10:32:00
  • 除Console.log()外更多的Javascript调试命令

    2023-08-12 23:31:17
  • asp利用dictionary创建二维数组

    2009-02-02 09:54:00
  • PHPMailer发送邮件功能实现流程

    2023-06-03 13:11:18
  • XML教程:什么是XML及XML和HTML的区别

    2008-09-05 17:21:00
  • SQL Transcation的一些总结分享

    2012-08-21 10:21:28
  • PHP中使用addslashes函数转义的安全性原理分析

    2023-08-16 10:31:22
  • 分析Silverlight Button控件布局

    2009-02-17 13:13:00
  • Linux 创建oracle数据库的详细过程

    2023-07-14 15:59:09
  • python unicodedata模块用法

    2021-04-05 20:53:55
  • 就 CSS3 向 Eric Meyer 请教的 6 个问题

    2008-12-29 13:52:00
  • 在SQL Server中使用SQL语句查询一个存储过程被其它所有的存储过程引用的存储过程名

    2012-07-11 16:09:40
  • python OpenCV 实现高斯滤波详解

    2022-11-22 16:40:34
  • XML 问题: 超越DOM(轻松使用 DOM 的技巧和诀窍)

    2008-09-05 17:12:00
  • PHP json格式和js json格式 js跨域调用实现代码

    2023-11-22 05:20:18
  • asp之家 网络编程 m.aspxhome.com