python爬取酷狗音乐排行榜
作者:qq_18525247 时间:2021-01-24 19:43:49
本文为大家分享了python爬取酷狗音乐排行榜的具体代码,供大家参考,具体内容如下
#coding=utf-8
from pymongo import MongoClient
import time
import requests
from lxml import etree
client = MongoClient() #连接mongo
hello = client.hello #连接数据库
user = hello.song #连接表
headers = {
'User-Agent': 'Mozilla/5.0 (Android 6.0; Nexus 5 Build/MRA58N)\
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Mobile Safari/537.36'}
def get_info(url):
'''
get源码,encode,解析,xpath,保存
'''
response = requests.get(url, headers=headers)
response = response.text.encode('utf-8')
selector = etree.HTML(response)
soup = selector.xpath('//*[@class="pc_temp_songlist "]/ul//li/a/text()')
#保存到本地
# with open('aa.txt','a') as f:
# for i in soup:
# f.write(i.encode('utf-8') + '\n')
#存入数据库
for i in soup:
user.insert({'song': i})
if __name__ == '__main__':
urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html?from=rank'.format(str(i)) for i in range(1, 24)]
for url in urls:
print(url)
get_info(url)
来源:https://blog.csdn.net/qq_18525247/article/details/80238425
标签:python,爬取,酷狗音乐
0
投稿
猜你喜欢
FrontPage XP设计教程5——表单的设计
2008-10-11 12:35:00
python交易记录整合交易类详解
2022-09-15 20:18:37
Python新手如何进行闭包时绑定变量操作
2021-05-01 15:23:55
MYSQL server has gone away解决办法
2010-11-25 17:22:00
Opera下的max-width BUG
2010-06-26 12:51:00
操作Windows注册表的简单的Python程序制作教程
2023-01-04 00:17:40
fso怎样判断一个盘上是否有文件
2007-09-26 12:35:00
pycharm 设置项目的根目录教程
2021-02-05 05:12:31
基于循环神经网络(RNN)实现影评情感分类
2021-11-27 16:42:10
Python requests发送post请求的一些疑点
2022-09-09 17:45:03
Pycharm最全报错的原因与解决方法总结(推荐!)
2023-10-26 04:20:03
PHP7正式版测试,性能惊艳!
2023-09-12 07:41:43
Zend Studio去除编辑器的语法警告设置方法
2023-10-11 17:10:15
Python实现双向链表
2022-06-12 17:41:34
收集的几个Python小技巧分享
2023-06-14 01:54:01
关于计算到期时间的问题
2009-05-26 15:51:00
asp如何建立和删除文件夹?
2009-11-26 20:34:00
跨浏览器让javascript文件携带图片数据
2011-03-31 17:12:00
CSS选择符小讲
2009-09-17 11:53:00
php初始化对象和析构函数的简单实例
2023-11-09 18:11:14