Python爬虫获取基金净值信息详情

作者:??斜月???? 时间:2022-04-23 07:53:42 

1 前言

前面的文章中我们已经获取到了基金的阶段变动信息和ETF信息的获取,那么在本章中,我们将继续前面的内容,获取基金的价格信息,并且把之前的抓取到的数据存入到数据库中,方便我们进行后续的分析操作。

2 获取基金净值

获取基金的净值信息,也就是基金的最近一个交易日的价格,如下图所示,展示了单位净值更新的日期,价格以及涨跌幅度信息。顺便我们也获取一下基金的规模信息,后续选择到同类基金不知道怎么去选择的时候,可以选择按照基金规模进行倒排序,选取规模比较大的进行投资,大概率能够保证投资收益的稳定性和可靠性。

Python爬虫获取基金净值信息详情

过分分析,我们可以知道,基金的价格信息需要先获取 class="dataItem0" 的 dl 标签,基金规模信息的获取方式也如上图,可以知道规模信息在 <div class="infoOfFund">标签中的table 中的第二个td 中 :

单位净值日期获取方式:

dt>p 标签内容

基金净值和变动信息获取方式:

  • dd.dataNums>span[0] 标签为单位净值

  • dd.dataNums>span[1] 标签为变动百分比

基金规模信息的获取方式:

div>table>td[2]

基于以上的分析,我们最终实现的代码如下图所示,通过以上方式我们就获取到了基金的价格信息数据:

Python爬虫获取基金净值信息详情

打印的结果如下图所示:

code 159779 price 1.0007 percent 0.07 fund_size 3.55 update_date 2021-11-19

3 数据库结构设计

在获取到数据之后,需要将数据进行结构化存储 

Python爬虫获取基金净值信息详情

4 如何进行数据存储

需要进行存储,就需要使用数据库。在java中存储数据有各种各样的orm框架进行操作,但是Python中没有这么重的操作,需要自己书写sql进行操作。首先我们需要安装操作数据库的类库。

# 安装 pymysql
pip install pymysql

接下来我们需要配置数据库的连接信息,通过连接信息,编写两个方法,一个是查询数据库的信息,另外一个是修改数据库的信息(增/删/改)。修改数据的时候一定要记得commit()数据库信息,否则不会保存成功。

Python爬虫获取基金净值信息详情

5 总结

本文介绍了如何获取基金的价格信息,同时也进行了数据库结构的设计以及数据存储的操作方法,由于代码和表结构会占用大量的文案,文章就贴图展示

来源:https://juejin.cn/post/7033197658269614117

标签:Python,获取,基金,净值,信息
0
投稿

猜你喜欢

  • python如何读取和存储dict()与.json格式文件

    2021-12-07 16:13:36
  • 浅谈Python实现Apriori算法介绍

    2021-09-14 19:10:22
  • windows下cx_Freeze生成Python可执行程序的详细步骤

    2022-12-06 05:27:57
  • 让验证码友好一点

    2007-10-20 13:45:00
  • Python:format格式化字符串详解

    2021-02-11 19:23:58
  • Mootools 1.2教程(9)——输入过滤第二部分(字符串)

    2008-12-01 12:25:00
  • python 执行文件时额外参数获取的实例

    2022-09-24 05:46:54
  • Pycharm安装scrapy及初始化爬虫项目的完整步骤

    2023-04-03 10:49:43
  • python安装本地whl的实例步骤

    2023-05-09 05:25:33
  • ASP中CACHE缓存技术

    2010-05-03 10:58:00
  • Python标准库使用OrderedDict类的实例讲解

    2022-07-17 22:27:31
  • XHTML1.0与HTML兼容指引16条[译]

    2009-06-10 14:45:00
  • python实现12306登录并保存cookie的方法示例

    2021-08-05 18:37:55
  • pydev使用wxpython找不到路径的解决方法

    2023-02-23 05:01:01
  • Python中Django与Echarts的结合用法图文详解

    2022-02-09 23:10:29
  • python光学仿真面向对象光学元件类的实现

    2022-10-11 19:45:06
  • Python反爬虫伪装浏览器进行爬虫

    2023-07-05 22:33:38
  • php安全攻防利用文件上传漏洞与绕过技巧详解

    2023-07-23 12:08:06
  • JS实现css边框样式设置工具

    2008-05-25 16:22:00
  • Oracle使用PL/SQL操作COM对象

    2010-07-21 12:56:00
  • asp之家 网络编程 m.aspxhome.com