python使用BeautifulSoup分析网页信息的方法

作者:令狐不聪 时间:2022-02-07 11:33:40 

本文实例讲述了python使用BeautifulSoup分析网页信息的方法。分享给大家供大家参考。具体如下:

这段python代码查找网页上的所有链接,分析所有的span标签,并查找class包含titletext的span的内容

#import the library used to query a website
import urllib2

#specify the url you want to query
url = "http://www.python.org"

#Query the website and return the html to the variable 'page'
page = urllib2.urlopen(url)

#import the Beautiful soup functions to parse the data returned from the website
from BeautifulSoup import BeautifulSoup

#Parse the html in the 'page' variable, and store it in Beautiful Soup format
soup = BeautifulSoup(page)

#to print the soup.head is the head tag and soup.head.title is the title tag
print soup.head
print soup.head.title

#to print the length of the page, use the len function
print len(page)

#create a new variable to store the data you want to find.
tags = soup.findAll('a')

#to print all the links
print tags

#to get all titles and print the contents of each title
titles = soup.findAll('span', attrs = { 'class' : 'titletext' })
for title in allTitles:
print title.contents

希望本文所述对大家的Python程序设计有所帮助。

标签:python,BeautifulSoup,网页,信息
0
投稿

猜你喜欢

  • python实现任意位置文件分割的实例

    2021-01-17 18:18:22
  • Oracle中字符串截取常用方法总结【推荐】

    2024-01-26 16:55:02
  • python的​PyPDF2实现pdf文件切割和合并

    2023-02-07 19:57:39
  • ASP隐藏真实文件的下载功能实现代码

    2011-04-14 11:12:00
  • PHP面向对象编程之深入理解方法重载与方法覆盖(多态)

    2024-05-22 10:02:25
  • 基于JS实现01支付后的10秒倒计时

    2024-04-10 11:02:30
  • Python+OpenCV人脸检测原理及示例详解

    2021-07-31 19:31:51
  • jquery $(document).ready() 与window.onload的区别

    2024-04-19 10:23:59
  • Python中的fileinput模块的简单实用示例

    2023-06-19 01:09:27
  • go语言实现sftp包上传文件和文件夹到远程服务器操作

    2024-05-08 10:22:18
  • 详解PHP中的mb_detect_encoding函数使用方法

    2023-11-14 19:48:45
  • python之生产者消费者模型实现详解

    2021-12-03 14:37:15
  • 利用Python复制文件的9种方法总结

    2022-06-25 15:00:27
  • 详解pandas中利用DataFrame对象的.loc[]、.iloc[]方法抽取数据

    2021-12-21 04:06:14
  • pytorch 实现张量tensor,图片,CPU,GPU,数组等的转换

    2023-08-12 07:44:34
  • python获取http请求响应头headers中的数据的示例

    2023-06-30 14:49:02
  • Python实现自动化处理每月考勤缺卡数据

    2022-12-25 02:10:22
  • 详解Python进行数据相关性分析的三种方式

    2022-05-09 18:50:12
  • 使用JavaScript和CSS实现文本隔行换色的方法

    2024-04-19 09:46:52
  • 微信小程序开发之animation循环动画实现的让云朵飘效果

    2024-04-16 09:00:11
  • asp之家 网络编程 m.aspxhome.com