用Python下载一个网页保存为本地的HTML文件实例
作者:麦克斯韦的妖精 时间:2023-04-15 18:41:53
我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库。
比如我们要下载山东大学新闻网的一个页面,该网页如下:
实现代码如下:
import urllib.request
def getHtml(url):
html = urllib.request.urlopen(url).read()
return html
def saveHtml(file_name, file_content):
# 注意windows文件命名的禁用符,比如 /
with open(file_name.replace('/', '_') + ".html", "wb") as f:
# 写文件用bytes而不是str,所以要转码
f.write(file_content)
aurl = "http://www.view.sdu.edu.cn/info/1003/75240.htm"
html = getHtml(aurl)
saveHtml("sduview", html)
print("下载成功")
打开相应的目录可以看到这个网页已经被下载保存成功了
我们用浏览器打开这个网页文件如下
由于我们只是下载了网页的主要源码,其中的很多图片之类的文件都不在这里。因此这种方法只适用于提取文字内容。
来源:https://blog.csdn.net/john_bian/article/details/71025372
标签:python,下载,网页,保存,HTML
![](/images/zang.png)
![](/images/jiucuo.png)
猜你喜欢
在访客的内心深处做导航
2008-06-05 12:43:00
Ext.js源码研读总结
2009-03-04 12:06:00
python hough变换检测直线的实现方法
2022-06-11 10:08:37
![](https://img.aspxhome.com/file/2023/3/109993_0s.png)
Python中选择结构实例讲解
2023-06-26 14:56:09
连接MySQL时出现1449与1045异常解决办法
2024-01-16 14:07:02
网红编程语言Python将纳入高考你怎么看?
2022-06-28 15:48:12
![](https://img.aspxhome.com/file/2023/3/92233_0s.png)
oracle数据库创建备份与恢复脚本整理
2023-07-13 00:57:20
python3实现简单飞机大战
2022-11-11 02:27:18
![](https://img.aspxhome.com/file/2023/3/99173_0s.jpg)
PyTorch数据读取的实现示例
2022-01-31 04:15:48
![](https://img.aspxhome.com/file/2023/9/70739_0s.png)
运行asp.net程序 报错:磁盘空间不足
2024-01-16 23:48:21
Mootools 1.2教程(1)——MooTools介绍
2008-11-12 13:01:00
![](https://img.aspxhome.com/file/UploadPic/up/9-Mootools-1.2.gif)
Python中PyAutoGUI帮助文档(推荐!)
2022-12-18 20:50:16
关于PySnooper 永远不要使用print进行调试的问题
2022-12-08 10:29:35
vue-router传参的4种方式超详细讲解
2024-04-27 15:48:21
redis服务器环境下mysql实现lnmp架构缓存
2024-01-20 01:44:29
![](https://img.aspxhome.com/file/2023/1/107441_0s.png)
Python多线程爬虫实战_爬取糗事百科段子的实例
2021-02-15 16:58:21
sqlserver 数据库压缩与数据库日志(ldf)压缩方法分享
2012-01-05 18:57:19
go日志库logrus的安装及快速使用
2024-04-26 17:31:40
MySQL8设置自动创建时间和自动更新时间的实现方法
2024-01-17 08:02:44
用javascript代替marquee的滚动字幕效果代码
2024-05-22 10:36:09