Python实现一键下载视频脚本

作者:OpenHacker 时间:2023-08-26 18:51:17 

需求

小编通常会上一些专业的视频网站比如腾讯视频、优酷,在上面看电影、电视剧。这些网站有个优点,可以缓存视频,在通勤路上比如地铁就可以愉快的刷剧了,因为地铁上的网速通常不怎么好。

但是有一些经典电影或者电视剧,这些视频并没有提供,那么我们只能上一些 * 网站看了,资源是有了,但是问题来了,这些 * 网站大多数都没有视频下载功能,那在地铁上就没法看了。

如果可以把这些视频下载下来,再传输到手机里不就可以离线看了吗?

接下来小编就演示下如何用 python 脚本来实现一键下载 * 网站的视频。

以下脚本可以学习到

  • python selenium 的使用

  • python requests 的使用

  • 分片下载视频存储本地

  • 实时输出视频下载进度

注意:

这里的脚本主要用于测试学习目的,切勿用于生产环境等商业目的

推荐大家访问官方指定平台或专业视频网站,支持正版

解决方案

小编以经常看的在线之家为例,这个网站可以找到很多美剧资源。

首先,我们用谷歌浏览器打开一个视频地址,比如https://www.zxzj.fun/video/1529-1-1.html,按F12或者右击“检查”打开浏览器控制台

Python实现一键下载视频脚本

然后,点击控制台最左边的选择元素按钮,或者按Ctrl + Shift + C,选择网页的视频区域,就能看到video标签

<video
 class="dplayer-video dplayer-video-current lwebapp.com"
 webkit-playsinline=""
 playsinline=""
 preload="metadata"
 src="https://vod.pipi.cn/8f6897d9vodgzp1251246104/1881b495387702292624167851/f0.mp4"
></video>

可以发现src属性值就是视频链接,并且是采用单独的.mp4视频地址,这种地址原理上可以直接从浏览器下载的,直接复制这个地址在浏览器打开,就可以右击下载。但是电视剧通常有很多集,每次都手动打开网页-打开控制台-复制视频地址-再打开视频-最后下载视频,就很繁琐。这时候就是脚本排上用场的时候了,可以把这个流程自动化,简化重复操作的过程。

脚本的整体思路

  • 使用selenium打开网页

  • 通过selenium元素选择器找到video标签所在的iframe,切换到iframe

  • 通过video标签,获取到视频地址,然后请求视频内容

  • 采用分片下载的方式拼接视频存储到本地

代码

#!/usr/bin/python
# -*- coding: UTF-8 -*-
# 首发 lwebapp.com
import requests
# 谷歌浏览器驱动
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# sleep模块,让程序停止往下运行
from time import sleep

# 设置谷歌浏览器驱动
driver = webdriver.Chrome()

# 手动改为想要下载的视频所在网页地址
url = 'https://www.zxzj.fun/video/1529-1-1.html'

# 打开网页
driver.get(url)

try:
 # 通过元素选择器找到iframe
   iframe = WebDriverWait(driver, 10).until(
       EC.presence_of_element_located(
           (By.CSS_SELECTOR, '#playleft iframe'))
   )
except:
   driver.quit()

# 获取到网页title,便于直观看到当前下载的视频标题
title = driver.find_elements(By.TAG_NAME, 'title')[
   0].get_attribute('innerHTML')

# 切换到iframe
driver.switch_to.frame(iframe)

# 通过video标签获取视频地址
video = driver.find_elements(By.TAG_NAME, 'video')[0]
video_url = video.get_attribute('src')
print('video', video_url)

# 已经获取到视频地址,可以关闭浏览器
driver.quit()

# 设置请求头信息
headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36 Edg/96.0.1054.62'
}

# 请求视频内容
video_content = requests.get(video_url, headers=headers, stream=True)

print("开始下载")

# 视频大小
contentLength = int(video_content.headers['content-length'])

line = '大小: %.2fMB'

# 大小换算
line = line % (contentLength/1024/1024)

# 打印视频总长度
print(line)

# 存储已经下载的长度
downSize = 0

print('video_name', title)

# 分片下载
with open(title+'.mp4', "wb") as mp4:
   for chunk in video_content.iter_content(chunk_size=1024 * 1024):
       if chunk:
           mp4.write(chunk)

# 记录已下载视频长度,实时输出下载进度
           downSize += len(chunk)
           print('进度:{:.2%}'.format(downSize / contentLength), end='\r')

print("下载结束")

来源:https://segmentfault.com/a/1190000041230054

标签:Python,下载,视频
0
投稿

猜你喜欢

  • Python 实现日志同时输出到屏幕和文件

    2021-06-25 23:04:29
  • Python使用Pandas处理测试数据的方法

    2021-12-18 10:47:18
  • mysql 一个较特殊的问题:You can't specify target table 'wms_cabinet_form'

    2024-01-24 19:07:13
  • Sqlserver timestamp数据类使用介绍

    2024-01-13 22:31:11
  • python实现中文文本分句的例子

    2023-02-15 12:16:24
  • OpenCV+Python识别车牌和字符分割的实现

    2022-10-09 11:15:23
  • 几个好用的Asp自定义函数

    2007-09-26 14:28:00
  • wxpython自定义下拉列表框过程图解

    2023-11-14 04:01:18
  • 编程知识点(1)关键词之存储类型

    2023-06-26 20:18:36
  • Go1.18新特性使用Generics泛型进行流式处理

    2024-02-17 07:12:42
  • Python中logging日志记录到文件及自动分割的操作代码

    2022-09-08 12:33:33
  • Python搭建代理IP池实现检测IP的方法

    2023-10-05 04:42:51
  • 谈PHP生成静态页面分析 模板+缓存+写文件

    2023-11-14 12:44:39
  • Python编程中NotImplementedError的使用方法

    2023-06-08 15:40:40
  • python获取文件后缀名及批量更新目录下文件后缀名的方法

    2021-02-19 20:51:14
  • 用Python shell简化开发

    2023-12-16 17:19:04
  • Python实现屏幕代码雨效果的示例代码

    2021-08-29 12:48:09
  • JavaScript画圆

    2010-01-22 15:57:00
  • 解决Python中由于logging模块误用导致的内存泄露

    2021-08-24 08:04:46
  • python语言元素知识点详解

    2023-07-30 03:33:08
  • asp之家 网络编程 m.aspxhome.com