PyQt5内嵌浏览器注入JavaScript脚本实现自动化操作的代码实例

作者:李毅 时间:2023-11-26 15:05:59 

概要

应同学邀请,演示如何使用 PyQt5 内嵌浏览器浏览网页,并注入 Javascript 脚本实现自动化操作。

下面测试的是一个廉价机票预订网站(http://www.flyscoot.com/),关键点如下

  1. 使用 QWebEngineView 加载网页,并显示进度。

  2. 在默认配置(QWebEngineProfile)中植入 Javascript 内容,这样脚本会在所有打开的网页中执行,不论跳转到哪个网址。

  3. Javascript 脚本使用网址中的路径名,判断当前网页位置,从而决定执行哪种操作。

python 代码示例


#!/usr/bin/env python3
# -*- coding: utf-8 -*-
'''使用 PyQt5 内嵌浏览器浏览网页,并注入 Javascript 脚本实现自动化操作。'''
import os
import sys
from datetime import datetime
from PyQt5.QtWidgets import (
 QWidget, QApplication, QVBoxLayout, QHBoxLayout,
 QDesktopWidget, QTextEdit, QLabel, QLineEdit, QPushButton,
 QFileDialog, QProgressBar,
)
from PyQt5.QtCore import QUrl, pyqtSlot
from PyQt5.QtWebEngineWidgets import QWebEngineView, QWebEngineProfile, QWebEngineScript, QWebEnginePage
class Browser(QWidget):
 def __init__(self):
   super().__init__()
   self.init_ui()
   # 脚本
   self.profile = QWebEngineProfile.defaultProfile()
   self.script = QWebEngineScript()
   self.prepare_script()
 def init_ui(self):
   self.webView = QWebEngineView()
   self.logEdit = QTextEdit()
   self.logEdit.setFixedHeight(100)
   self.addrEdit = QLineEdit()
   self.addrEdit.returnPressed.connect(self.load_url)
   self.webView.urlChanged.connect(
     lambda i: self.addrEdit.setText(i.toDisplayString()))
   self.jsEdit = QLineEdit()
   self.jsEdit.setText('inject.js')
   loadUrlBtn = QPushButton('加载')
   loadUrlBtn.clicked.connect(self.load_url)
   chooseJsBtn = QPushButton('选择脚本文件')
   chooseJsBtn.clicked.connect(self.choose_js_file)
   # 导航/工具
   top = QWidget()
   top.setFixedHeight(80)
   topBox = QVBoxLayout(top)
   topBox.setSpacing(0)
   topBox.setContentsMargins(5, 0, 0, 5)
   progBar = QProgressBar()
   progBox = QHBoxLayout()
   progBox.addWidget(progBar)
   topBox.addLayout(progBox)
   naviBox = QHBoxLayout()
   naviBox.addWidget(QLabel('网址'))
   naviBox.addWidget(self.addrEdit)
   naviBox.addWidget(loadUrlBtn)
   topBox.addLayout(naviBox)
   naviBox = QHBoxLayout()
   naviBox.addWidget(QLabel('注入脚本文件'))
   naviBox.addWidget(self.jsEdit)
   naviBox.addWidget(chooseJsBtn)
   topBox.addLayout(naviBox)
   self.webView.loadProgress.connect(progBar.setValue)
   # 主界面
   layout = QVBoxLayout(self)
   layout.addWidget(self.webView)
   layout.addWidget(top)
   layout.addWidget(self.logEdit)
   self.show()
   self.resize(1024, 900)
   self.center()
 def center(self):
   qr = self.frameGeometry()
   cp = QDesktopWidget().availableGeometry().center()
   qr.moveCenter(cp)
   self.move(qr.topLeft())
 @pyqtSlot()
 def load_url(self):
   url = self.addrEdit.text().strip()
   if not url.lower().startswith('http://') \
       and not url.lower().startswith('https://'):
     url = 'http://{}'.format(url)
   self.load(url)
 @pyqtSlot()
 def choose_js_file(self):
   f, _ = QFileDialog.getOpenFileName(filter="Javascript files(*.js)")
   if os.path.isfile(f):
     self.jsEdit.setText(f)
     self.prepare_script()
 def prepare_script(self):
   path = self.jsEdit.text().strip()
   if not os.path.isfile(path):
     self.log('invalid js path')
     return
   self.profile.scripts().remove(self.script)
   with open(path, 'r') as f:
     self.script.setSourceCode(f.read())
   self.profile.scripts().insert(self.script)
   self.log('injected js ready')
 def log(self, msg, *args, **kwargs):
   m = msg.format(*args, **kwargs)
   self.logEdit.append('{} {}'.format(
     datetime.now().strftime('%H:%M:%S'), m))
 def load(self, url):
   self.log(f'loading {url}')
   self.addrEdit.setText(url)
   self.webView.load(QUrl(url))
if __name__ == '__main__':
 app = QApplication(sys.argv)
 b = Browser()
 b.load('http://www.flyscoot.com/')
 sys.exit(app.exec_())

Javascript 脚本示例


// 简单起见,这里只演示部分页面,脚本内容摘自 Heng丶原贴文。
function handle(path) {
 // 首页
 if (path == '/zh') {
   document.getElementsByClassName('radio-inline')[1].click();
   document.getElementById('oneway_from').value='广州 (CAN)';
   document.getElementById('oneway_to').value='新加坡 (SIN)';
   document.getElementById('oneway_departuredate').value='2018年9月10日';
   document.getElementsByClassName('btn--booking')[1].click();
   return;
 }
 // 选择航班
 if (path == '/Book/Flight') {
   document.getElementsByClassName('price--sale')[0].click();
   document.getElementsByClassName('heading-4')[0].click();
   document.getElementsByClassName('btn-submit')[0].click();
   return;
 }
 // 乘客信息
 if (path == '/BookFlight/Passengers') {
   document.getElementsByClassName('fname1')[0].value = "匿名";
 }
}
let host = document.location.hostname;
if (host.endsWith('.flyscoot.com')) {
 handle(document.location.pathname);
}

来源:https://segmentfault.com/a/1190000016222966

标签:python,pyqt5,内嵌,javascript
0
投稿

猜你喜欢

  • C#之Expression表达式树实例

    2023-02-24 20:54:31
  • android实现录屏小功能

    2022-08-29 17:08:10
  • idea install 时提示jdk的某个jar包的包不存在的问题

    2021-12-19 05:48:37
  • ThreadLocal的set方法原理示例解析

    2023-11-09 15:06:09
  • Android实现网页图片浏览功能

    2023-09-05 00:16:09
  • 安卓(Android)游戏开发音效代码

    2023-11-15 14:47:58
  • Java 深入浅出分析Synchronized原理与Callable接口

    2021-11-26 10:27:17
  • 亲自教你实现栈及C#中Stack源码分析

    2021-05-23 19:39:10
  • java实现砸金蛋抽奖功能

    2022-02-22 01:26:50
  • Android实现系统重新启动的功能

    2021-06-04 02:48:56
  • 关于Spring Boot项目的 log4j2 核弹漏洞问题(一行代码配置搞定)

    2022-08-26 03:04:20
  • 解决springboot环境切换失效的问题

    2023-11-11 20:40:35
  • MAC下如何设置JDK环境变量

    2023-12-20 16:05:24
  • JAVA关键字及作用详解

    2022-05-03 03:50:14
  • Java四种权限修饰符知识点详解

    2023-11-11 06:12:59
  • 详解Maven profile配置管理及激活profile的几种方式

    2022-07-01 08:54:46
  • java反射使用示例分享

    2023-07-02 20:18:59
  • c# 调用Win32Api关闭当前应用的方法

    2023-09-22 20:51:26
  • java中对字符串每个字符统计的方法

    2023-09-23 13:53:16
  • spring cloud Ribbon用法及原理解析

    2021-11-28 15:27:21
  • asp之家 软件编程 m.aspxhome.com