详解Python Selenium如何获取鼠标指向的元素

作者：未闻Code 时间：2021-12-03 10:45:39　

有一个同学在Gne的群里面咨询如何通过Selenium获取当前鼠标指向的元素，在我讲了方法以后，他过了两天又来问：

那么，我今天就来写一篇文章，具体说说应该怎么操作。

这个方法的核心，是借助JavaScript的事件(event)来获取鼠标所在的元素。然后再把这个元素传递给Selenium。我们先来第一步，不考虑Selenium，只使用JavaScript，如何获取当前鼠标指向的元素呢？

我们首先需要知道在JavaScript中的一个事件句柄，叫做window.onmousemove。默认情况下，它的值是null:

我们可以把它的值修改成一个函数，这个函数接收一个event参数，这样当鼠标在网页上移动的时候，这个函数就会被调用。而event参数是一个对象，这个对象有两个属性.clientX和.clientY，分别表示鼠标相当于网页的横坐标和纵坐标：

function track_mouse(event){
var x = event.clientX, y = event.clientY
console.log('当前鼠标所在位置的坐标：x=' + x + 'y=' + y)
}

运行效果如下图所示：

你执行命令以后，只要在页面上移动鼠标，你就会在控制台看到大量的坐标被打印出来。

接下来，既然你有了当前鼠标所在位置的坐标，那么你只需要根据坐标查询到这个元素是什么就可以了。在JavaScript中，有一个函数叫做document.elementFromPoint，就能实现这个效果：

function track_mouse(event){
var x = event.clientX, y = event.clientY
var element = document.elementFromPoint(x, y)
  if (!element) {
  return // 当前位置没有元素
}
  return element
}

那么，如何把这个参数返回给Selenium呢？其实也非常简单，我们设置一个全局变量window.hovered_element，然后把当前鼠标对应的元素赋值给它。然后在Selenium中，使用.execute_script获取window.hovered_element就可以了。

我们先来看看完整的JavaScript:

window.hovered_element = null
function track_mouse(event){
var x = event.clientX, y = event.clientY
var element = document.elementFromPoint(x, y)
  if (!element) {
      window.hovered_element = null
  return // 当前位置没有元素
}
  window.hovered_element = element
}
window.onmousemove = track_mouse

然后我们再来看看Selenium中的Python代码：

import time
from selenium.webdriver import Chrome

driver = Chrome('./chromedriver')
driver.get('https://www.kingname.info/')

js = '''
window.hovered_element = null
function track_mouse(event){
var x = event.clientX, y = event.clientY
var element = document.elementFromPoint(x, y)
  if (!element) {
      window.hovered_element = null
  return // 当前位置没有元素
}
  window.hovered_element = element
}
window.onmousemove = track_mouse
'''

driver.execute_script(js)
while True:
    element = driver.execute_script('return window.hovered_element')
    if element:
        print(f'当前鼠标所在的标签为：{element.tag_name}, 其中的文本内容为：{element.text}')
    time.sleep(1)

运行效果如下图所示：

获取到了当前鼠标所在的元素的标签和标签里面的文字。

到这里，这个同学需要的功能已经完全实现了。

但可能有聪明的同学会发现，他这个需求是有问题的。我们能看到至少有三个问题：

因为window.onmousemove太灵敏了，它的采样时间是毫秒级别的，鼠标稍稍移动一点点就会生成一个事件。但是，一个元素的区域是很大的，在一个元素内部移动鼠标，其实根本没有必要更新window.hovered_element。
在Selenium里面，是通过while True每1秒查询一次window.hovered_element，虽然我们已经降低了频率，但大家从上面的图中可以看到，还是会获取到很多重复的数据。这是由于有一些元素非常大，我们鼠标如果在上面慢慢移动，时间会超过1秒，那么Selenium就会重复获取到数据。
由于window.onmousemove的采样时间间隔很小，所以我们可以近似把鼠标的移动看做是连续的移动。因此，这段代码会记录鼠标轨迹路径上面的每一个元素。但实际上，我们并不会对网页上所有的内容都感兴趣，我们只会对特定的内容感兴趣。因此，获取当前鼠标所在位置的元素，其实是一个伪需求，它根本没有什么实际上用处，因为噪声太大了，无用的数据太多了！

实际上，我觉得真正的需求应该是这样的：如果鼠标在网页上面某个元素停留时间超过5秒，那么获取这个元素。

但这样做太费时间了。每次都要等5秒，岂不是带薪摸鱼？那需求能不能改成获取当前鼠标点击的元素呢？如果你实践一下，你会发现，当你点击一个链接的时候，网页自动就跳转到另一个页面去了，并不能获取到你需要的数据。

来源：https://mp.weixin.qq.com/s/CfCv-ulCI6uuw1UK-fNetg

标签：Python,Selenium,鼠标,元素

投稿

详解Python Selenium如何获取鼠标指向的元素

猜你喜欢

vue.js2.0 实现better-scroll的滚动效果实例详解

MySQL数据库开发的36条原则(小结)

节日快乐! Python画一棵圣诞树送给你

设定sql server定期自动备份数据库

微信昵称带符号导致插入MySQL数据库时出错的解决方案

在pyCharm中下载第三方库的方法

Django小白教程之Django用户注册与登录

浅谈python锁与死锁问题

python 采用paramiko 远程执行命令及报错解决

Go语言中DateTime的用法介绍

django 通过url实现简单的权限控制的例子

Tensorflow中tf.ConfigProto()的用法详解

Python实现并行抓取整站40万条房价数据（可更换抓取城市）

基于Vue的侧边目录组件的实现

dedecms 批量提取第一张图片最为缩略图的代码(文章+软件)

python 密码学示例——凯撒密码的实现

用Python代码自动生成文献的IEEE引用格式的实现

详解如何使用Pyecharts制作Map3D

Git在Windows中安装与使用教程

python使用多线程+socket实现端口扫描