详解Selenium 元素定位和WebDriver常用方法
作者:程序猿杂记 发布时间:2021-10-05 01:45:14
标签:Selenium,元素定位,WebDriver
一、定位元素的8种方式
1、方法介绍
定位一个元素 | 定位多个元素 | 含义 |
---|---|---|
find_element_by_id() | find_elements_by_id() | 通过元素id定位 |
find_element_by_name() | find_elements_by_name() | 通过元素name定位 |
find_element_by_xpath() | find_elements_by_xpath() | 通过xpath表达式定位 |
find_element_by_link_text() | find_elements_by_link_text() | 通过完整超链接定位 |
find_element_by_partial_link_text() | find_elements_by_partial_link_text() | 通过部分链接定位 |
find_element_by_tag_name() | find_elements_by_tag_name() | 通过标签定位 |
find_element_by_class_name() | find_elements_by_class_name() | 通过类名进行定位 |
find_elements_by_css_selector() | find_elements_by_css_selector() |
2、实例演示
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.baidu.com/')
#通过元素id定位()
driver.find_element_by_id('kw')
#通过元素name定位
driver.find_element_by_name('wd')
#通过类名进行定位
driver.find_element_by_class_name('s_ipt')
#通过标签定位
driver.find_element_by_tag_name('input')
#通过xpath表达式定位
driver.find_element_by_xpath('//*[@id="kw"]')
#通过css选择器进行定位
driver.find_element_by_css_selector('#kw')
#通过完整超链接定位
driver.find_element_by_link_text('新闻')
#通过部分链接定位
driver.find_element_by_partial_link_text('hao')
driver.quit()#关闭所有标签页
关于xpaht和css的定位比较复杂,请参考:
XPath获取方法
XPath语法
CSS选择器语法
此处定位可能无法直接查看效果(打印结果为获取的元素对象)
定位一般都配合一些常用方法使用
上述实例中都是单个元素定位,多个元素定位关键字请参考上边的方法介绍
二、WebDriver常用方法(配合定位方法使用)
1.点击和输入
clear(): 清除文本,大多数用于输入框
send_keys (): 模拟按键输入,大多数用于输入框
click(): 单击元素,用处比较广泛
更多鼠标键盘事件请参考:
Python爬虫 - Selenium(5)鼠标事件
Python爬虫 - Selenium(6)键盘事件
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get('https://www.baidu.com/')
driver.find_element_by_id("kw").clear()
driver.find_element_by_id("kw").send_keys("程序猿杂记")
driver.find_element_by_id("su").click()
time.sleep(5)
driver.quit() # 关闭所有标签页
3.提交
submit():用于提交表单,相当于回车,应用范围远不及 click()广泛
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get('https://www.baidu.com/')
driver_id = driver.find_element_by_id("kw")
driver_id.send_keys("程序猿杂记")
driver_id.submit()
time.sleep(5)
driver.quit() # 关闭所有标签页
4.获取一些内容
title:获得当前页面的标题
current_url:用户获得当前页面的URL
size: 获取元素的尺寸
text: 获取元素的文本
get_attribute(): 获得属性值
is_displayed(): 该元素是否用户可见
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.baidu.com/')
# 获取当前页面的title
title = driver.title
print(title)
#获取当前页的url
url = driver.current_url
print(url)
# 获得输入框的尺寸
input_size = driver.find_element_by_id('kw').size
print(input_size)
# 返回百度页面底部备案信息
text = driver.find_element_by_id("cp").text
print(text)
# 返回元素的属性值, 可以是 id、 name、 type 或其他任意属性
attribute = driver.find_element_by_id("kw").get_attribute('type')
print(attribute)
# 返回元素的结果是否可见, 返回结果为 True 或 False
result = driver.find_element_by_id("kw").is_displayed()
print(result)
driver.quit() # 关闭所有标签页
Selenium文集传送门:
标题 | 简介 |
---|---|
Python爬虫 - Selenium(1)安装和简单使用 | 详细介绍Selenium的依赖环境在Windows和Centos7上的安装及简单使用 |
Python爬虫 - Selenium(2)元素定位和WebDriver常用方法 | 详细介绍定位元素的8种方式并配合点击和输入、提交、获取断言信息等方法的使用 |
Python爬虫 - Selenium(3)控制浏览器的常用方法 | 详细介绍自定义浏览器窗口大小或全屏、控制浏览器后退、前进、刷新浏览器等方法的使用 |
Python爬虫 - Selenium(4)配置启动项参数 | 详细介绍Selenium启动项参数的配置,其中包括 * 面模式、浏览器窗口大小设置、浏览器User-Agent (请求头)等等 |
Python爬虫 - Selenium(5)鼠标事件 | 详细介绍鼠标右击、双击、拖动、鼠标悬停等方法的使用 |
Python爬虫 - Selenium(6)键盘事件 | 详细介绍键盘的操作,几乎包含所有常用按键以及组合键 |
Python爬虫 - Selenium(7)多窗口切换 | 详细介绍Selenium是如何实现在不同的窗口之间自由切换 |
Python爬虫 - Selenium(8)frame/iframe表单嵌套页面 | 详细介绍如何从当前定位的主体切换为frame/iframe表单的内嵌页面中 |
Python爬虫 - Selenium(9)警告框(弹窗)处理 | 详细介绍如何定位并处理多类警告弹窗 |
Python爬虫 - Selenium(10)下拉框处理 | 详细介绍如何灵活的定位并处理下拉框 |
Python爬虫 - Selenium(11)文件上传 | 详细介绍如何优雅的通过send_keys()指定文件进行上传 |
Python爬虫 - Selenium(12)获取登录Cookies,并添加Cookies自动登录 | 详细介绍如何获取Cookies和使用Cookies进行自动登录 |
Python爬虫 - Selenium(13)设置元素等待 | 详细介绍如何优雅的设置元素等待时间,防止程序运行过快而导致元素定位失败 |
Python爬虫 - Selenium(14)窗口截图 | 详细介绍如何使用窗口截图 |
Python爬虫 - Selenium(15)关闭浏览器 | 详细介绍两种关闭窗口的区别 |
来源:https://blog.csdn.net/weixin_44110998/article/details/103196876


猜你喜欢
- 函数原型参数介绍mode (torch.nn.Module, torch.jit.ScriptModule or torch.jit.Scr
- 普通关闭我的mysql是自己下载的tar包,自己设定安装目录来安装的。停止mysql服务,说来简单,但不知道的话,还真是挠头。在这和mysq
- 高效处理数据类型方法:处理数据In [1]: from random import randintIn [2]: data=[randint
- 近期,阿里云云安全中心基于全新的深度威胁检测功能,监测到云上部分用户的 SQL Server 数据库内部隐藏着一种新型的持久化后门程序。攻击
- 早上我偶然看见一篇介绍两个Python脚本的博文,其中一个效率更高。这篇博文已经被删除,所以我没办法给出文章链接,但脚本基本可以归结如下:f
- 今天仔细研究了下GD的一些相关技术,顺手也研究下GD中文乱码的问题。 使用GD库输出中文字符串,调用imagestring是没有
- 一、前言上次写了一个俄罗斯方块,感觉好像大家都看懂了,这次就更新一个植物大战僵尸吧二、引入模块import pygameimport ran
- ctypes(一) — 初识 很多初学Python的新手,总是嘴边挂着一句话:“Python是一门胶水语言”。可是究竟什
- asp禁止站外盗链,站外提交方法、以及asp判断星期几方法.防盗链,主要通过判断上一页面来源是否是本站来实现的,不是本站的链接就
- 具体代码如下所示:import requestsimport jsonfrom pyecharts.charts import Map, G
- 前言:在日常开发的过程中,有时候会临时用到一些简单的函数,她们的业务逻辑会相对简单,简单到并不值得让他们留下名字,这个时候,就很值得使用匿名
- 一,开篇分析Hi,大家!今天这系列文章主要是说说如何开发基于“JavaScript”的插件式开发,我想很多人对”插件“这个词并不陌生,有的人
- MySQL 子查询子查询是将一个 SELECT 语句的查询结果作为中间结果,供另一个 SQL 语句调用。MySQL 支持 SQL 标准要求的
- 开始我们将通过示例介绍偶数列表以及在 Python 中创建偶数列表的不同方法。什么是偶数本教程展示了如何在 Python 中制作偶数列表。
- 在使用前必须弄明白JWT的相关知识,可以看我的另一篇博文:https://www.jb51.net/article/166843.htm什么
- 前言:学习JavaScript的童鞋都知道,我们在发送网络请求,也就是我们在地址栏输入一个网址,就会自动跳转到当前网址,比如在浏览器网址输入
- 一、前言在近半年的 Python 命令行旅程中,我们依次学习了 argparse 、 docopt 、 click 和 fire 库的特点和
- 本文适用范围:全面阐述MySQL数据库的各种操作,分虚拟主机和服务器两种情况。虚拟主机1、通过PHPMyAdmin的导入导出功能,这个软件一
- 首先上一段程序:import numpy as nplist_a = list(range(10))print("list_a:
- scipyscipy包包含致力于科学计算中常见问题的各个工具箱。它的不同子模块相应于不同的应用。像插值,积分,优化,图像处理,,特殊函数等等