python如何查找图片按钮的坐标位置

作者:孤芳不自赏 时间:2023-01-07 21:57:53 

python查找图片按钮的坐标位置

因为业务需求,了解到一些python自动化的内容,其中有类似于airtest截图点击的东西。

本来是想使用pyautogui来实现获取图片坐标的功能,但是pyautogui对于小尺寸的图片识别不准确,或者说是识别不到,一番查找之下,发现另一个工具,做了封装如下。

1,使用pyaut

x, y=pyautogui.locateCenterOnScreen("img_path")
# 如果查找到值,会返回坐标的元组,找不到返回None。上面的写法会报错
print(x, y)
pyautogui.click(x,y)
# 点击操作

2,使用aircv

def matchImg(imgobj,confidence=0.7):
"""
imgobj:待查找的图片
confidence:最低相似度
"""
# 截取桌面操作,写入内存中,不必每次都保存实体图片
   screenshotIm = screenshot(region=None)
   desktop = np.array(screenshotIm)
   imobj = ac.imread(imgobj)

return ac.find_template(desktop ,imobj,confidence)  
if __name__ == "__main__":
   imgobj = 'img_path'
   print(matchImg(imgsrc,imgobj,confidencevalue))

返回值包含桌面大小,中心点,和待查询图片的四角坐标。否则为None

读取图片区域坐标的方法记录

首先是导入需要使用的库:

import cv2
import time
import win32gui, win32ui, win32con
import os

1、然后是获取需要的图片或者无需获取,已有图片。(可通过直接截取图片)

'''1、窗口截图,直接获取当前最前面的全屏幕截图'''
def window_capture(filename,w=1920,h=1080):
   hwnd = 0  # 窗口的编号,0号表示当前活跃窗口
   # 根据窗口句柄获取窗口的设备上下文DC(Divice Context)
   hwndDC = win32gui.GetWindowDC(hwnd)
   # 根据窗口的DC获取mfcDC
   mfcDC = win32ui.CreateDCFromHandle(hwndDC)
   # mfcDC创建可兼容的DC
   saveDC = mfcDC.CreateCompatibleDC()
   # 创建bigmap准备保存图片
   saveBitMap = win32ui.CreateBitmap()
   # 为bitmap开辟空间
   saveBitMap.CreateCompatibleBitmap(mfcDC, w, h)
   # 高度saveDC,将截图保存到saveBitmap中
   saveDC.SelectObject(saveBitMap)
   # 截取从左上角(0,0)长宽为(w,h)的图片
   saveDC.BitBlt((0, 0), (w, h), mfcDC, (0, 0), win32con.SRCCOPY)
   saveBitMap.SaveBitmapFile(saveDC, filename)
   return True

2、将获取的图片路径,传递给识别图片坐标的函数。

g_rectangle = [0, 0, 0, 0] #设置初始值坐标
clicked = False
g_startPoint = [0, 0]     #设置初始值获取的坐标
def startRoi(path):
   cv2.namedWindow("IMG_Show", 0)            # 创建画布
   cv2.resizeWindow("IMG_Show", 1920, 1080)  # 设置长和宽
   cv2.setMouseCallback("IMG_Show", onMouse) # 连接鼠标
   # 按"Esc"退出
   print("如果想要退出窗口,点击按钮 ESC,退出窗口...")
   while cv2.waitKey(30) != 27:             #监听事件
       global frame
       frame = cv2.imread(path,cv2.IMREAD_COLOR)  #读取图片数据
       # 画矩形
       '''
       由(x_min,x_max)组成,为绘制的边框的左上角;
       (g_rectangle[0], g_rectangle[1]), (g_rectangle[2], g_rectangle[3]):设置为绘制的边框的左上角和绘制的边框的右下角
       (0, 0, 255):指定边框的颜色,由(B,G,R)组成,当为(255,0,0)时为绿色,可以自由设定;
       1:线条的粗细值,为正值时代表线条的粗细(以像素为单位)
       '''
       cv2.rectangle(frame, (g_rectangle[0], g_rectangle[1]), (g_rectangle[2], g_rectangle[3]), (0, 0, 255), 2)
       cv2.imshow("IMG_Show", frame)
   # cv2.destroyWindow("IMG_Show")

'''
event:当前发生的鼠标事件类型
x和y:发生鼠标事件时鼠标在图像位置的x,y坐标
flags:  cv2_EVENT_FLAG_* (MouseEventFlags)类型的变量
param: 自定义的传递给 setMouseCallback 函数调用的参数
'''
# x和y: 发生鼠标事件时鼠标在图像位置的x,y坐标
def onMouse(event, x, y, flags, param):
   global clicked
   global g_rectangle
   global g_startPoint

if event == cv2.EVENT_MOUSEMOVE:  # 滑动
       if clicked == True:
           #当鼠标点击时,打印一下信息
           g_rectangle[0] = g_startPoint[0]
           g_rectangle[1] = g_startPoint[1]
           #实时获取,对应变化后的x,y坐标
           g_rectangle[2] =  x
           g_rectangle[3] =  y
           print("坐标:%s" % g_rectangle)
   # 左键按下事件
   if event == cv2.EVENT_LBUTTONDOWN: # 左键点击
       #获取鼠标第一时间点击的坐标
       g_startPoint[0] = x
       g_startPoint[1] = y
       clicked = True
   # 左键弹起事件
   if event == cv2.EVENT_LBUTTONUP:   # 左键放开
       print("====================选中框的坐标:===========================")
       print("矩形框左上角坐标:")
       print(g_rectangle[0], g_rectangle[1])
       print("矩形框右下角坐标:")
       print(g_rectangle[2], g_rectangle[3])
       print("矩形框宽度:")
       print(g_rectangle[2]-g_rectangle[0])
       print("矩形框高度:")
       print(g_rectangle[3]-g_rectangle[1])
       clicked = False

3、通过画布显示,在上面可以进行画框 ,自动识别出图片区域的坐标。(如下图)

python如何查找图片按钮的坐标位置

4、全部代码展示:

'''
读取图片的坐标
'''
import cv2
import time
import win32gui, win32ui, win32con
import os

'''1、窗口截图'''
def window_capture(filename,w=1920,h=1080):
   hwnd = 0  # 窗口的编号,0号表示当前活跃窗口
   # 根据窗口句柄获取窗口的设备上下文DC(Divice Context)
   hwndDC = win32gui.GetWindowDC(hwnd)
   # 根据窗口的DC获取mfcDC
   mfcDC = win32ui.CreateDCFromHandle(hwndDC)
   # mfcDC创建可兼容的DC
   saveDC = mfcDC.CreateCompatibleDC()
   # 创建bigmap准备保存图片
   saveBitMap = win32ui.CreateBitmap()
   # 为bitmap开辟空间
   saveBitMap.CreateCompatibleBitmap(mfcDC, w, h)
   # 高度saveDC,将截图保存到saveBitmap中
   saveDC.SelectObject(saveBitMap)
   # 截取从左上角(0,0)长宽为(w,h)的图片
   saveDC.BitBlt((0, 0), (w, h), mfcDC, (0, 0), win32con.SRCCOPY)
   saveBitMap.SaveBitmapFile(saveDC, filename)
   return True

g_rectangle = [0, 0, 0, 0] #设置初始值坐标
clicked = False
g_startPoint = [0, 0]
def startRoi(path):
   cv2.namedWindow("IMG_Show", 0)            # 创建画布
   cv2.resizeWindow("IMG_Show", 1920, 1080)  # 设置长和宽
   cv2.setMouseCallback("IMG_Show", onMouse) # 连接鼠标
   # 按"Esc"退出
   print("如果想要退出窗口,点击按钮 ESC,退出窗口...")
   while cv2.waitKey(30) != 27:             #监听事件
       global frame
       frame = cv2.imread(path,cv2.IMREAD_COLOR)  #读取图片数据
       # 画矩形
       '''
       由(x_min,x_max)组成,为绘制的边框的左上角;
       (g_rectangle[0], g_rectangle[1]), (g_rectangle[2], g_rectangle[3]):设置为绘制的边框的左上角和绘制的边框的右下角
       (0, 0, 255):指定边框的颜色,由(B,G,R)组成,当为(255,0,0)时为绿色,可以自由设定;
       1:线条的粗细值,为正值时代表线条的粗细(以像素为单位)
       '''
       cv2.rectangle(frame, (g_rectangle[0], g_rectangle[1]), (g_rectangle[2], g_rectangle[3]), (0, 0, 255), 2)
       cv2.imshow("IMG_Show", frame)
   # cv2.destroyWindow("IMG_Show")

'''
event:当前发生的鼠标事件类型
x和y:发生鼠标事件时鼠标在图像位置的x,y坐标
flags:  cv2_EVENT_FLAG_* (MouseEventFlags)类型的变量
param: 自定义的传递给 setMouseCallback 函数调用的参数
'''
# x和y: 发生鼠标事件时鼠标在图像位置的x,y坐标
def onMouse(event, x, y, flags, param):
   global clicked
   global g_rectangle
   global g_startPoint

if event == cv2.EVENT_MOUSEMOVE:  # 滑动
       if clicked == True:
           #当鼠标点击时,打印一下信息
           g_rectangle[0] = g_startPoint[0]
           g_rectangle[1] = g_startPoint[1]
           #实时获取,对应变化后的x,y坐标
           g_rectangle[2] =  x
           g_rectangle[3] =  y
           print("坐标:%s" % g_rectangle)
   # 左键按下事件
   if event == cv2.EVENT_LBUTTONDOWN: # 左键点击
       #获取鼠标第一时间点击的坐标
       g_startPoint[0] = x
       g_startPoint[1] = y
       clicked = True
   # 左键弹起事件
   if event == cv2.EVENT_LBUTTONUP:   # 左键放开
       print("====================选中框的坐标:===========================")
       print("矩形框左上角坐标:")
       print(g_rectangle[0], g_rectangle[1])
       print("矩形框右下角坐标:")
       print(g_rectangle[2], g_rectangle[3])
       print("矩形框宽度:")
       print(g_rectangle[2]-g_rectangle[0])
       print("矩形框高度:")
       print(g_rectangle[3]-g_rectangle[1])
       clicked = False

if __name__ == '__main__':
   path = r"./save_img/jietu.jpg"
   if not os.path.isdir:
       os.mkdir(path)
   ret =  window_capture(filename=path)
   time.sleep(0.2)
   if ret == True:
       startRoi(path)

来源:https://blog.csdn.net/qq_16082527/article/details/124198842

标签:python,查找,图片按钮,坐标位置
0
投稿

猜你喜欢

  • 设定sql server定期自动备份数据库

    2024-01-16 18:14:30
  • python使用docx模块读写docx文件的方法与docx模块常用方法详解

    2022-05-14 11:37:17
  • 如何使用Python的Requests包实现模拟登陆

    2022-10-07 03:12:26
  • asp+XMLHTTP的国际域名查询系统(whois)源代码

    2008-02-16 09:23:00
  • vue中父子组件传值,解决钩子函数mounted只运行一次的操作

    2024-05-09 15:26:31
  • c#操作sqlserver数据库的简单示例

    2024-01-28 11:25:23
  • 细谈Mysql的存储过程和存储函数

    2024-01-23 11:05:24
  • 利用Python将时间或时间间隔转为ISO 8601格式方法示例

    2022-12-06 22:18:25
  • Python基础知识之变量的详解

    2023-12-16 13:41:40
  • 自适应浏览器位置的div效果

    2008-05-29 13:15:00
  • 深度解析Django REST Framework 批量操作

    2021-05-18 03:03:21
  • 用私有属性来拯救IE7缩放图片的失真

    2009-03-03 13:57:00
  • mssql2005,2008导出数据字典实现方法

    2023-07-23 19:11:30
  • 关于document.createDocumentFragment()

    2009-04-05 16:04:00
  • python中的pyc文件是什么

    2021-05-12 16:18:57
  • Mysql中文乱码问题的最佳解决方法

    2024-01-21 11:11:50
  • python 包之 threading 多线程

    2021-06-03 19:54:41
  • javascript中substring()、substr()、slice()的区别

    2024-04-16 09:54:35
  • Python 获得13位unix时间戳的方法

    2022-12-08 18:26:25
  • 如何对Mysql 数据表压缩

    2010-11-25 17:21:00
  • asp之家 网络编程 m.aspxhome.com