Yolov5多边形标签和JSON数据格式转换

作者:Pandas_007 时间:2023-11-06 17:31:24 

Labelme简要介绍

通过labelme对图进行标注后,得到的是json文件,而Yolov5对数据进行模型构建的时候,读取需要的是txt格式的文件。所以需要先通过Python进行文件格式的转换

注:labelme是麻省理工(MIT)的计算机科学和人工智能实验室(CSAIL)研发的图像标注工具,人们可以使用该工具创建定制化标注任务或执行图像标注,项目源代码已经开源。

Labelme程序运行,通过标注后如图所示:

Yolov5多边形标签和JSON数据格式转换

 图1 Labelme标注

 此图片可以得到以下格式的json文件:

Yolov5多边形标签和JSON数据格式转换

 文件中的字段如下:

‘version’——版本号

‘shapes’——里面装的是Yolov5需要的数据

        ‘label’——你在labelme里面设置的类

        ‘points’——点的坐标

 我这里的label如图1所示共有5类,等下进行json转化为txt的时候用

Yolov5多边形标签和JSON数据格式转换

 对应这些类创一个字典以便json进行转换

例:name2id={'bike':0,'arrow':1,'crossline':2,'building':3,'car':4,'person':5}

 可能某一张图片中可能不存在上述的某个类,所以这里请以某个json中最多的类创建这个字典。

多边形标签的处理方法

由于yolov5 仅支持矩形图形的识别,所以需要通过数据处理,将多边形变换为矩形。

处理原理:遍历该标签所有的坐标,获取最大x_max,y_max,最小x_min,y_min的x和y的坐标。

然后再进行数据的规范化。

 转换后的txt格式如下:

Yolov5多边形标签和JSON数据格式转换

第一个是类,比如第一行中的第一个数字是4,我的name2id中car也为4,即这里指代的就是'car'这个标签。

第一行 第二个 和 第三个数字 为数字为图片中心点(x,y)的坐标

第四个数字和第五个数字对应的是 这个标签的 宽和高。 

代码实现

多边形标签代码实现方法

x_max=0
               y_max=0
               x_min=100000
               y_min=100000
               for lk in range(len(i['points'])):
                   x1=float(i['points'][lk][0])
                   y1=float(i['points'][lk][1])
                  # print(x1)
                   if x_max<x1:
                       x_max=x1
                   if y_max<y1:
                       y_max=y1
                   if y_min>y1:
                       y_min=y1
                   if x_min>x1:
                       x_min=x1
               bb = (x_min, y_max, x_max, y_min)

json转化为txt的部分代码如下:

def decode_json(json_floder_path,txt_outer_path, json_name):
 #  json_floder_path='E:\\Python_package\\itesjson\\'
  # json_name='V1125.json'
   txt_name = txt_outer_path + json_name[:-5] + '.txt'
   with open(txt_name,'w') as f:
       json_path = os.path.join(json_floder_path, json_name)#os路径融合
       data = json.load(open(json_path, 'r', encoding='gb2312',errors='ignore'))
       img_w = data['imageWidth']#图片的高
       img_h = data['imageHeight']#图片的宽
       isshape_type=data['shapes'][0]['shape_type']
       print(isshape_type)
       #print(isshape_type)
       #print('下方判断根据这里的值可以设置为你自己的类型,我这里是polygon'多边形)
       #len(data['shapes'])
       for i in data['shapes']:
           label_name = i['label']#得到json中你标记的类名
           if (i['shape_type'] == 'polygon'):#数据类型为多边形 需要转化为矩形
               x_max=0
               y_max=0
               x_min=100000
               y_min=100000
               for lk in range(len(i['points'])):
                   x1=float(i['points'][lk][0])
                   y1=float(i['points'][lk][1])
                  # print(x1)
                   if x_max<x1:
                       x_max=x1
                   if y_max<y1:
                       y_max=y1
                   if y_min>y1:
                       y_min=y1
                   if x_min>x1:
                       x_min=x1
               bb = (x_min, y_max, x_max, y_min)
           if (i['shape_type'] == 'rectangle'):#为矩形不需要转换
               x1 = float(i['points'][0][0])
               y1 = float(i['points'][0][1])
               x2 = float(i['points'][1][0])
               y2 = float(i['points'][1][1])
               bb = (x1, y1, x2, y2)
           bbox = convert((img_w, img_h), bb)
           try:
               f.write(str(name2id[label_name]) + " " + " ".join([str(a) for a in bbox]) + '\n')
           except:
               pass

json_floder&mdash;&mdash;读取json的文件夹的绝对路径

txt_outer_path&mdash;&mdash;保存txt文本的文件夹的绝对路径

json_name&mdash;&mdash;json_name是json文本的名字

读取该类的坐标然后进行数字规范化

 数字规范化的代码如下:

def convert(img_size, box):
   dw = 1. / (img_size[0])
   dh = 1. / (img_size[1])
   x = (box[0] + box[2]) / 2.0
   y = (box[1] + box[3]) / 2.0
   w = abs(box[2] - box[0])
   h = abs(box[3] - box[1])#加入绝对值的原因是只需要它的宽和高,以免出现负数
   x = x * dw
   w = w * dw
   y = y * dh
   h = h * dh
   return (x, y, w, h)
 最后附上我的完整代码:
#处理labelme多边形矩阵的标注  json转化txt
import json
import os
name2id={'bike':0,'arrow':1,'crossline':2,'building':3,'car':4,'person':5}
def convert(img_size, box):
   dw = 1. / (img_size[0])
   dh = 1. / (img_size[1])
   x = (box[0] + box[2]) / 2.0
   y = (box[1] + box[3]) / 2.0
   w = abs(box[2] - box[0])
   h = abs(box[3] - box[1])
   x = x * dw
   w = w * dw
   y = y * dh
   h = h * dh
   return (x, y, w, h)
def decode_json(json_floder_path,txt_outer_path, json_name):
 #  json_floder_path='E:\\Python_package\\itesjson\\'
  # json_name='V1125.json'
   txt_name = txt_outer_path + json_name[:-5] + '.txt'
   with open(txt_name,'w') as f:
       json_path = os.path.join(json_floder_path, json_name)#os路径融合
       data = json.load(open(json_path, 'r', encoding='gb2312',errors='ignore'))
       img_w = data['imageWidth']#图片的高
       img_h = data['imageHeight']#图片的宽
       isshape_type=data['shapes'][0]['shape_type']
       print(isshape_type)
       #print(isshape_type)
       #print('下方判断根据这里的值可以设置为你自己的类型,我这里是polygon'多边形)
       #len(data['shapes'])
       for i in data['shapes']:
           label_name = i['label']#得到json中你标记的类名
           if (i['shape_type'] == 'polygon'):#数据类型为多边形 需要转化为矩形
               x_max=0
               y_max=0
               x_min=100000
               y_min=100000
               for lk in range(len(i['points'])):
                   x1=float(i['points'][lk][0])
                   y1=float(i['points'][lk][1])
                  # print(x1)
                   if x_max<x1:
                       x_max=x1
                   if y_max<y1:
                       y_max=y1
                   if y_min>y1:
                       y_min=y1
                   if x_min>x1:
                       x_min=x1
               bb = (x_min, y_max, x_max, y_min)
           if (i['shape_type'] == 'rectangle'):#为矩形不需要转换
               x1 = float(i['points'][0][0])
               y1 = float(i['points'][0][1])
               x2 = float(i['points'][1][0])
               y2 = float(i['points'][1][1])
               bb = (x1, y1, x2, y2)
           bbox = convert((img_w, img_h), bb)
           try:
               f.write(str(name2id[label_name]) + " " + " ".join([str(a) for a in bbox]) + '\n')
           except:
               pass
if __name__ == "__main__":
   json_floder_path = 'E:\Python_package\\itesjson\\'#存放json的文件夹的绝对路径
   txt_outer_path='E:\Python_package\\e1\\'#存放txt的文件夹绝对路径
   json_names = os.listdir(json_floder_path)
   print("共有:{}个文件待转化".format(len(json_names)))
   flagcount=0
   for json_name in json_names:
       decode_json(json_floder_path,txt_outer_path,json_name)
       flagcount+=1
       print("还剩下{}个文件未转化".format(len(json_names)-flagcount))
       break
      # break
   print('转化全部完毕')

os.listdir&mdash;&mdash;读取文件下的所有文件。请先创建一个只有json文件的文件夹

记得先修改!!!if __name__==&ldquo;__main__&rdquo;后的参数

json_floder_path&mdash;&mdash;改成你自己的json文件夹路径

txt_outer_path&mdash;&mdash;改成你自己的输出文件夹路径

来源:https://blog.csdn.net/qq_57329395/article/details/128079776

标签:Yolov5,标签,JSON,格式转换
0
投稿

猜你喜欢

  • Python中类的初始化特殊方法

    2021-05-26 14:50:01
  • Python实现ATM简单功能的示例详解

    2021-07-17 12:06:46
  • 利用anaconda保证64位和32位的python共存

    2021-07-23 09:18:24
  • 详解pandas.DataFrame中删除包涵特定字符串所在的行

    2023-08-23 23:37:45
  • 听歌识曲--用python实现一个音乐检索器的功能

    2021-11-01 00:46:03
  • python实现指定文件夹下的指定文件移动到指定位置

    2023-07-03 08:21:11
  • 全面解析Python的While循环语句的使用方法

    2023-12-21 04:41:11
  • python 贪心算法的实现

    2023-01-25 08:18:50
  • SQL查询排名函数实例

    2024-01-22 13:14:10
  • perl产生随机数实现代码

    2023-04-14 05:30:10
  • python中startswith()和endswith()的用法详解

    2023-11-02 12:41:09
  • Python pytest.main()运行测试用例

    2023-08-18 02:57:52
  • Python之捕捉异常详解

    2022-06-10 02:27:30
  • Golang空结构体struct{}用途,你知道吗

    2024-04-26 17:36:56
  • Python实现用户名和密码登录

    2022-02-17 13:49:49
  • asp连接MYSQL数据库的连接字符串(参数OPTION)

    2009-03-09 18:24:00
  • PHP 获取远程网页内容的代码(fopen,curl已测)

    2024-05-05 09:17:59
  • 如何使用FSO搜索硬盘文件

    2007-09-27 12:59:00
  • 深入理解JS中attribute和property的区别

    2024-04-10 16:19:32
  • Javascript将string类型转换int类型

    2023-09-17 00:05:37
  • asp之家 网络编程 m.aspxhome.com