MySQL中将一列以逗号分隔的值行转列的实现

作者:https://blog.csdn.net/github_33809414/article/details/86656216 时间:2024-01-20 15:31:23 

前言

有时会遇到没有遵守第一范式设计模式的业务表。即一列中存储了多个属性值。如下表

pkvalue
1ET,AT
2AT,BT
3AT,DT
4DT,CT,AT

一般有这两种常见需求(测试数据见文末)

1.得到所有的不重复的值,如

value
AT
BT
CT
DT
ET

SQL如下:


select distinct(substring_index(substring_index(a.col,',',b.help_topic_id+1),',',-1))
from
(select group_concat(distinct `value`) as col from `row_to_col`) as a
join
mysql.help_topic as b
on b.help_topic_id < (char_length(a.col) - char_length(replace(a.col,',',''))+1)

2.显示每个值及其对应主键,如

pkvalue
1ET
1AT
2AT
2BT
3AT
3DT
4DT
4CT
4AT

SQL如下:


select a.pk,substring_index(substring_index(a.col,',',b.help_topic_id+1),',',-1)
from
(select `value` as col,pk from `row_to_col`) as a
join
mysql.help_topic as b
on b.help_topic_id < (char_length(a.col) - char_length(replace(a.col,',',''))+1)

实现思路:

需求1:

1. 通过group_concat函数将value列的值拼接成一个逗号隔开的字符串,然后通过substring_index函数对字符串进行截取
2. 通过substring_index函数特性,我们就需要知道字符串有多少个逗号,并且要告诉每个逗号的位置
3. 逗号个数=char_length(字符串)-char_length(replace(字符串,',',''))
4. 逗号位置=mysql.help_topic.id < 逗号个数[+1]
5. 最后通过distinct函数将截取后的单个值进行去重

注意:
1. mysql.help_topic表的自增id是从0开始,所以在进行截取时要对id进行+1。见: substring_index(a.col,',',b.help_topic_id+1)
2. value列最后一个字符不是逗号时:逗号个数+1是为了截取时不漏掉最后一个逗号后的值,即: char_length(a.col) - char_length(replace(a.col,',',''))+1;
value列最后一个字符是逗号时:逗号个数就不需要+1了,直接:char_length(a.col) - char_length(replace(a.col,',',''))
3. 因为截取时id要+1,所以在连接时取的< ,而不是 <= 。见:b.help_topic_id < (char_length(a.col) - char_length(replace(a.col,',',''))[+1])
4. mysql.help_topic(mysql version: 5.7.21-1)表的自增id,最大值为636。如果group_concat后的字符串中逗号个数大于该值,需要自己单独处理自增id的值

需求2:思路基本与需求1同,只是最后的查询不一样

涉及到的函数:

length:返回字符串所占的字节数,是计算字段的长度。一个汉字或是中文符号是算三个字符,一个数字或字母或英文符号算一个字符。
char_length:返回字符串所占的字符数,不管汉字还是数字或者是字母或者符号(不分中英文)都算是一个字符。
replace(str,old_string,new_string): 将字符串中str中所有的old_string替换成new_string。
substring_index(被截取字段,关键字,关键字出现的次数):截取字符串。如果关键字出现的次数是负数 , 则是从后倒数,到字符串结束。
group_concat([DISTINCT] 要连接的字段(可多个,逗号隔开) [Order BY 排序字段 ASC/DESC] [Separator '分隔符']):
 将group by产生的同一个分组中的值连接起来,返回一个字符串结果。分隔符,默认逗号。

 测试数据:


DROP TABLE IF EXISTS `row_to_col`;
CREATE TABLE `row_to_col` (
`pk` int(11) NOT NULL AUTO_INCREMENT,
`value` varchar(255) DEFAULT NULL,
PRIMARY KEY (`pk`)
) ENGINE=InnoDB AUTO_INCREMENT=8 DEFAULT CHARSET=utf8;

INSERT INTO `row_to_col` VALUES ('1', 'ET,AT');
INSERT INTO `row_to_col` VALUES ('2', 'AT,BT');
INSERT INTO `row_to_col` VALUES ('3', 'AT,DT');
INSERT INTO `row_to_col` VALUES ('4', 'DT,CT,AT');

参考:
https://blog.csdn.net/liuzhoulong/article/details/51729168
https://blog.csdn.net/ldl22847/article/details/47609727

来源:https://blog.csdn.net/github_33809414/article/details/86656216

标签:MYSQL,逗号,分割,行转列
0
投稿

猜你喜欢

  • bootstrap3 兼容IE8浏览器!

    2023-07-02 05:18:58
  • 各种页面定时跳转(倒计时跳转)代码总结

    2023-09-05 00:12:01
  • 解析Tensorflow之MNIST的使用

    2021-09-06 03:34:27
  • python调用接口的4种方式代码实例

    2022-01-15 17:03:30
  • Python实现转换图片背景颜色代码

    2023-02-13 09:02:54
  • Python爬虫进阶之Beautiful Soup库详解

    2022-09-13 04:38:50
  • SQL Server 2000的视图中必须小心使用*符号

    2008-12-05 15:38:00
  • Vue3中watch的使用详解

    2024-05-09 15:20:19
  • Python fileinput模块使用实例

    2021-11-28 09:01:18
  • 在python代码中加入环境变量的语句操作

    2023-03-01 22:58:19
  • Python中True(真)和False(假)判断详解

    2021-12-16 11:22:36
  • 怎么才能限制SQL Server只能让指定的机器连接

    2010-07-30 13:30:00
  • php生成4位数字验证码的实现代码

    2023-11-20 15:00:12
  • 解决CentOS下ImportError: No module named '_sqlite3'的问题

    2022-03-14 20:13:57
  • Django中日期时间型字段进行年月日时分秒分组统计

    2023-01-05 02:26:09
  • js如何读取csv内容拼接成json

    2023-08-13 02:20:14
  • Python数据抓取爬虫代理防封IP方法

    2022-12-18 18:32:32
  • 参考sql2012存储过程写的统计所有用户表尺寸大小的示例

    2024-01-25 05:50:18
  • Python时间序列处理之ARIMA模型的使用讲解

    2021-04-10 05:53:34
  • PyTorch中的参数类torch.nn.Parameter()详解

    2021-09-07 19:06:30
  • asp之家 网络编程 m.aspxhome.com