SQLServer 优化SQL语句 in 和not in的替代方案

时间:2024-01-18 00:31:02 

但是用IN的SQL性能总是比较低的,从SQL执行的步骤来分析用IN的SQL与不用IN的SQL有以下区别:
SQL试图将其转换成多个表的连接,如果转换不成功则先执行IN里面的子查询,再查询外层的表记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用IN的SQL至少多了一个转换的过程。一般的SQL都可以转换成功,但对于含有分组统计等方面的SQL就不能转换了。 推荐在业务密集的SQL当中尽量不采用IN操作符
NOT IN 此操作是强列推荐不使用的,因为它不能应用表的索引。推荐用NOT EXISTS 或(外连接+判断为空)方案代替
在数据库中有两个表,一个是当前表Info(id,PName,remark,impdate,upstate),一个是备份数据表bakInfo(id,PName,remark,impdate,upstate),将当前表数据备份到备份表去,就涉及到not in 和in 操作了:
首先,添加10万条测试数据


create procedure AddData
as
declare @id int
set @id=0
while(@id<100000)
begin
insert into dbo.Info(id,PName,remark,impdate,upstate)
values(@id,convert(varchar,@id)+'0','abc',getdate(),0)
set @id=@id+1
end
exec AddData


使用not in 和in操作:


SET STATISTICS TIME ON
GO
--备份数据
insert into bakInfo(id,PName,remark,impdate,upstate)
select id,PName,remark,impdate,upstate from dbo.Info
where id not in(select id from dbo.bakInfo)
GO
SET STATISTICS TIME OFF


此操作执行时间:


SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 3 毫秒。
SQL Server 执行时间:
CPU 时间 = 453 毫秒,占用时间 = 43045 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update Info set upstate=1 where id in(select id from dbo.bakInfo)


此操作执行时间:


SQL Server 分析和编译时间:
CPU 时间 = 62 毫秒,占用时间 = 79 毫秒。
SQL Server 执行时间:
CPU 时间 = 188 毫秒,占用时间 = 318 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
--删除当前表数据
delete from Info where upstate=1 and id in(select id from dbo.bakInfo)


此操作执行时间:


SQL Server 分析和编译时间:
CPU 时间 = 183 毫秒,占用时间 = 183 毫秒。
SQL Server 执行时间:
CPU 时间 = 187 毫秒,占用时间 = 1506 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。


使用join连接替代方案:


SET STATISTICS TIME ON
GO
--备份数据
insert into bakInfo(id,PName,remark,impdate,upstate)
select id,PName,remark,impdate,upstate from
(SELECT Info.id,Info.PName, Info.remark, Info.impdate,Info.upstate, bakInfo.id AS bakID
FROM Info left JOIN
bakInfo ON Info.id = bakInfo.id ) as t
where t.bakID is null and t.upstate=0
GO
SET STATISTICS TIME OFF;


此操作执行时间:


SQL Server 分析和编译时间:
CPU 时间 = 247 毫秒,占用时间 = 247 毫秒。
SQL Server 执行时间:
CPU 时间 = 406 毫秒,占用时间 = 475 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
--更改当前表状态
update Info set upstate=1
FROM Info INNER JOIN
bakInfo ON Info.id = bakInfo.id


此操作执行时间:


SQL Server 分析和编译时间:
CPU 时间 = 4 毫秒,占用时间 = 4 毫秒。
SQL Server 执行时间:
CPU 时间 = 219 毫秒,占用时间 = 259 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。


--删除当前表数据


delete from Info
FROM Info INNER JOIN
bakInfo ON Info.id = bakInfo.id
where Info.upstate=1


此操作执行时间:


SQL Server 分析和编译时间:
CPU 时间 = 177 毫秒,占用时间 = 177 毫秒。
SQL Server 执行时间:
CPU 时间 = 219 毫秒,占用时间 = 550 毫秒。
(100000 行受影响)
SQL Server 分析和编译时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。


可以看出使用join方案比使用not in 和in执行时间要短很多了

标签:SQLServer,SQL优化
0
投稿

猜你喜欢

  • python pandas.DataFrame.loc函数使用详解

    2023-10-04 07:01:58
  • Python中字典创建、遍历、添加等实用操作技巧合集

    2021-04-02 08:22:12
  • Python+OpenCV图片局部区域像素值处理改进版详解

    2022-06-24 11:38:56
  • 浅谈在JupyterNotebook下导入自己的模块的问题

    2023-03-16 11:28:36
  • Python基本知识点总结

    2022-06-04 13:35:49
  • PHP cookie,session的使用与用户自动登录功能实现方法分析

    2023-11-21 15:00:43
  • js断点调试经验分享

    2023-08-15 06:19:09
  • ASP使用xmlhttp调用WEBSERVICE文档

    2008-05-30 13:56:00
  • matplotlib 使用 plt.savefig() 输出图片去除旁边的空白区域

    2023-06-24 02:55:42
  • 解决pandas展示数据输出时列名不能对齐的问题

    2021-02-12 03:00:23
  • 新手入门Mysql--概念

    2024-01-27 17:00:18
  • C#调用python.exe使用arcpy方式

    2021-03-30 05:41:13
  • Go语言中defer语句的用法

    2023-07-07 11:04:17
  • ASP生成数字相加求和的BMP图片验证码

    2011-04-14 10:48:00
  • Swoole webSocket消息服务系统压力测试解析

    2023-06-09 01:55:45
  • Python2比较当前图片跟图库哪个图片相似的方法示例

    2021-05-22 09:51:22
  • Python异常处理操作实例详解

    2023-05-06 11:31:05
  • go语言实现markdown解析库的方法示例

    2023-06-20 07:37:32
  • Python线程之如何解决共享变量问题

    2023-08-27 16:15:56
  • 解决pytorch 模型复制的一些问题

    2022-04-23 03:57:58
  • asp之家 网络编程 m.aspxhome.com