SQLServer Execpt和not in 性能区别

来源:asp之家 时间:2012-01-29 17:53:24 

主要讲 except 和 not in 的性能上的区别。 

代码如下:


CREATE TABLE tb1(ID int)
CREATE TABLE tb2(ID int)
BEGIN TRAN
DECLARE @i INT = 500
WHILE @i > 0
begin
INSERT INTO dbo.tb1
VALUES ( @i -- v - int
)
SET @i = @i -1
end
COMMIT我测试的时候tb1 是1000,tb2 是500



代码如下:


DBCC FREESYSTEMCACHE ('ALL','default');
SET STATISTICS IO ON
SET STATISTICS TIME on
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值
SET STATISTICS IO OFF
SET STATISTICS TIME OFF


执行计划: 



SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
|--Merge Join(Right Anti Semi Join, MERGE:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID] = [master1].[dbo].[tb2].[ID]))
|--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb2].[ID] ASC))
| |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb1].[ID] ASC))
|--Table Scan(OBJECT:([master1].[dbo].[tb1])) 



代码如下:


SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值
|--Hash Match(Right Anti Semi Join, HASH:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID]=[master1].[dbo].[tb2].[ID]))
|--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Nested Loops(Left Anti Semi Join)
|--Nested Loops(Left Anti Semi Join, WHERE:([master1].[dbo].[tb1].[ID] IS NULL))
| |--Table Scan(OBJECT:([master1].[dbo].[tb1]))
| |--Top(TOP EXPRESSION:((1)))
| |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Row Count Spool
|--Table Scan(OBJECT:([master1].[dbo].[tb2]), WHERE:([master1].[dbo].[tb2].[ID] IS NULL))


SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。
(500 行受影响)
表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb2'。扫描计数 1,逻辑读取 1 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(6 行受影响)
(1 行受影响)
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 528 毫秒。
(500 行受影响)
表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb2'。扫描计数 3,逻辑读取 1002 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。
(10 行受影响)
(1 行受影响)
SQL Server 执行时间:
CPU 时间 = 16 毫秒,占用时间 = 498 毫秒。
SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。

结论:通过较多数据 和 较少数据的测试,在较少数据的情况下 not in 比 except 性能好,但是在较多数据情况下 execpt 比 not in 出色。
看执行计划可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的执行计划开可以得到优化。

如果大家有兴趣可以看看 not exists 的执行计划。建议:
大家不要迷信测试结果,因为所有的性能都是和执行计划密切相关的。而执行计划和统计数据又密不可分。
所以过度的迷信测试结果,可能会对生产库造成性能的影响达不到预期的性能效果。

标签:Execpt,not_in
0
投稿

猜你喜欢

  • numpy中轴处理的实现

    2021-08-14 12:06:16
  • MySQL主从复制问题总结及排查过程

    2024-01-15 07:05:44
  • python图像和办公文档处理总结

    2021-03-08 19:24:02
  • Sql Server 2008完全卸载方法(其他版本类似)第1/2页

    2024-01-14 01:20:09
  • 使用开源Cesium+Vue实现倾斜摄影三维展示功能

    2024-05-28 15:51:51
  • python正则表达式对字符串的查找匹配

    2022-02-21 12:39:50
  • python使用Pycharm创建一个Django项目

    2023-11-01 22:33:13
  • 利用Python编写一个记忆翻牌游戏

    2022-09-24 02:20:54
  • 空间session失效过快的解决办法

    2010-09-15 10:01:00
  • oracle合并列的函数wm_concat的使用详解

    2024-01-25 20:54:19
  • 详解Python中使用base64模块来处理base64编码的方法

    2022-01-12 01:27:19
  • 解决python super()调用多重继承函数的问题

    2022-09-28 07:50:44
  • 详解python中eval函数的作用

    2022-06-03 07:46:31
  • sql server 临时表 查找并删除的实现代码

    2024-01-17 18:49:56
  • python中常用的内置模块汇总

    2023-12-28 14:57:01
  • 使用 Python 快速实现 HTTP 和 FTP 服务器的方法

    2023-01-14 16:36:04
  • CSS实例讲解:地图提示

    2007-05-11 17:04:00
  • 在Python的Flask框架中实现全文搜索功能

    2022-12-20 14:38:18
  • xmind2022下载非试用超详细图文教程

    2023-06-03 18:52:06
  • 可用性测试过程中需要关注的一些细节

    2009-03-06 12:38:00
  • asp之家 网络编程 m.aspxhome.com