Mysql join联表及id自增实例解析

作者：Jimmyhe 时间：2024-01-22 20:36:20　

join的写法

如果用left join 左边的表一定是驱动表吗？两个表的join包含多个条件的等值匹配，都要写道on还是只把一个写到on，其余写道where部分？

createtablea(f1int,f2int,index(f1))engine=innodb;
createtableb(f1int,f2int)engine=innodb;
insertintoavalues(1,1),(2,2),(3,3),(4,4),(5,5),(6,6);
insertintobvalues(3,3),(4,4),(5,5),(6,6),(7,7),(8,8);
select*fromaleftjoinbon(a.f1=b.f1)and(a.f2=b.f2);/*Q1*/
select*fromaleftjoinbon(a.f1=b.f1)where(a.f2=b.f2);/*Q2*/

执行结果：

由于表b没有索引，使用的是Block Nexted Loop Join(BNL)算法

把表a的内容读入join_buffer中，因为select * ，所以字段f1，f2都被放入
顺序扫描b，对于每一行数据，判断join条件是否满足，满足条件的记录，作为结果集的一行，如果有where子句，判断where部分满足条件后再返回。
表b扫描完成后，对于没有匹配的表a的行，用null补上，放到结果集中。

Q2语句中，explain结果：

b为驱动表，如果一条语句EXTRA字段什么都没有的话，就是Index Nested_Loop Join算法，因此流程是：

顺序扫描b，每一行用b.f1到a中去查，匹配a.f2=b.f2是否满足，作为结果集返回。

Q1与Q2执行流程的差异是因为优化器基于Q2这个查询语义做了优化：在mysql里，null跟任何值执行等值判断和不等值判断的结果都是null，包括select null = null 也返回null。

在Q2中，where a.f2 = b.f2表示，查询结果里不会包含b.f2是null的行，这样left join语义就是找到两个表里f1 f2对应相同的行，如果a存在而b匹配不到，就放弃。因此优化器把这条语句的left join改写成了join，因为a的f1有索引，就把b作为驱动表，这样可以用NLJ算法，所以在使用left join时，左边的表不一定是驱动表。

如果需要left join的语义，就不能把被驱动表的字段放在where条件里做等值判断或不等值判断，必须写在on里面。

Nested Loop Join的性能问题

BLN算法的执行逻辑

将驱动表的数据全部读入join_buffer中，里面是无序数组。
顺序遍历被驱动表的所有行，每一行都跟join_buffer做匹配，成功则作为结果集的一部分返回。

Simple Nested Loop Join算法逻辑是：顺序去除驱动表的每一行数据，到被驱动表做全表匹配。

两者差异：

在对被驱动表做全表扫描时，如果数据没有在buffer pool中，需要等待部分数据从磁盘读入。会影响正常业务的buffer pool命中率，而且会对被驱动表做多次访问，更容易将这些数据页放到buffer pool头部。所以BNL算法性能会更好。自增id

mysql中自增id定义了初始值，不停的增长，但是有上限，2^32-1，自增的id用完了会怎么样呢。

表定义的自增值达到上限后，再申请下一个id时，得到的值保持不变。再次插入时会报主键冲突错误。所以在建表时，如果有频繁的增删改时，就应该创建8个字节的bigint unsigned。

innodb 系统自增row_id

如果创建了Innodb表没有指定主键，那么innodb会创建一个不可见的，长度为6个字节的row_id，所有无主键的innodb表，每插入一行数据，都将当前的dict_sys.row_id值作为要插入数据的row_id，然后自增1。

实际上，代码实现时，row_id是一个长度为8字节的无符号长整形，但是innodb在设计时，给row_id只是6个字节的长度，这样写道数据时只放了最后6个字节。所以：

row_id写入表的范围是0到2^48-1;
当达到最大时，如果再有插入数据的行为来申请row_id，拿到以后再去最后6个字节就是0，然后继续循环。
再innodb的逻辑里，达到最大后循环，新数据会覆盖已经存在的数据。

从这个角度看，我们应该主动创建自增主键，这样达到上限后，插入数据会报错。数据的可靠性会更加有保障。

XID

redo log 和 binlog相互配合的时候，它们有一个共同的字段就是xid，在mysql中对应事务的。xid最大时2^64次方，用尽只存在理论。

thread_id

系统保存了全局变量thread_id_counter，每新建一个连接，就将thread_id_counter赋值给这个新连接的线程变量。thread_id_counter定义的大小是4个字节，因此到2^32-1就会重置为0，然后继续增加。但是show processlist里不会看到两个相同的thread_id，这是因为mysql设计了一个唯一数组逻辑，给新线程分配thread_id的时候：

do{
new_id=thread_id_counter++;
}while(!thread_ids.insert_unique(new_id).second);

来源：https://www.cnblogs.com/jimmyhe/p/11245304.html

标签：mysql,join,id,自增

投稿

Mysql join联表及id自增实例解析

猜你喜欢

vue 使用vant插件做tabs切换和无限加载功能的实现

Python模拟登录验证码（代码简单）

Python语法学习之正则表达式的量词汇总

对python同一个文件夹里面不同.py文件的交叉引用方法详解

Vue项目中keepAlive的使用说明(超级实用版)

keras做CNN的训练误差loss的下降操作

Python+unittest+requests+excel实现接口自动化测试框架

Windows下Python使用Pandas模块操作Excel文件的教程

Python实现自动发消息自定义内容的操作代码

在XPath查询中指定轴(转自MSSQL手册)

asp.net下利用js实现返回上一页的实现方法小集

进一步理解Python中的函数编程

Python制作进度条的几种方法

Mysql语句快速复习教程(全)

linux下perl操作mysql数据库(需要安装DBI)

用一句SQL解决SQL中断号问题推荐

python实现爱奇艺登陆密码RSA加密的方法示例详解

jenkins配置golang 代码工程自动发布的实现方法

Django全局启用登陆验证login_required的方法

python抓取网页图片示例(python爬虫)

Mysql join联表及id自增实例解析

猜你喜欢

vue 使用vant插件做tabs切换和无限加载功能的实现

Python模拟登录验证码（代码简单）

Python语法学习之正则表达式的量词汇总

对python同一个文件夹里面不同.py文件的交叉引用方法详解

Vue项目中keepAlive的使用说明(超级实用版)

keras做CNN的训练误差loss的下降操作

Python+unittest+requests+excel实现接口自动化测试框架

Windows下Python使用Pandas模块操作Excel文件的教程

Python实现自动发消息自定义内容的操作代码

在XPath查询中指定轴(转自MSSQL手册)

asp.net下利用js实现返回上一页的实现方法小集

进一步理解Python中的函数编程

Python制作进度条的几种方法

Mysql语句快速复习教程(全)

linux下perl操作mysql数据库(需要安装DBI)

用一句SQL解决SQL中断号问题 推荐

python实现爱奇艺登陆密码RSA加密的方法示例详解

jenkins配置golang 代码工程自动发布的实现方法

Django全局启用登陆验证login_required的方法

python抓取网页图片示例(python爬虫)

用一句SQL解决SQL中断号问题推荐