mysql 思维导图模板_ProcessOn思维导图、流程图

更新语句执行过程

更新数据 * n条

加载数据到缓存

写入undo log，便于回滚

更新内存数据

写redo log buffer

提交事务

提交事务时，redo log刷入磁盘

bin log 写入磁盘

往redo log写入commit标记

提交成功后，异步线程，刷脏页到磁盘，保持buffer pool和磁盘一致

异步刷新时，把一个数据页刷回去，而不是一行数据刷回去

几大组件

解析器

查询优化器

执行器

存储引擎

buffer pool

innodb_buffer_pool_size设置缓冲池大小

free-list：存放空闲的数据页

采用lru算法

普通lru存在的问题：预读（读第n页时，把第n+1页读到缓存）；全表扫描

预读存在的意义：计算机读写时，遵循局部性原理，提升性能

实际采用冷热数据分离的lru算法，将单链表分成了两个部分，由innodb_old_blocks_pct控制，默认为37 37%为冷数据，其余为热数据；一开始，数据直接放在冷数据部分的表头，在innodb_old_blocks_time后再次 被访问，则移动到热数据；如果热数据区域满了，则淘汰热数据区域尾部节点

热数据区域，前1/4区域，假设10个元素，其中第5个元素被访问，也不会移动到头部；后3/4区域才会

链表中冷数据部门：全表扫描和预读后，innodb_old_blocks_time时间内没被访问的数据

业务系统中，可以借鉴，比如统计每天热门商品，然后预加载到缓存中

数据页缓存hash-table

key:表空间number + 页的number

value：对应的缓存数据页的地址

flush-list：存储脏页，即被修改过的页

每个buffer pool包含多个chunk，每个chunk的大小由innodb_buffer_pool_chunk_size参数控制的，默认值就是128MB

表空间

对应数据库磁盘中一张表

数据页

一页通常16kb，包含很多行；但是不可能包含全部行，所以一般有很多页

所属表空间

页的number，因为一个表一般有很多页

读取数据页

读取磁盘中一个数据页

从free-list获取一个空闲数据页

将磁盘中读取的数据页的数据，设置到空闲数据页中

从free-list中移除该空闲数据页

表数据

redo log

innodb_flush_log_at_trx_commit

0

事务提交时，不刷盘

1

事务提交时，必须刷盘；此时，redo log 就是完整的， mysql崩溃也可以根据这个恢复数据

2

事务提交时，刷到os cache

bin log

sync_binlog

0

刷入os cache

1

刷盘

磁盘文件

undo log

redo log

表数据

数据页，和buffer pool中对应

行数据格式

varchar这种变长类型，在行的开头，有个变长字段的长度列表

一行数据有VARCHAR(10) VARCHAR(5) VARCHAR(20) CHAR(1) CHAR(1)，一共5个字段，假设数据是这样的：hello hi hao a a，则 实际存储：0x03 0x02 0x05 null值列表头字段 hello hi hao a a

针对可以为null的字段，每行都有一个null列表，每个字段占用1个bit，标识该行中，这个字段，是否为null

delete_mask：标识该行是否被删除

一行数据是“jack NULL m NULL xx_school”，真实存储如下所示： 0x09 0x04      00000101 0000000000000000000010000000000000011001 jack m xx_school 变长字段长度  null值列表  40bit的数据头                                                         真实数据    按字符集编码后： 0x09 0x04 00000101 0000000000000000000010000000000000011001 616161 636320 6262626262

隐藏字段

DB_ROW_ID：行的唯一标识，没设主键的话，会自动用这个当成主键

DB_TRX_ID：当前事务id

DB_ROLL_PTR：回滚指针

最终结构： 0x09 0x04 00000101 0000000000000000000010000000000000011001 00000000094C（DB_ROW_ID）00000000032D（DB_TRX_ID） EA000010078E（DB_ROL_PTR） 616161 636320 6262626262

行字段有text、blog这种时，在一行里放不下，产生行溢出问题。大字段的内容，会存放在其他数据页中，这边只存储指针

一个数据页16k，一个区，包含64个数据页，大小共1m

每个组，256个数据区

每次读表数据时，就去找到对应的组，区，数据页，然后把这一页（一个16kb的数据）读到内存buffer pool； 更新时，改过的页，会加入到flush list，后台线程再去flush list，把更新后的这一页，写回去

数据页之间有prev/next指针相连，可以理解为双向链表；指针可能就是各个数据页在磁盘上的offset

读取机制

随机读取

读数据页

顺序读写

binlog、redolog

redo log

一条binlog的大致格式：日志类型（就是类似MLOG_1BYTE之类的），表空间ID，数据页号，数据页中的偏移量，修改数据长度，具体修改的数据