首页  思维导图  详情



 



mysql学习笔记

2021-10-09 11:28:59   0  举报





AI智能生成

mysql学习笔记

MySQL

事务

分库分表

数据库

模板推荐

作者其他创作

大纲/内容

范式

1NF

即表的列的具有原子性,不可再分解，即列的信息，不能分解,只有数据库是关系型数据库(mysql/oracle/db2/informix/sysbase/sql server)，就自动的满足1NF

2NF

表中的记录是唯一的,就满足2NF,通常我们设计一个主键来实现

3NF

表中不要有冗余数据,就是说，表的信息，如果能够被推导出来，就不应该单独的设计一个字段来存放.

mysql

1.MySQL的架构与内部模块

1. （一条查询 SQL 语句是如何执行的）执行流程

图片

具体流程

1、查询缓存

查询缓存

MySQL的缓存默认是关闭的

MySQL 8.0中，查询缓存已经被移除了

2、解析器生成解析树

主要做的事情是对语句基于SQL语法进行词法和语法分析和语义的解析

3、预处理再次生成解析树

4、查询优化器

根据解析树生成不同的执行计划（ExecutionPlan），然后选择一种最优的执行计划，MySQL里面使用的是基于开销（cost）的优化器，那种执行计划开销最小，就用哪种。

优化器最终会把解析树变成一个查询执行计划，查询执行计划是一个数据结构。

Explain的结果也不一定最终执行的方式

5、查询执行计划

6、查询执行引擎

存储引擎

图片

如何选择存储引擎

如果对数据一致性要求比较高，需要事务支持，可以选择InnoDB

如果数据查询多更新少，对查询性能要求比较高，可以选择MyISAM

如果需要一个用于查询的临时表，可以选择Memory

7、查询数据返回结果

2.通信协议

连接方式：长连接或者短连接

3.通信方式

MySQL使用了半双工的通信方式

4.一条更新 SQL 是如何执行的

缓冲池 Buffer Pool

redo Log Buffer

undo log

bin log

2. 事务

1.特性

1、原子性：数据库事务不可分割的单位，我们对数据库的一系列的操作，要么都是成功

实现

2、一致性：事务的操作不会改变数据库的状态，比方说唯一约束

3、隔离性：事务是相互不可见的

4、持久性：事务一旦提交，即使宕机也是能恢复的

实现

2.分类

1、扁平事务：使用最频繁的事务，要么都成功提交，要么都失败回滚

2、带有扁平点的扁平事务：允许事务回滚到同一个事务中比较早的一个状态

3、链事务：回滚到最近的一个保存点，在所有的事务都提交之后才会释放锁，并且下一个事务的开始需要上一个事务来进行通知

4、嵌套事务：树结构，只有当父级事务提交之后子级事务才会提交，任意一个父级事务的回滚都会导致下面的子级事务回滚

5、分布式事务：操作两个不同的数据库，使其实现数据的同步，例如将中国银行的钱转到工商银行，这个不同银行的不同数据库，为分布式事务

3.事务问题

1.脏读：事务 A 多次读取同一数据，事务 B 在事务A多次读取的过程中，对数据作了更新，然后B回滚操作，那么A读取到的数据是脏数据。

2.不可重复读：事务 A 多次读取同一数据，事务 B 在事务A多次读取的过程中，对数据作了更新并提交，导致事务A多次读取同一数据时，结果不一致。

3.幻读：系统管理员A将数据库中所有学生的成绩从具体分数改为ABCDE等级，但是系统管理员B就在这个时候插入了一条具体分数的记录，当系统管理员A改结束后发现还有一条记录没有改过来，就好像发生了幻觉一样，这就叫幻读。

4.隔离级别

1.读未提交（READ UNCOMMITTED）：未提交读隔离级别也叫读脏，就是事务可以读取其它事务未提交的数据。

2.读已提交（READ COMMITTED）：在其它数据库系统比如 SQL Server 默认的隔离级别就是提交读，已提交读 隔离级别就是在事务未提交之前所做的修改其它事务是不可见的。

3.可重复读（REPEATABLE READ）：保证同一个事务中的多次相同的查询的结果是一致的，比如一个事务一开始 查询了一条记录然后过了几秒钟又执行了相同的查询，保证两次查询的结果是相同的，可重复读也是 mysql 的默认隔 离级别。

4.可串行化（SERIALIZABLE）：可串行化就是保证读取的范围内没有新的数据插入，比如事务第一次查询得到某个 范围的数据，第二次查询也同样得到了相同范围的数据，中间没有新的数据插入到该范围中。

图片

5. 数据库什么时候会出现事务

自动开启

手动开启事务

手动开启事务也有几种方式，一种是用begin；一种是用start transaction。

还有一种情况，客户端的连接断开的时候，事务也会结束。

6. MySQL InnoDB 对隔离级别的支持

图片

两大实现方案

基于锁的并发控制LockBased Concurrency Control（LBCC）

多版本的并发控制 Multi Version Concurrency Control （MVCC）

7.锁

InnoDB

数据库读一致性问题

行锁的原理

InnoDB的行锁模式及加锁方法

MySQL InnoDB 锁的基本类型

共享锁（s-行锁）：又称读锁

排他锁（Ｘ-行锁）：又称写锁。

意向锁(意向锁都是表锁)

意向共享锁（IS）：事务打算给数据行共享锁，事务在给一个数据行加共享锁前必须先取得该表的IS锁。

意向排他锁（IX）：事务打算给数据行加排他锁，事务在给一个数据行加排他锁前必须先取得该表的IX锁。

锁的算法

记录锁

间隙锁

临键锁

四个事务隔离级别的实现

死锁

死锁的产生条件

（1）同一时刻只能有一个事务持有这把锁

（2）其他的事务需要在这个事务释放锁之后才能获取锁，而不可以强行剥夺

（3）当多个事务形成等待环路的时候，即发生死锁。

图片

死锁的避免

查看锁信息（日志）

3.索引

1.类型

1,Normal:普通的索引;允许一个索引值后面关联多个行值;

2,UNIQUE:唯一索引;允许一个索引值后面只能有一个行值;之前对列添加唯一约束其实就是为这列添加了一个unique索引;当我们为一个表添加一个主键的时候,其实就是为这个表主键列(设置了非空约束),并为主键列添加了一个唯一索引;

3,Fulltext:全文检索,mysql的全文检索只能用myisam引擎,并且性能较低,不建议使用;

2.实现

1,b-tree:是一颗树(二叉树,平衡二叉树,平衡树(B-TREE); 使用平衡树实现索引，是mysql中使用最多的索引类型；在innodb中，存在两种索引类型，第一种是主键索引（primary key），在索引内容中直接保存数据的地址；第二种是其他索引，在索引内容中保存的是指向主键索引的引用；所以在使用innodb的时候，要尽量的使用主键索引，速度非常快；

2,hash:把索引的值做hash运算，并存放到hash表中，使用较少，一般是memory引擎使用；优点:因为使用hash表存储，按照常理，hash的性能比B-TREE效率高很多。 hash索引的缺点： 1，hash索引只能适用于精确的值比较，=，in，或者；无法使用范围查询; 2，无法使用索引排序； 3，组合hash索引无法使用部分索引； 4，如果大量索引hash值相同，性能较低；

B+tree

图片

3.创建

1，较频繁的作为查询条件的字段应该创建索引；

2，唯一性太差的字段不适合单独创建索引，即使频繁作为查询条件；&#13; 作为索引的列,如果不能有效的区分数据,那么这个列就不适合作为索引列;比如(性别,状态不多的状态列) &#13; 举例:SELECT sum(amount) FROM accountflow WHERE accountType = 0;&#13; 假如把accountType作为索引列,因为accountType只有14种,所以,如果根据accountType来创建索引,最多只能按照1/14的比例过滤掉数据;但是,如果可能出现,只按照该条件查询,那我们就要考虑到其他的提升性能的方式了;

3，更新非常频繁的字段不适合创建索引；原因,索引有维护成本;

4，不会出现在WHERE 子句中的字段不该创建索引；

5, 索引不是越多越好;(只为必要的列创建索引) 1,不管你有多少个索引,一次查询至多采用一个索引;(索引和索引之间是独立的)&#13; 2,因为索引和索引之间是独立的,所以说每一个索引都应该是单独维护的;数据的增/改/删,会导致所有的索引都要单独维护;

索引的创建原则

4.聚集索引和非聚集索引分别是什么意思，有什么区别

MyISAM索引文件和数据文件是分离的(非聚集)

InnoDB索引实现(聚集)

4.性能优化

分库分表

1.冗余数据的处理（可以提高系统的整体查询性能,三范式）

1、每一列只能有一个值

2、每一行可以被唯一的区分