mysql学习笔记

MySQL架构

第一层：服务层(为客户端服务):为请求做连接处理，授权认证，安全等。
第二层：Mysql核心服务层：主要提供，查询解析、分析、优化、缓存以及内置函数，跨存储引擎功能（存储过程、视图、触发器）
第三层：存储引擎层，负责数据的存储和提取

https://www.jianshu.com/p/1f17a496f14e

Connectors
不同语言与SQL交互。
Management Services &Utilities
系统管理和控制工具。
Connection Pool
连接池，管理缓冲用户连接，线程处理所需要的缓存。
SQL Interface
接受用户的SQL命令，返回用户查询结果，比如 select from 就是调用 sql interface
Parser
解释器 ,SQL命令传递到解释器的时候会被解释器验证和解析，解释器由Lex和YACC实现(一个很长的脚本)，主要功能，将SQL语句分解成数据结构，并将这个结构传递到后续步骤，以后的SQL语句的传递和处理都是基于这个结构，如果在分解构成中遇到错误，说明这个sql语句是不合理的
Optimizer
查询优化器，SQL语句在查询之前会使用查询优化器对查询进行优化，他使用的是“选取-投影-连接”进行查询，用一个例子就可以理解：select uid,name from user where gender =1;这个select 查询先根据where语句进行选取，而不是先将表全部查询出来以后再进行gender过滤，这个select 查询先根据uid和name进行属性投影，而不是将属性全部取出以后再进行过滤，将这2个查询条件连接起来生成最终查询结果。
Cache和Buffer查询缓存
这个查询缓存有命中的查询结果，查询语句就可以直接去查询缓存中取数据，这个缓存机制由一系列小缓存组成，比如表缓存，记录缓存，key缓存，权限缓存
Enginee
存储引擎，存储引擎是MySql和文件打交道的具体子系统，MySQL的存储引擎是插件式的，它根据MySql AB公司提供的文件访问层的一个抽象接口来定制一种文件访问机制(这个访问机制就叫做存储引擎)，一个库中不同表使用不同的存储引擎也是允许的。

多版本并发控制MVCC：Multi-Version Concurrent Control

MVCC是为了实现数据库的并发控制而设计的一种协议。要实现并发控制基本上都是通过锁实现的，跟我们通常的理解一样，我们可以用读锁与写锁来控制数据的一致性，但是这样做保证不了高并发的需求，因为它实现的是读写串行化, 因此诞生了一种与基于锁的并发控制LBCC（Lock-Based Concurrent Control）相对的MVCC，有更优越的并发性能。

几乎所有的RDBMC都支持MVCC，它的好处是，读不加锁，读写不冲突，读操作可以分为两类，快照读（snapshot read）和当前读（current read）快照读，读取的是记录的可见版本（可能是历史版本，即最新数据可能正在被执行的事务修改），不会对返回的记录加锁。而当前读（current read）读取的是记录的最新版本，并且会返回对返回的记录加锁，保证其他事务不会并发修改这条记录。

在MySQL InnoDB中，简单的select操作，如 select * from table where ? 都属于快照读；属于当前读的包含以下操作：

select * from table where ? lock in share mode; （加S锁）
select * from table where ? for update; （加X锁，下同）
insert, update, delete操作

需要注意的是，以上需要加X锁的都是当前读，而普通的select（除了for update）都是快照读，每次insert、update、delete之前都是会进行一次当前读的，这个时候会上锁，防止其他事务对某些行数据的修改，从而造成数据的不一致性。我们广义上说的幻读现象是通过MVCC解决的，意思是通过MVCC的快照读可以使得事务返回相同的数据集

隔离级别

在SQL标准中定义了四种隔离级别，低级别的隔离可以执行更高级别的并发，性能好，但是会出现脏读和幻读的现象。

-脏读（dirty read）：两个事务，一个事务读取到了另一个事务未提交的数据，这便是脏读。
-幻读（phantom read）：两个事务，事务A与事务B，事务A在自己执行的过程中，执行了两次相同查询，第一次查询事务B未提交，第二次查询事务B已提交，从而造成两次查询结果不一样，这个其实被称为不可重复读；如果事务B是一个会影响查询结果的insert操作，则好像新多出来的行像幻觉一样，因此被称为幻读。其他事务的提交会影响在同一个事务中的重复查询结果。

以下是SQL中定义的四种标准隔离级别

未提交读(Read Uncommitted)：可以读取未提交的记录。会出现脏读。
提交读(Read Committed)：事务中只能看到已提交的修改。不可重复读，会出现幻读。（在InnoDB中，会加行所，但是不会加间隙锁）该隔离级别是大多数数据库系统的默认隔离级别，但是MySQL的则是RR。
可重复读(Repeated Read)：在InnoDB中是这样的：RR隔离级别保证对读取到的记录加锁 (记录锁)，同时保证对读取的范围加锁，新的满足查询条件的记录不能够插入 (间隙锁)，因此不存在幻读现象。但是标准的RR只能保证在同一事务中多次读取同样记录的结果是一致的，而无法解决幻读问题。InnoDB的幻读解决是依靠MVCC的实现机制做到的。
串行读(Serializable)：完全串行化的读，每次读都需要获得表级共享锁，读写相互都会阻塞（SQLite）

Innodb的优势

DML操作遵循ACID模型，通过commit, rollback和奔溃恢复的事务特性保护用户数据。
提供行级锁和一致性读，提高了并发性和性能。
每个表都有一个主键索引，使用聚簇索引的方式组织数据，减少主键查询的IO，提高基于主键的查询语句。
InnoDB采用MVCC支持高并发，默认隔离级别是REPEATABLE READ(可重复读), 并且通过next-key
locking策略防止幻读的出现。间隙锁使得Innodb不仅仅锁定查询涉及的行，还会对索引中的间隙进行锁定，以防止幻影行的插入。
InnoDB是基于聚簇索引建立的，聚簇索引对主键查询有很高的性能。但是二级索引(Secondary index, 非主键索引)中必须包含主键列。
innodb的高性能的原因:

Insert Buffer
异步IO
Double write
Adaptive Hash Index

Innodb实现MVCC

　MVCC可以认为是行级锁的一个变种，它可以在很多情况下避免加锁操作，因此开销更低。MVCC的实现大都都实现了非阻塞的读操作，写操作也只锁定必要的行。InnoDB的MVCC实现，是通过保存数据在某个时间点的快照来实现的。一个事务，不管其执行多长时间，其内部看到的数据是一致的。也就是事务在执行的过程中不会相互影响。下面我们简述一下MVCC在InnoDB中的实现。

　　InnoDB的MVCC，通过在每行记录后面保存两个隐藏的列来实现：一个保存了行的创建时间，一个保存行的过期时间（删除时间），当然，这里的时间并不是时间戳，而是系统版本号，每开始一个新的事务，系统版本号就会递增。在RR隔离级别下，MVCC的操作如下：

select操作。a. InnoDB只查找版本早于（包含等于）当前事务版本的数据行。可以确保事务读取的行，要么是事务开始前就已存在，或者事务自身插入或修改的记录。b. 行的删除版本要么未定义，要么大于当前事务版本号。可以确保事务读取的行，在事务开始之前未删除。
insert操作。将新插入的行保存当前版本号为行版本号。
delete操作。将删除的行保存当前版本号为删除标识。
update操作。变为insert和delete操作的组合，insert的行保存当前版本号为行版本号，delete则保存当前版本号到原来的行作为删除标识。
　　由于旧数据并不真正的删除，所以必须对这些数据进行清理，innodb会开启一个后台线程执行清理工作，具体的规则是将删除版本号小于当前系统版本的行删除，这个过程叫做purge。

参考内容

高性能MySQL
MySQL架构
 mysql、innodb和加锁分析
 MySQL的并发控制与加锁分析

MySQL架构

多版本并发控制MVCC：Multi-Version Concurrent Control

隔离级别

Innodb的优势

Innodb实现MVCC

参考内容

CATALOG

FEATURED TAGS

FRIENDS