同九义，为何 SkyWalking 一枝独秀？

数据库基础知识

1. 为什么要使用数据库

数据保存在内存

优点：存取速度快

缺点：数据不能永久保存

数据保存在文件

优点：数据永久保存

缺点：1）速度比内存操作慢，1 O .频繁的IO操作。2）查询数据不方便

数据保存在数据库

1）数据永久保存

2）使用SQL语句，查询方便效率高。

3）管理数据方便

2. 什么是SQL？

结构化查询语言(Structured Query Language)简称SQL，是一种数据库查询语言。

作用：用于存取数据、查询、更新和管理关系数据库系统。

3. 什么是MySQL?

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库~ a *管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS (Relational Database Ma{ . r a , g s nagement SJ 7 o S qystem，关系数据库管理系统) 应用软件之一。在Java企业级开发中非常常用，因为 MySQL 是开源免费的，并且方便扩展。

4.O C { 数据库三大范式是什么

第一范式：; e , i : D每个列都不可以再拆分。

第二范式：在第一范式的基础上，非主键列完全依赖于主键，而不能是依赖于主键的一部分。

第三范式o L R r：在第二范式的基础上，非主键列只依赖于主键，不依赖于其他非主键。

在设计数据库结构的时候，要尽量遵守d B ` ~三范式，如果不遵守，必须有足够的理由。比如性能。事实上我们经常会为了性能而妥协数据库的设计。

5. mysql有关权限的表都有哪几个

MySQL服务器通过权限表来控制I c ` : K d ` A用户对数据库的访问，权限表存放在mysql数据库里，由mysql_install_db脚本初始化。这些权限表分别user，db，table_priv，columns_priv和hD o E _ost。下面分别介绍一下这些表的结构和内容：

user权限表：记录允许连接到服务器的用户帐号信息，里面的权限是全局级的。
db权限表：记录各个帐号在各个数据库上的操作权限。
table_priv权限表：记录数据表级的操作t ~ 9 # m权限。
columns_priv权V x M M限表：* g c s n p /记录数据! j 1 ; I列级的操作权限。
host权限表：配合db权限表对给定主机上数据库级操作权限作更细致的控制。这个权限表不受GRANT和REVOKE语句的影响。

6. MySQL的binlog有有几种录入格式？分别有什么区别？

有三种格式，statex # ! Z L * Fment，row和mixed。

statement模式下，每一条会修改数据的sql都会记录在binlog中。不需要记录每一行的变化，减少了binlog日J M + V B t 1 志量，节约了IO，提高性能。由于sql的执行是有上下文的，因此在保存的时候需要保存相关的信息，同时还有一些使用了函数之类的语句无法被记录复制。
row级别下，f ] ] k ! J v f不记录sql语句上下文相关信息，仅保存哪条记录被修# M 4 d 4 Q W改。记录单元为每一行的改动，基本是可以全部记下来但是由于很多操作，会导致大量行的改动(比如alter table)，因此这种 C 7 4模式的文件保存的信息太多，日志量太大。
mixed，一种折中的方案，普通操作使用statement记录，当无法使用sta+ 7 o t ? [ l ztement的时候使用row。

此外，新版的MySQL中对row级别也D X , Z t 1 U做了一些优化，当表v t E r结构发生变化的时候，会记录语句而不是逐行记录。

数据类型

mysql有哪些数据类型

1、整数类型，包括TINYINT} ^ u ! $ n l、SMAL% ] # # : c q @ MLINT、MEDIUMINT、INT、BIGINT，分别表示1字节、2字节、3字节、4字节、8字节整数。任何整数类型都可以加上UNSIGNED属性，表示数据是无符号的F D 5 = ] | &，即非负整数。
长度：整数类型可以被指定长度，例如：INT(11)表示长度为11的INT类型。W e , D h n Z H长度在大多数场景是没有意义的，它不会限制值的合法范围，只会影响显示字符的个数，而且需要和UNSIGNED ZEROFILL属性配合使用才有意义。
例子，假定类型设定为INT(5)，属. J T性为UNSIGNED ZEROFILL，如果用户插入的数据为12的话，那么数据库实际存储数据为00012。
2、实数类型，包括FLOAT、DOUBLE、DECIMAL。
DECIMAL可以用于存储比BIGINT还大的整型，能存储精确的小数。
而FLOAT和DOUBLE是有取值范围的，并支持使用标准的浮点进行近似计算。
计算时FLOAd Z m _T和DOUBLE相比DECIMAL效率更高一些，DECIMAL你可以理解成是用字符串进行处理。
3、字符串类型，包括VARCHAR、CHAR、TEXT、BLOB
VARCHAR用于存储可变长字符串，~ _ ]它比定长类型更节省空间。
VARCHAR使用额外1或2个字节存储字符串长度。列长度小于25t 0 o5字节时，使用1字节表示，否则使用2+ Z - k ^ L b f字节表示。
VARCHAR存储的内容超出设置的长度时，内容会被截断。
CHAR是定长的，根据定义的字符串长度分配足够的空间。
CHAR会根据需要使用空格进行填充方便比较。
CHAR适合存储很短的字符串，或者所有值都接近同一个长度。
C! @ f E { GHAR存T e y W &储的内容超出设置% n 3 b . Q的长度时，内容同样会被截断。使用策略：
对于经常变更的数据来说，CHAR比VARCHAR更好，因为CHAR不容易产生碎片。
对于非常短的列，CHAR比VARCHAR在存储空间上更有效率。
使用时要注意只分配需要的空间，更长的列排序时会消耗更多内存。
尽量避免使用TEXT/BLOB类型，查询时会使用临时表，导致严Z v ? [ ? v重的性能开销。
4、枚举类型（ENUM），把不重复的数据存储为一个预定义的集j h [ k m合。
有时可以使用ENUM代替常用的字符串类型。
ENUM存储非常紧凑，会把列表值压缩到一个或两个字节。
ENUM在内部存i ^ t储时，其实存的是整数。
尽量避免使用数字作为ENUM枚~ M T ^ n ( - ] S举的常量，因为容易混乱。
排序是按照内部存储的整数
5、日期和时间类型，尽量使用timestamp，空间效率高于datetimJ A . O b z 4 Oe，
用整数保存时间戳通常不方便处理。
如果需要存储微妙，可以使用bigint存储。
看到这里，这道真题是不是就比较容易回答了。

引擎

1. MySQL存储引擎MyISAM与InnoDP ; L Q : ~ n ) UB区别

存储引擎Storage engine：MySQL中的数据、索引以及其他对象是如何存储的，是一套文件系统的实现。

常用8 5 } c的存储引擎有以下l N ; n j y R：

Innodb引擎：Innodb引擎提供了对数据库ACID事务的支持。并且还提供了行级锁和外键的约束。它的设计的目标就是处理大数据容量的数据库系统C T $ $ , v k。
MyIASM引擎(原本M. ) I 8 @ _ mysql的默认引擎)：不提供事务的支持，也不支持行级锁和外键。
MEMORY引擎：所有的数据都在内存中，数据的处理速度快，但是安全性不高。

2s , : c W F + @ t. MyISAM与InnoDB区别

3. MyISAM索引与InnoDB索引的区别？

InnoDB索引是聚簇索引，MyISAH 5 4 T 4 t { u IM索引是非聚簇索引。
InnoDB的主键索引的叶子节点存储着行数t y U o E s f 4据，因此主键索引非常高效。
MyISAM索@ ` 4引的叶子节点存储的是行数据地址，需要再寻址一次才能得到数据。
InnoDB非主键索引的叶子节点存储的是主键和其他带索引的列数据，因此查询时做到覆盖索引会非常高效。

4. InnoDB引擎的4大特性% c $

插入缓冲（insert buffer)
二次写(double write)
自适应哈希索引(ahi)
预读(read ahead)

5. 存储引擎选择

如果没有特别的需求，使用默认的Innodb即可& 7 : * {。

MyISAM：以读写插入为主的应用程序，比如博客系统、d g ^新闻门户网站。

Innodb：更新（删除）操作频率也高，或者要保证数据的完整性；并发量高，支持? $ 1 I 9 & / U事务和外键。比如OA自动化办公系统。

索引

1. 什么是索引？

索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分)，它们包含着对数据: 1 X $ s表里所有记录的b W A W 2 o p引用指针。

索引是一种数据结构。数据库索引，是数据库管理系统中一个排序的数据结构，s ? [ K x e 8 0 V以协助快速查询、更新数据库表: j (中数据。索引的实现通常使用B树及其变种B+树。

更通俗的说，索) ~ [ 4 r V引就相当于目录。为了方便查找书中的内容，通过对内容建立索引形成目录。索引是一个文件，它是要占据物理空间的。

2. 索引有哪些优缺点？

索引的优点

可以大大加快数据的- a o K l e ^ n X检索速度，这也是创建索引的最主要的原因。
通过使用索引，可以在查询的过程中，使用优化隐藏器，提高系统的性能。

索引的缺点

时间方面：创建索引和维护索引要耗费时间，具体地，当对表中的数据进行增加、删除和修改的时候，索引b ) F Q C也要动态的维护，会降低增/改/删的执行效率；
空间方面：索引需要占物理空间。

3. 索引使用场景（重点）

where

上图中，根据id查询记录，因为id字段仅建立了主键索引，因此此SQL执行可选的索引只有主键索引G f E ^ ^，如果有多个，最终会选一个较优的作为检索的依据。

-- 增 D | U ( K加一个没有{ ; b & 6 T建立索引的字段
alter table innodb1 add sex chaf d = d sr(1);
-- 按sex检索时可选的索引为null
EXPLAIN SEL. % ) YECT * from innodb1 where sex=\'男\';

可以尝试在一个字段未建立索引时，根据该字段查询的效率，然后对该字段建立索引（altN M + y J @er table 表名 aO ? V gdd index(字段名)），同样的SQL执行的效率，你p 4 L :会发现查询效率会有明显的提升（数据量越大越明显s 4 D 2 ;）。

ord; Z P Wer by

当我们使用order by将查询结果按照某个字段排序时，如果该字段没有建立索引，那么执行计划会将查询出的所有数据使用外部排序（将数据从硬盘分批读取到内存使用内部排序，最后合并排序结果），这个操作是很影响性能的，因为需要将查询涉及到的所有数据从磁盘中读到内存（如果单条数据过大或者数据量过多都H Y e i 3 [ .会降低效率），更无论读到内存之后的排序了。

但是如果我们对该字段建立索6 8 H o U : K W引alter table 表名 add index(字段名)，那么由于索引本身是有序的，因此直接按照索引的顺序和映射关系逐条取出数据即可。而且如果分页的，那么只用取出索引表某个范围内的索引对应的数据，而不用像上述那取出所有数据进行排序再返回某个范围内4 & l的数据。（从0 ) & n z f v G Z磁盘取数据是最影响性3 _ Y ]能的）

join

对join语句匹配关系（on）涉及的字段建立索引能够提高效率

索引覆盖

如果要查询的字段都建立过索引，那么引擎会直接在索引表中查询而不会访问原始数据（否则只要有一个字段没有建立索引就会做全表扫描），这叫索引覆盖。因此我们需要尽可能的在select后只写必要的查询字段，以增加索引覆盖的几率。

这里值得注意的是不要想着为每个字段建立索引，因为优先使用索引l R o R i # ! %的优势就在于其体积小。

4. 索引有哪几种类型？

主键索引:o p . j c * a 数据列不允许重复，不允许为NULL，一个表只能有一个主键。

唯: 3 o {一索引: 数据列不允许重复，允许为NULL值，一个表允许多个列创建唯一索引。

可以通过 ALTER TABLE table_name ADDo i E ! B UNIQUE (column); 创建唯一索引
可以通过 ALTER TABLE taJ k k B * M f Lble_name ADD UNIQUE (column1,column2); 创建唯一组合索引

普通索引: 基本的索引类型6 p w ! m，没有唯一性的限制，允许为NULL值。

可以通过ALTER TABLE table_name ADD INDEX index_name (column)J b j;创建普通索引
可以通过ALTER TAB~ : ~ t ~ f ; LE table_name ADD INDEX index_name(column1, column2, column3);创建组合索引

全文索引：是目前搜索引擎使用的一种关键技术。

可以通过ALTER TABLE tableh { p e Y % d ? @_name ADDs m ? 4 v } 8 b FULLTEXT (column);创建全文索引

5. 索引的数据结构（b树，hash）

索引的数据结构和具体存储引擎的实现有关，在MySQL中使用较多的索引有Hash索引，B+树索引等，而我们经常使用的InnoDB存储引擎的默认索引实现为：B+树索引。对于哈希索引来说，底层的数据结构就是哈希表，因此在绝大多数需求为单条记录查询的时候，可以选择哈希索引，查询性能最快；其余大部分场景，建议选择BTree索引。

1）B树索引

mysb ; 2 % O , E _ 3ql通过存储引擎取数据，基本上90%的人用的就是InnoDB了，按照实现方式分，InnoDB的索N r 8 Q O u _ O z引类型目前只有两种：BTREE（B树）索引和HASH索引c L ( Q e I .。B树索引是Mysql数据库中使用最频繁的索引类型，基本所有存储引擎都支持BTree索引。通常我们说的索引不出意M R m E M ? O -外指的就是（B树）索引（实际是用B+树实现的，因, ) V n ! [ y为在查看表索引时，mysql一律打印BTREE，所以简称为B树索引）

查询方式：

主键索引区:PI(关联保存的时数据的K k S 地址)按主键查询,

普通索引区:si(关联的id的地址,然后再到达上面的地址)。所以按主键查询,速度最快

B+tree性质：

1.）n棵子tree的节点包含n个关键字，不用来保存数据而是保存数据的索引。

2.）所u p e有的叶子结点中包含了全部关键字的信息，及指向含这些关键字记录的指针，且叶子结点本身依关键字的大小自小而大顺序链接。

3.）所有的非终端结点可以看成是索引部分，结点中仅含其子A t H树中的最大（或最小）关键字。

4.）B+ 树中，数据对象的插入和Q w h @ n G删除X j b 4 g ` N仅在叶节点上进行。

5.）B+树有2个头指针，一个是{ e o ~ V I ]树的根节点，一个是最小关键码的叶节点。

2）哈希索引

简要说下，类似于数据结构中简单实现的HASH表（散列表）一样，当我们在mysql中用哈希索z y :引时，主要就是通过Hash算法（常见的Hash算法有直接定址法、平方取中法、折叠- # d L m 8法、! A , p * k ~除数取余法、随机数法），将数据库字段数据转换成定长的Hash值，与这条数据的行指针一并存入Hash表的对应位置；如果发生Hasy & t 6 L A . ,h碰撞（两个不同关键字的Hash值相同），则在对应Hash键下以链表形式存储。当然这只是简略模拟图。

6. 索引的基本原理

索引用来快速地寻找那些具有特定值的记录。如| Z o - J q f果没有索引，一般来说执行查询时遍历整张表。

索引的原r ) f ) M J j I理很简单，就是把无序的数据变成有序的查询

把创建了索引的列的内容进行排序
对排序结果生成倒排表
在倒排表内容上拼上数据地址链
在查询的时候，先拿到倒排表内容，再取出数据地址链，从而拿到具体数据

7. 索引算法有哪些？

索引算法有 BTree算法和Hash算法

BTree算法

BTree是最U T ; p常用的m& R m R ] 0 Sysql数据库索引算法，也是mysql默认的算法。因为它不仅可以被用在=,>,>=,&l8 7 v t * ( `t;,<=和between这些比较操作符上，而且还可以用U K f } 6于like操作符W k - / k S，只要它的查询条件是一个不以通配符开头的常量，例如：

-- 只要它的查询条件是T + 4 ^ B一个不以通配符开头的常量
select * from user where name like \'jack%\';
-- 如果一通配符开头，或者没有使用常量，则不会使用索引，例如：
select * from user where naD U dme l? x w j iike \'%jack\';

Hash算法

Hash Hash索引只能用于对等比较，例如=,<=&= N 3 Q K u ] Fgt;（相当于=）o * Y s A ! k ;操作符。由于是一次定位数据，不像BTree索引需要从根节点到枝节点，最后才能访问到页节点这样多次IO访问，所以检索效率远高于BTree索引。

8. 索引设计的原则？

适合索引的列是出现在where子句中的列，或者连接子句中指定的列
基数较小的类，索引效果较差，没有必要在此列建立索引
使用短索引，如果对长字f N I j - ( +符E ) U O k C ?串列进行索引，应该指定一个前缀长度，这样能够节省大量索引空间
不要过度索引。索引需要额外的磁盘空间，并降低写操作的性能。在修改表内容的时候，索引会进行更新甚至重构，索引列越多，这个时间就会越长。所以只保持需要的索引有利于查询即可。

9. 创建索引的原则（重中之重）

索引虽好，但也不是无限制的使用，最好符合一下几个原则

1）最左前缀匹配原则，组合索引非常重要的原则，mysql会一直向右匹配直到遇到范围查询(>、<、between、li% b G ? H N /ke)就停止匹配，比o [ ? / ) y 3 .如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)顺序的索引, r z s F 2 = *，d是用不到索引的，如果建立(a,b,d,c)的索引则都可以用到，a,b,d的顺序可以任意调整。

2）较频繁作为查询条件的字段才去创建索引

3）更新频繁字段不适合创建索引

4）若是不能有效区分数据的列不适合做索引列(如性别，男女未知，最多也就三种，区分度实在太低)

5）尽量的扩展索引，不要新建索引。比如表X a - U中已经有a的索引，现在要加(a,b)的索引，那么只需要修改原来J O d 9的索引即可。

6）定义有外键的数据列一定要建立索引。

7）对于那些查询中很少涉及的列，重复值& ; p W Q g u I )比较多的列不要建立索引。

8）对于定义为text、image和bit的数据类型的列不要建立索引。

10. 创建索引的三种方式，删除索引

第一种方式：在执行CREATE TABLE时创建索引

CREATE TABLE user_index2 (
	id INT auto_increment PRIMARY KEY,
	first_name VARCHAR (16),
	last_naW 0 % K ; | p Qme VARCHAR (16),
	id_card VARCHAR (18),
	information t/ B c + aext,
	KEY name (first_name, last_name),
	FULI x w d 8 +LTEXT KEY (informationJ . { } a X ! 3),
	UNIQUE KEY (id_card)
);

第二种方式：使用ALTER TABK ; ILE命令去增加索引

ALTER TABLE table_name ADD INDEX index_name (colK n 4umn_list);1

ALTER TABLE用来创建普通索引、UNIQUE索引或PRIMARY KEY索引。

其. ; $ q @ / 6中table_name是要增加索引的表名，column_list指出对哪些列进行索引，多列时各列之间用逗号分N N n ^隔。

索引名index_name可自P m g己命名，缺省时，MySQL将根据第一个索引列赋一个z I 1 c ( )名称。另外，ALTER TABLE允许在单个语句中更改多个表，因此可以在同时创建多个索引。

第三种方式：使用CREATE INDEX命令创建

CREATE INDEX index_name ON table_name (column_list);

CREATE INDEX可对表增加普通索引或UNIQUE索引。（但是，不能创建PRIMARY KEY索引）

删除] K L索引

根据索引名w O H s g #删除普通索引、唯一索引、全文索引：alter table 表名 drop KEY 索引名

alter table user_index drop KEY name;
alter table user_index drop KEY id_card;
alter tabF D  | ? r ;le user_index| ` { h , Z ~ f drop KEY information;

删除主键索引：alter table 表名 drop primary key（因为主键只有一个）。这里值得注意的是，如果主键自增长，那么不能直接执行此操作（自增长依赖于主键索引）：

需要取消q t $ G I q q }自增长再行删除：

alter table| V u C ` user_index
-- 重新定义d u : m字段
MODIFY iD n ; # x Pd int,
drop PRIMARY KEY

但通常不会删除主键，因为设计主键一定与业务逻辑无关。

11. 创建索引时需要注意什么？

非空字段：应该指定列为NOT NULL，除非你想存储NULL。在mysql中，含有空值的列很难进行查询优化，因为它们使得索引、索引的统计信息以及比较运算更加复杂。你应该用0、一个特殊的值或者一个空串代h y 0 1 W 6替空值；
取值离散大的字段：（变量各个取值之间的差= _ w异程度d ` _）的列放到联合索引的前面，可以通过count()函数查看字段的差异值，返回& _ y F值越大说明字段的@ . % c t A }唯一值越多字段的离散程度高；
索引字段越小越好：数据库的数据存储以页为单位一页存储的数据越多一次IO操作获取的数据越大效率越高。

12. 使用索引查询一3 I Q 0 ( h k定能提高查询的性能吗？为什么

通常，通过索引查m H / , M $ ) G ^询数据比全表扫描要快。但是我k ? ] J f们也必须/ = K =注意到它的代价。

索引需要空间来存储，也需要定期维护，每当有记录在表中增减或索引列被修改时，索引本身也会被修改。这意味着每条记录的INSERTw O _，DELETE，UPDATE将为此多付出4，o ( e P $ # G W5 次的磁盘I/O。因为索引需要额外的存储空间和处理，那些不必要的索引反而会使查询反应时间变慢。使用索引查询不一定能提高查询性能，索引范围查询(INDEX RANGE SCAN)适用于两种情况] G i ~ W:
基于一个范围的检索，一般查询返回结果集小b @ G于表中记录数的30%
基于非唯一性索引的检索

13. 百万级别或以上的数据如何删除

关于索引：由于索s 9 $ ! ?引需要额外的维护成本，因为索引文件是单独存在的文件,所以当我们对数据的增加,修改,删除,都会产生额外的对索引文件的操作,这t ^ 2 1 P T w ? @些操作需要消耗额外的IO,会降低增/改/删的执行效率。所以，在我们删除数据库百万级别数据的时候，查询MySQL官方手册得知删除数据的速度和创建的索引数量是成正比的。

所以我们想要删v $ . W M / ;除百万L 1 n . ; V 8 c数据的时候可以先删, Y Z * d ` G h除索引（此时大概耗时三分多钟）
然后删除其中无用数f 8 A c :据（此过程需要不到两分钟）
删除完成后重新创建索引(此时数b t ; n据较少了)创建索引也非C $ `常快，约十分钟左右。
与之前的直接删除绝对是要快速很多，更别说万一删除中断,一切删除会回滚。那更是坑了。

14. 前缀索引

语法：index(field(10))，使用字段值% E h v P ) s的前2 3 110个字符建立索s H @ 6 h @ N引，默认是使用字段的全部内容建立索引。

前提：前缀的标识度高。比如密码就适合建立前缀索引，因为密码几乎各不相同。

实操的难度：在于前缀截取的长度。

我们可以利用se@ 2 d L % I h olect count(*)/count(distinct left(pa? M Z ) Mssword,prefixLen));，通过从调整prefiQ $ [ 1 D ( |xLen的值（从1自增）查看不同前缀U ( { H h长度的一个平均匹配度，接近1r T R 7 0 ` A T时就可以了（表示一个密码的前prefixLeq x 5 X + } E Z Dn个字符几乎能确定唯一一条记录）

15. 什么是最左前缀原则？什么是最左匹配原则

顾名思义，就是最左优先，在创建多列索引时，要j [ b @ N Y根据x h / q n 9 & /业务需求，where子句中使用最频繁的一列放在最左边。
最左前缀匹配原则，非常重要的原则，mysql会一直向右匹配直到遇到范围查询(>、<, w } q f n &;、between、like)就停止匹配，比如a = 1 and b = 2 and c > 3 an@ Y C W Yd d = 4 如果建立(a,b,c,d)顺序的索引，d是用不到索引的，如果建立(a,b,d,c)的索引则都可以用到，a,b,d的顺序可以任意调整。
=和in可以乱序，比如a = 1 and b = 2 and c = 3 建立(ac C w h O c s * `,b,c)索引可以任意顺序，mysql的k % m r z ( [查询优化器会帮你优化成索引可以识别的形式

16. B树和B+树的区别

在B树中，你可以将键和值存放在内部节点和叶子节点；但在Bh r O+树中，内部Y 6 l H $ * J X o节点都是键，没有值，叶子节点同时存放键和值。
B+树的叶子节点有一条链相连，而B树y Z S 1 t Q = +的叶子节点各自独立。

17. 使用B树的好处

B树可以在内部0 - E , n节点同时存储键和值，因此，把频繁访问的数据放在靠近根节点的地方将会大+ C i @大提高热点数据的查询效率。这种特性使得B树在特定数据重复多次查询的场景中更加高效。

18. 使用B+树的好处

由于B+树的内部节点只存放键，不存放值，因此，一次读取，可以O } R在内存页中获取更多的键，有利于更快地缩小查找范围。B+树的叶节点E @ + A L由一条链相连，因此，当需要进行一次全数据遍历的时候，B+树只需要使用O(logN)时间找到最小的一个节点，然后通过链进行% / `O(N)的顺序遍历即可。而B树则需要对树的每一层进行遍历，这会需要更多的内存置换次数，因此也就需要花费更多的时间

19. Hash索引和B+树所有l ` t i ; ~ + x F有什么区别或者说优劣呢?

首先要知道Hash索引和B+树索引的底层实现原理：

hash索引底层就是hashS x ^表，进行查找时，调用一次hash函数就可以获取到相应的键值，之后进行回表查询获得实际数据。B+树底层实现是多路平衡查找树。对于每一次的查询都是从根节点出发，查找到叶子节点方可以获得所查键值，然后根据查询Z & 5 m { O o D (判断是否需要回表查询数据。

那么可以看出他们有以下的不同：

hash索引进行等值查询更快(一般情况下)，但是却无法进行范F F q Z m围查询。

因为在X 4 0 ~ % E 9 qhash索引中经过hash函b ` F P数建立Q B 0索引之后，索引的顺z [ z p p 2 : s u序与原顺序无K ^ ] ~ w y法保持一致，不能支持范围查询。而B+树的的所有节点皆遵循(左节点小于父节点，右节点大于父节点，多叉树也类似)，f i 0 & :天然支持范L o q L )围。

hash索l _ ~ y L v引不支持使用索引进行排序，原理同上。
hash索引不支持模糊查询以及多列索引的最左前缀匹配。原理L * G | S 2 + e 7也是因为hash函数的不可预测。AAAA和AAAx X ` . I _ /AB的索引没有相关性。
hash索引任何时候都避免不了回表查询数1 x ^ F } y |据，而B+树在符合某些条件(聚簇索引，覆盖索引等)的时候可以只通过索引完成查询。
hash索引虽然在等值查询上较快，但是不稳定。性能不可预测，当某个键值存在大量重复的时候，发生hash碰撞，此时效率可能极差。而B+树的查询效率比较稳定，对于所有的查询都是从根节点到叶子节点，且树的高度较低。

因此，在大多数情况下，直接选择B+树索引可以获得稳定I ~ $ # * ~且较好的查询速度。而不需要使用hash索引。

20.M 2 | } 2 Y # 数据库为什么使用B+. T W 8 ] J U t h树而不是B树

B树只适合随机检索，而B+树同时支持R f g x H随机检索和顺序检索；
B+树空间利用率更高，可减少I/O次数，磁盘读写代价更低。一般来说，索引本身也很大，不可能全部存储在内存中，因此索引往往以索引文件的形式存储的磁盘上。这y ! a K 9 $ %样的话，索引查找过程中就要产生磁盘I/O消耗。Bd C i I . ~ W B u+树的内部结点并没有指向关键字具z ` o x 0 6 b S !体信息的指针，只是作为索引使用，C q - V其内部结点比B树小，盘块能容5 w k 3 s A l ,纳的结点中关键字数量更多，一次性读入内存中可以查找的关键字也就越多，相对的，IO读写次数也就降低了。而IO读写次数G j | p A 0 Y 是影响索引检+ 7 .索效率的最大因素；
B+树的查询效率Y M & o更加稳定。B树搜索有可能会在非叶Y K w w D j [子结点结束，越靠近根节点的记录查找时间越短，e f _ R R只要找到关键字即可确定记录的存在，其性能等价于在关键字@ B E V全集内做一次7 ) 6 { q 9 T 8 H二分查找。而在B+树中，顺序检索比较明显，随机检索时，O 4 K 4 d : G B任何关键字的查找都必须走一条从根节点到叶节点的路，所有关键字的查找路径长度相同，导致每一个关键字的查询效率相当。
B-树在D r z n f E H提高了磁盘IO性能的同时并没有解决元素遍历的效率低下的问题。B+树的叶子节点使用指针顺序连接在一起，只要遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的，而B树不支持这样的操作。
增删文件（节点）时，效率更高。因为B+树的叶/ H 1 Y 9 G y S |子节点包含所有关键字，并以有序的链表结构存储，这样可很好提高增删效率。

21. B+树在满足聚簇索引和覆盖索引的时候不需要回表查询数据

在B+树的索引中，叶子节点可能存储了当前的key值，也可能存储了当前的key值以及整行的数据，这就是聚簇索引和非聚簇索引。在InnoDB中，只有主键索引是聚簇索引，如果没e I = [ ! 1 k T Q有主键，u . C则挑选一个唯一键建立聚簇索引。如果没有唯一键，则隐式的生成一个键来建立聚簇索引。

当查询使用聚簇索引时，在对应的叶子节点，可以获取到整行数据，因此不用再次进行回表查询。

22. 什么是聚O - l簇索引？何时使用聚簇索引与非聚簇索引

聚簇索引：将数据存储与索引放到了一块，找到索引也就找到了数据
非聚簇索引：将数据存储于索引分开结构，索引结构的- | % x叶子节点指向了数据的对应行，myisam通过key_buffer把索引先缓存到内( 0 D 0 (存中，当需要访问数据时（通过索引访问数据），在内存中直接搜索索引，然后通过索引找到磁盘相J h 4应数据，这也就是为什么索引不在key buffer命中时，速度慢的原因

澄清一个概念：innodb中，在聚簇索引之上创建的索引称之为辅助 L + u V } ? H索引，辅助索引访问数据总是需要二次查找，非聚簇索引都是辅助索引，像复合索引、前缀索引、唯一索引，辅助索引叶子节点2 1 A存储的不r 3 * d F o N Q G再是行的物理位置，而是主键值

何时使用聚簇索引与非聚簇索引

23. 非聚簇索引% G D b Y K一定会回表查询吗？

不一定，这涉及到查询语句所要求的字段是否全部命中了索引，如果全部命中了索引，那么就不必再进行回表查询。

举个简单的例子，假设我们在员工表的年龄上建立了) a Q x 0索引，那么当进行select age from employee where age < 2/ f X0的查询时，在索引的叶子节点上，已经包含了age信息，不会再次进行回表查询。

24. 联合索引是什么？为. O / n x ? v V T什么需要注意联合索引中的顺序？

MySQL可以使用多个字段同时建立一个索引，叫做联合索引。在联合索引中，如果想要命中索引，需n & K o要按照建立索引时的字段顺序挨个w [ X使用，否则无法命中索引。

具体原因为:

MySQL使用索引时需要索引有序，假设现在建立了\"name，age，school\"的联合索引，那么索引的排序为: 先按照name排序，如果name相同，则按照age排序，如果J U v & x i Z !age的值也相等，则按照school进行排序。

当进行查询时，此? h ]时索引仅仅按照name严格有序，因此必须首先使用name字段进行等值查询，之后对于匹配到的列而言，其按照age字段严格有序，p , u Y = 4 .此时可以使用age字段n B 5 M G v I用做索引查找，以此类推。因此在建立联合索引的时候应该注意索引列的顺序，一般情况下，将查询需求频繁或者字段选择性高的列放在前面。此Y G Q g V -外可以根据特例的查询或者表S D m P结构进行单独的调整。

事务

1. 什么是数据库事务？

事务是一个不可分割的数据库操作q y U + $ b V序列，也是数据库并发控制的基本单位，H * r . R l Z其执行的结果必须c X b m ] z I #使数据库从一种一致^ j P l + ! q n性状态变到另一种一致性状态。事务是逻辑上的一组操作，要么都执行，要么都不执行。

事务最经典也经常被拿出来说例子就是转账了。

假如小明要给小红转账1000元，这个转账会涉及到两个关键操作就是：将p I W _小明的余额减少1000元，将小红的余额增加1000元。万一在这两个操作之间突然出现错误比如银行系统崩溃，导致小k Z g I { / s明余额减少而小红的余额没有增加，这样就不对了。事务就是保证这两个关键操作要么都成功，要么. F M ) a C N e #都要失败。

2. 事物的四大特性(ACID)介绍一下W g L k 9 T?

关系性数据库需要遵循ACID规则，具体内容如下：

原子性：事务是最小的执行单位，不允许分割。事务的原子性确保动作要+ W Y t么全部完成，要么完全不起作用；
一致性：执行事务前后，数据保持一致，多y h * W 0 J .个事务对同一个数据读取的结果是相同的；9 k M P I ! ? 2
隔离性：并发访问数据库时，一个用户的事务不被其他事务所干扰，各5 z o 2 4 { 5并发事务之间数据库是} U ( s l独立的；
持久性：一个事务被提交之后。它对数据库中数据的l B n改变是持久的，即使数据库发生故障也不应该对其有任何影响。

3. 什么是脏读？幻读？不可重复读？

脏读(Drity Read)：某个事务已更新( r b 2一份数据，另一个事务在此时读取了同一份数据，由于某D V 1 ~ ^ d些原因，前一个RollBack了操作，则后一个事务所读取的数据就会是不正确的。
不可重复读(Non-repeatable read):在一个事务的两次查询之中数据不一致，这可能是两次查询Y ~ c l K j O过% ] B程中间插入了一个事务更新的原有的数据。
幻读(Phantom Read):在一个事务的两次查询中数据笔数不一致，例如有一个事务查询了几列(Row)数据，而另一个事务却在此时插入了新的几列数据，先前的事务在接下来的查询中，就会发现有几列数据是它先M y + _ p前所/ R 6 I - ` R ;没有i I K V的。

4. 什么是事务的隔离级别？MySQL的默认隔离级别是什么？

为了达到事务的四大特性，数! L 5据库定义了4种不同的事务隔离级别，由低到高依次为Read uncommitted、Read co8 e D . smmitted、Repeatable read、Serializable，这四个级别可以逐个解决脏读、不可重复读、幻. u . ( a读这几类问题。

SQL 标准定义了四个隔离s { b Y级别：

READ-UNCOMMITTED(读m I ` 5 p ) [ D取未提交)：最低的隔离级别，允许读取尚未提交的数据变更，可能会导致脏读、幻读或不可重复读。
READ-COMMITTED(读取已提交)：允许读取并发事务已经提交的数据，可以阻止脏读，但是幻读或不可重复读仍有可能发生。
REPEAo S f [ f = GTABLE-REe ( 2 l r ! C ` zAD(可重复读)：对同一字段的多次读取结果都是一致的，除非数据是被本身事务自己所修改，可以阻止脏读和不可重复读，但幻读仍有可能发生。
SERIALIZABLE(可串行化)：最高的隔离级别，完全服从ACID的隔离级别。所有的事务依次逐个执行，这样事务之间就完全不可能产生干扰，也就是说，该级% 1 d / E N别可以防止脏读、不可重复读以及幻读。

这里需要注意的是：Mysql 默认采用g T $ a , b 0的 REPEATABLE_READ隔离x n B j 7 i h d ;级别 Oracle 默认采用的 READ_COMMITTED隔离级别

事务隔离机制的实现基于锁机制5 = u . 5 3和并发调度。其中并发调度使用的是3 x O F r * `MVVC（J A S ? K X多版本并发控制），通过保存修改的c ? T l B 9旧版本信息来支持并发一致性读和回滚等特性。

因为隔离级别越低，事务E v L |请求的锁越少，所u B p N n = 0 1以大部分数据库系统的隔离级别都是READ-COMMITTED(读取提交内容):，但是你要知道的是InnoDB 存储引擎默认使用 **REPEAO ? 9 G | Q aTABLEu y W m 1 9 r & *-READ（可重读）**并不会有任何性能损失。

InnoDB 存储引擎在分布式事务的情况下一般会用到**SERIALIZABLE(可串行化)**隔离级别。

锁

1. 对MySQL的锁了解吗

当数据库有并发事务的时候，可能会产生数据的不一w f @ P V A ] l致，这时候需要一些机制来保证访问的次序，锁机制就是这样的一个机制。

就像酒店的房间，如果大家随意进出，就会出现多人抢夺同一个房间的情况，而在房间上装上锁，申请到钥匙的人才可以入住并且将房间锁起来，其他人只有等他z & ; 6 X f K使用完毕才可以再次使用。

2. 隔离级O n Q r Y x别与锁的关L % } * L e系

在Read Uncommitted级别下，读取数据不需要加共享锁，这样就不会跟被修改的数据上的排他锁冲突

在B s s % =Read Committed级别下，读操| 5 z ( L 0 I h `作需要加共享锁，但是在语句执行完以后释放共享o / D r U b x @锁；

在Repeatable Read级别下，读操作需s o I要加共享锁，但是在事务提交之前并不3 , _释放共享锁，也就是必须等待事务执行完毕以后才释放共享} - 1 6 = N _ 6 t锁。

Su 8 m R Y e Y )ERIALIZABLE 是限制性最强的隔离级别，因为该级别锁定整个范围的键，并一直持有锁，直到事务完成。

3. 按照T J C D锁的粒度V f w Z k 1分数据库锁有哪些？锁机制与InnoDB锁算法

在关系型数据库中，可以按照锁的粒度把数据库锁分为v ? - i S . | .行级锁(INNODB引擎)、表级锁(MYISAM引擎)和页级锁(BDB引擎 )。

MyISAM和InnoDB存储引擎使用的锁：

MyISAM采用表级锁(table-level locking)。
InnoDB支k g }持行级锁(row-level lockin~ $ z e N Sg)和表级锁，默认为行级锁

行级锁，表级锁和页级锁对比

行级锁行级锁是Mysql中o c - j ! ( 6 l 锁定粒度最细的一种锁，表示只针对当前操作的行进行加锁。行级锁能大大减少数据库操作的冲突。其加锁粒度最小，但加锁的开销也最大。行级锁分为共享锁和排他锁。

特点：开销大，加锁慢；会出现死锁；锁定粒度最小，发生锁冲突的概率最低，并发度也最高。

表级锁表级锁是MySQL中锁定粒度最大的一种锁，表示对当前操作的整张表加锁，它实现简单，资源消耗较少，被大部分MySC o {QL引擎支持。最常使用的MYISAM与INNODB都支持表级锁定6 a q h & $。表级锁定分为表共享读U [ C 4锁（共享锁）与表独占写锁（排他锁）。

特y l | d O c P l点：开销小，加锁快；不会出现死锁；锁定粒度大，发出锁冲突的概率最高，并发度最低。

页级锁页级锁是MySQL中锁定粒度介于行级锁和表级锁中间的一种锁。表级锁速度快，但冲突多，行级冲突少，但速度慢。所以取了折衷的页级，一次锁定相邻的一组记录。

特点：开销和加锁时间界于表锁和行锁之间；会出现死锁；锁定粒度界于表锁和行锁之间，并发度一般

4. 从锁的类别上分MySQL都有哪些锁呢？像上面那样子进行锁定岂不是有点阻碍并发效率了

从锁的类别上来讲，有共享锁和排他锁。

共享锁: 又叫做读锁。当用户要进行数据的读取时，对数据加上共享X m : %锁。共享锁可以同时加上多个。

排他锁: 又叫做写锁。当用户要进行数据的写入时，对3 N % U r ~ ( + .数据加上排他锁。排他锁只可以加一个，他和其他的排他锁g 1 N J 3 / Q o，共享锁都相斥。

用上面的q n m ) g N例子来说就是用户的行为有两种，一种是来看房，多个用户一起看房y v i W v ` #是可以接受的。一种是真正的入住一晚，在这期间，无论是想入住的还是想看房的都不可以。| v : . B C q G |

锁的粒度取决于具体的存储引擎，InnoDB实现了行级锁，页级锁，表级锁。

他们的加锁开销从大到小，并发能力也是从大到小] g s x ~。

5. MySQL中InnoDB引擎的行锁是怎么实现的？

答：InnoDB是基于索引来完成行锁

例: select * from tab_with_index where id = 1 for update;

for update 可以根据W . # x o J g @ ;条件来完成行锁锁定，并且 id 是有索引键的列，如果 id 不是索引键那f x V 9 Q - K 9么InnoDB将完成表锁，并发将无从b ` w谈起

6. InnoDB存储引擎的锁的算法有三种

Record lock：单个行记录上的锁
Gap lock：间隙锁，锁定一个范围，不包括记录本身
Next-key lock：ro ? , r } 4 wecord+g [ 8 + 5 i + wgap 锁定一个范围，包含记录本身

视图

10 + S G. 为什么要使用视图？什么是视图？

为了提高复杂SQL语句的复用性和表, h 1 7 T = P L T操作的安全性，MySQL数据库管理系统提供了视图特性。所谓视图，本质上是一种虚拟表，在物理上是不存在的，其内容与真实y 5 D 8 4 7 * q的表相似，包含一系列带有名称的列和行数据。但是，视图并不在数据库中以储存K a ] r t 5 O b的数据值形式存在。行和列数据来自定义视图的查询所引用基本表，并且在具体引用视图时动态生成。

视图使开发者只关心感兴趣的某些特定数据和所负责的特定任务，只能看到视图中所定Q x x ~ / ! ;义的数据，而不是视图所引用表中的数据，从而提高了数据库中数据的安全性。

2. 视图有哪些特点？

视图的特点如下:

视图的列可以来自不同的表，是表的抽象和在逻辑意义上建立} ` x的新关系。
视图是由基本表(实表)产生的表(虚表)。
视图的建立和删除不影响基本表。
对视图内容的更新(~ W添加，删除和修改)直接影响基本表。
当视图来自多个基本表时，不允许添加和删除数据。

视图的操作包括创建视图，查看视图，删除视图和修改视图。

3. 视图的使用场景有哪些？

视图K 3 x z ` z x e &根本用途：简化sql查询，提高开发效率。如果说还有另外一个用途那就是兼容老的表结构。

下面是视图的常见使用场景：

重用SQL语句；
简化复杂的SQL操作。在编写查询后，可以方便的重用它而不必知道它的基G p h本查询细节；
使用表的组成部分而不是整个表；Q S , - t M V }
保护数据。可以给用户授予表的特定部分的访问权限而不是整个表的访问权限；
更改数据格式和0 S U i o表示。视图可返回与底层表的表示和格式不同的数据。

4. 视图的优点

查询简单化。视图S T P = &能简化用户的操作
数据安全性。视图使用户能以多种角度看待同一数据，能够对机密数据提供安全保护
逻辑数据独立性。视图对重构数据库提供了一定程度的逻辑独立性

5. 视图的缺点

性能。数据库必须把视图的查询转化成对基本表的查询，如果这个视图是由一个复杂的多表查询所定义，那么，即使是视图的一个简单查询，数据库也把它变成一个复杂的结合体，需要花费一定的时间W ~ L =。
修改限制。当用户试图修改视图的某些行时，数据库必须把它转化为对基本表的某些行的修改。事实上，当从视图中插入或, 9 . @ L f C者删除时，情况也是这样。对于简单视图来说，这是很方便的，但是，对于比较复杂的视图f w T a M x $ 1 1，可能是不可修改的这些视图有* r f如下特征：1.有UNIQUE等集合操作符@ $ l / z u @的视图。2.有GROUP BY子句的视图。3.有诸如AVG\\SUM\\MAX等聚合函数的视图。4.使用DISN l 4 3 Z aT? E k AINCT关键字的F H 9 ; j视图。5.连接表G ^ u的视图（其中有些例外）

6. 什么是游标？E | &

游标是系统为用户开设的一个数据缓冲区，存放SQL语句的执行结果，每个游标区都有一个名字。用户可以通过游标逐一获取记录并7 - U赋给c 0 u主变量，交由主语言进一步处理。

存储过程与函数

什么是存储过程？有哪些优缺点？

存储过程是一个预编译的SQL语句，优点是允许模块化的设计，就是说只需要创建一次，以后在该程序中就可以调用多次。如果某次操作需要执行多次SQL，使用存储过程比单纯SQL语句执行要快。

优点

1）存储过程是预编译过的，执9 ! W $ -行效率高。

2）存储过程的代码直接存放于数据库中F H Z S k v C ? 3，通过存储过程名直接调用，减少网络通讯。

3）安全性高，执行1 z A [ f存储过程需要有一定权限的用户。

4）存储过程可以重复使用，减少数据库开发人员的工作量。

缺点

1）调试d [ P麻烦，但是用 PL/SQL Developer 调试很方便！弥补这个缺点。

2）移r U n .植问题，数据库端代码当然是与数据库相关的。但是如果是做工程型项目，基本不存在移植问题。

3）重新编译问题，因为后端代码是运行前} S 7 L =编译的，如果带有引用关系的对象发生改变时，受影响的存储过程、包将需要重新编译（不过也可? 9 x ( X以设置成运行时刻自动编译）。

4）如果在一个程序系统中大量的- k A e B ; A使用存储过程，到程序交付使用的时候随着用户需求的增加会导致数据结构的变化，接着就是系统的相关问题了，最后如果用M % z C 0 C X户想维护该系统可以说是很难很难、而且代价是空前的，维护起来更麻烦。

触发器

1. 什么是触发器？触发器的使用场景有哪些？

触发器是用户定义在关系表上的一类由事件驱动的特殊的存储过程。触发器是指一段代码，当触发某个事件时，自动执? s y W }行这些代q Q = 0 N O t Q码。

使用场景

可以通过数据库中的相关表实现级联更改。
实时监控某张表中的某个字段的更改而需要做出相应的处理。
例如可以生成某些业务的编号。
注意不要滥用，否则会造成数据库及应用程序的维护困难。
大家需要牢记以上基础知识点，重点是理解数据类型CHAR和VARCHARu e n ,的差异，表存储引擎InnoDB和MyISAM的区别。

2. MySQL中都有哪些触发器？

在MySQL数据库中有如下六种触发器：

Before Insert
After Insert
Before Update
After Update
Before Delete
After Delete

常用SQL语句

1. SQL语句主要分为哪几类

数据定义语言DDL（Data DdefinitioD L ; @ T (n Language）CREAj M H * d 2 u 1TE，DROP，ALTER

主要为以上操作即对逻辑结构等有操作的，其中包括表结构，视图和索引。

数据查询语言DQL（Data Query Language）SELECT

这个较为好理解即查p ` / s D [ | k询操作，以s2 # L 4elect关键字。各种简单查询，连接查询等都属于DQL。

数据操纵语言DML（Data Manipulati$ [ b $ d * 6 b Kon Language）INSERT，UPDATE，DELETE

主要为以上操作即对数据进行操作的，对应上面所说的查询操作 DQL与DML共同构建了多数初级程序员常用的增删改查操作。而查询是较为特殊的一种被划分到DQL中。

数据控制功能DCL（Data ControlL ~ 3 A 3 c Languat + e i Q ;ge）GRANT，REVOKE，COMMIT，ROLLBACK

主要为以上操作即对数据库安全性完整性等有操作的，可以简单的理解为权限控制等。

2. 超键、候选键、主键、外键分别是什么？

超键：在关系中能唯一标识元组的属性集称为关系模式的超键。一个属性可以为作为一个超键，多个属性组合在一起也可以作为一个超键。超键包含候选键和主键。
候选键：是最小超键，即没有冗余元素的超键g v S。
主键：数据库表中对储存数据对象予以唯一和完整标识的数据列或属性的3 K 5 Y - U 4 ! !组合。一个5 v J D } 6 2数据列只能有一个主键，且主键的取值不能缺失，即不能为空值（Null）。z 6 0 g e ^ O |
外键：在一个表中存在的另一个表的主键称此表的外键。

3. SQL 约束有哪几种？

SQL 约束有哪几种？

NOT NULL: 用于控制字段的内容一定不能为空（NULL）。
UNIQUE: 控件字段内容不能重复U W J 3 8 . R K ，一个表允许有多个 Unique 约束。
PRIMARY KEY: 也是用于控件字段内容不能重复，但它在一个表只m N : 6 e ? h J l允许出现一个。
FOREIGN KEY: 用于预防破坏表之间连接的] : p : O & ~动作，也能防止非法数据插入外键列，因为它必须是它指! d j向的那个表中的值之一% 4 2 [ u u a。
CHECK: 用于控制字段的值范围。

4. 六种关联查询

交叉连接（CROSS JOIN）
内连接（INNv c D I B U AER JOIN）
外连接（LEFT JOIN/RIGHT JOIN）
联合查询（UNIOs & X E {N与UNION ALL）
全连接（FULL JOIN）
交C + ! B y } ^ (叉连接（CROSS JOIN）

SELECT * FROM A,B(,C)或者SELECT * FROM A CROSS JOI+ T , ,N B (CROSS JOIN C)#没有任何关联条| d : C !件，结果是笛卡尔积，结果集会很大，没有意义，很少使用内连接（INNER JOIN）SELECT * FROM A,B WHERE A.id=B.id或者SELECT * FROM A INNER JOIN Br 8 ? t m ; , g ON A.id=B.id多表中同时符合某种条件的数据记录的集合，INNER JOIN可以缩写为JOIN

内连接U E 3 K 9 * *分为三类

等值连接：ON A.id=B.id
不等值连接：ON A.id > B.id
自连接：SELECT * FROM A T1 INNER JOIN A T2 ON T1.id=T2.pid

外连接（LEFT JOIN/RIGHT JOIN）

左9 v J J 3 ~ S外连接y C W W } ( j W：LEFT OUTER JOIN, 以左表为主，先查询出左表，按照O_ [ [ :N后的关联条件匹配右表，没有匹配到的用NULL填充，可以简写成LEFT JOIN
右外连接：RIGHT OUTER JOIN, 以右表为主，先查询出右表，按照ON后的关联条件匹配左表，没有匹配到的用NULL填充，可以简写成RIGHT JOIN

联合查询（UNION与UNION ALL）

SELECT * FROM A UNION SELECT * FROM B UNION ...

就是把多个结果集集中在一起，UNION前的K L m e ?结果为基准，需要注意的是联合查询的列数要h $ ? :相等，相同的记_ 5 O 3 p O录行会合并
如果使用UNION ALL，不会合并重复的记录行
效率 UNION 高于 UNIOQ & L YN ALL

全连接（FULL JOIN）

MySQL不支持全连接
可以使用LEFT JOIN 和UNION和Y K z & RIGHT JOIN联合l ` w使用

SELECT * FROM A LEFT JOIN B ON A.id=B.id UNN _ M DIONSELECT * FROM A RIGHT JOIN B ON A.id=B.f y + M f l [ D gid

表连接面试题

有2张表，1张R、1张S，R表有ABC三列，S表有CD两列，表中各有三条记录。

5. 什么是子查询

条件：一条SQL语句的查询结果做为另一条查询语句的条件或查询结果
嵌套：多条SQY 8L语句嵌套使用，内部的SQL查询语句称为子查询。

6. 子查询的三种情况P J b l

子查询是单行单列的情况：结果集是一个值，父查询使用：=、 <、 > 等运算符

-- 查询工资最高的员工是谁？
select  * from employee where salary=(selec: U Nt max(salary) from employee);

子查询是多行单列的情况：结果集类似于一个数组，父查询使用：in6 K U n ( O 运算符

--r o | 查询工资最高的员工是谁？
select  * from employee where salary=(select map n b | @ Ix(salary) from employee);

子查询是多行多列的情况： p ^ O结果集类似于一张虚拟表，不能用于where条件，用于sej C G 7 9lect子句中做为子表

-- 1) 查询出2011年以后= . ? X入职的员工信息
-- 2)p = V O ` a ? c Q 查询所有的#  s - o ? s部门信息，与上面的虚拟表中的信息比对，找出所有部门ID相等的员工。
select * from dept d,  (select * from employee where join_date > \'2011-1-1\') e where e.dept_id =  d.id;– 使用表连接：

sel8 e E Kect d., e. fro~ u - ! 3 J J #m  dept d inner join employee e on d.id = e.dept_id where e.join_date >  ‘2011-1-1’

7. mysql中 in 和 exists 区别

mysq3 W 7 %l中的in语句是把外表和内表作hash 连接，而er 1 w 8 yxists语句是对外表作loop循环，每次loop循环再对内表进行查询。一直大7 P 6 2 g家都认为exists比in语句的效率要高，这种说法其实是不准确的。这个是要区分环境的。

如果查询的两个表大小相当，那4 h U ` W t j么用in和existX X T ; |s差别不大。L ? r t P C `
如果两个表中一个较小，一个是大表，则子查询表大的用exists，子查询表小的用in。
not in 和not exists：如果查询语句使用了not in，那么内外表都进行全表扫描，没有用到索引；而not extsts的子查询依然能用到表上的索引。所以无论那个@ D ~表大，用not exists都比nof + = E _ 2 vt in要快n z 5 x l r b d F。

8. varchar与char的区别

char的特点

char表示定长字符串，长度是固定的；
如果插入数据的长度小于char的固定长度时，则用空格填充；
因为长度固定，所以存取速度要比varchar快很多，甚至能快 8 h ; N J i U &50%，但正因为其? ? c J ,长度固定，所以会占据多余的空间，是空间Y 5 L * q r - *换时间的做法；
对于chat M U dr来说，最多能存放的字U H w符个数为255，和编码无关

varchar的S I r特点

varchar表示可变长字符串，长度是可变的；
插入的数据是多长，就按照多长来g _ s % & E $ V存储；
varchar在存取方面与char相反，w E L ) i它存取慢，因为长度不固定，但正因如此，不占据多余的空间，是时间换空间的做法；
对于varchar来说，最多能存放的字符个数为65532

总之，结合性能角度（char更快）和节省磁盘空间角度（varchar更小），具体情况还需具体来设计数据库才是妥当的做法。` 9 (

9. varchac s & M r 5 # ;r(50)中50的涵义

最多存放50个字符，varchar(50)和(200)存储hello所占空间一样，但后者在排序时会消耗更多内存，因为order by col采用fixed_length计算col长度(memory引擎也一样)。在早期 MySQL 版本中， 50 代0 f 2 ^表字节数，现在代表字符数。

10. intz @ 9 V M q w(20)中20的涵义

是指显示字符的长度。20表示最大显示宽度为20，但仍占4字节存储，存储范围不变；

不影响内部存储，只是影响带 zerofill 定义的 int 时，前面补多少个 0，易于报表展示

11. [ T 1 L mysql为什么这么: G ( k 5 ~设计

对大多数应用没~ S # 3 H D w q有意义，只是规定一些工具用来显示字符的个数；int(1)和int(20)存储和计算` w @ O均一样；

12. mysql中int(10)和char(

本文系本站编辑转载，文章版权归原作者所有，内容为作者个人观点，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请与本站联系，本站将在第一时间删除内容！

文章标签
企业
员工
工作
新建
本地新闻
瑞典
确保
隔离
项目

同九义，为何 SkyWalking 一枝独秀？

数据库基础知识

数据类型

引擎

索引

事务

锁

视图

存储过程与函数

触发器

常用SQL语句

以太坊创始人：17岁的亿万富翁养成记

哪些抗击疫情的硬核黑科技让你惊叹？

发表评论取消回复

数据库基础知识

数据类型

引擎

索引

事务

锁

视图

存储过程与函数

触发器

常用SQL语句

以太坊创始人：17岁的亿万富翁养成记

哪些抗击疫情的硬核黑科技让你惊叹？

你也可能喜欢

发表评论 取消回复

发表评论取消回复