MySQL关系型数据库 | 学习才是源动力

# MySQL关系型数据库

MySQL是一个关系型数据库管理系统 (opens new window)，由瑞典MySQL AB 公司开发，属于 Oracle (opens new window) 旗下产品。MySQL 是最流行的关系型数据库管理系统 (opens new window)之一，在 WEB 应用方面，MySQL是最好的 RDBMS (opens new window) (Relational Database Management System，关系数据库管理系统) 应用软件之一。

MySQL是一种关系型数据库管理系统，关系数据库将数据保存在不同的表中，而不是将所有数据放在一个大仓库内，这样就增加了速度并提高了灵活性。

MySQL所使用的 SQL 语言是用于访问数据库 (opens new window)的最常用标准化语言。MySQL 软件采用了双授权政策，分为社区版和商业版，由于其体积小、速度快、总体拥有成本低，尤其是开放源码 (opens new window)这一特点，一般中小型网站的开发都选择 MySQL 作为网站数据库。

# 应用环境

与其他的大型数据库例如 Oracle (opens new window)、DB2 (opens new window)、SQL Server (opens new window)等相比，MySQL [1] 自有它的不足之处，但是这丝毫也没有减少它受欢迎的程度。对于一般的个人使用者和中小型企业来说，MySQL提供的功能已经绰绰有余，而且由于 MySQL是开放源码 (opens new window)软件，因此可以大大降低总体拥有成本。

Linux (opens new window)作为操作系统 (opens new window)，Apache (opens new window) 或Nginx (opens new window)作为 Web (opens new window) 服务器，MySQL 作为数据库 (opens new window)，PHP/Perl/Python (opens new window)作为服务器端脚本 (opens new window)解释器 (opens new window)。由于这四个软件都是免费或开放源码 (opens new window)软件（FLOSS (opens new window))，因此使用这种方式不用花一分钱（除开人工成本）就可以建立起一个稳定、免费的网站系统 (opens new window)，被业界称为“LAMP (opens new window)“或“LNMP (opens new window)”组合。

# 系统特性

1． [2] mySQL使用 C和 C++ (opens new window)编写，并使用了多种编译器 (opens new window)进行测试，保证了源代码 (opens new window)的可移植性。

2．支持 AIX (opens new window)、FreeBSD (opens new window)、HP-UX、Linux (opens new window)、Mac OS (opens new window)、Novell (opens new window)Netware、OpenBSD (opens new window)、OS/2 Wrap、Solaris、Windows (opens new window)等多种操作系统。

3．为多种编程语言 (opens new window)提供了 API (opens new window)。这些编程语言包括 C (opens new window)、C++、Python (opens new window)、Java (opens new window)、Perl (opens new window)、PHP (opens new window)、Eiffel、Ruby,.NET和 Tcl 等。

4．支持多线程，充分利用 CPU 资源。

5．优化的 SQL (opens new window)查询算法，有效地提高查询速度。

6．既能够作为一个单独的应用程序应用在客户端服务器 (opens new window)网络环境中，也能够作为一个库而嵌入到其他的软件中。

7．提供多语言支持，常见的编码如中文的 GB 2312 (opens new window)、BIG5 (opens new window)，日文的 Shift_JIS等都可以用作数据表名和数据列名。

8．提供 TCP/IP (opens new window)、ODBC 和 JDBC (opens new window)等多种数据库 (opens new window)连接途径。

9．提供用于管理、检查、优化数据库操作的管理工具 (opens new window)。

10．支持大型的数据库。可以处理拥有上千万条记录的大型数据库。

11．支持多种存储引擎 (opens new window)。

12.MySQL 是开源的，所以你不需要支付额外的费用。

13.MySQL 使用标准的 SQL (opens new window)数据语言形式。

14.MySQL 对 PHP 有很好的支持，PHP (opens new window)是比较流行的 Web 开发语言。

15.MySQL是可以定制的，采用了 GPL (opens new window)协议，你可以修改源码来开发自己的 MySQL 系统。

16.在线 DDL/更改功能，数据架构支持动态应用程序和开发人员灵活性（5.6新增）

17.复制全局事务标识，可支持自我修复式集群（5.6新增）

18.复制无崩溃从机，可提高可用性（5.6新增）

19.复制多线程从机，可提高性能（5.6新增）

20.3倍更快的性能（5.7 [3] 新增）

21.新的优化器（5.7新增）

22.原生JSON支持（5.7新增）

23.多源复制（5.7新增）

24.GIS的空间扩展 [4] （5.7新增）

# 存储引擎

MyISAM (opens new window)MySQL 5.0 之前的默认数据库引擎，最为常用。拥有较高的插入，查询速度，但不支持事务 (opens new window)

InnoDB (opens new window)事务型数据库的首选引擎，支持ACID事务，支持行级锁定, MySQL 5.5 起成为默认数据库引擎

BDB (opens new window)源自 Berkeley DB，事务型数据库的另一种选择，支持Commit 和Rollback 等其他事务特性

Memory所有数据置于内存的存储引擎，拥有极高的插入，更新和查询效率。但是会占用和数据量成正比的内存空间。并且其内容会在 MySQL 重新启动时丢失

Merge将一定数量的 MyISAM 表联合而成一个整体，在超大规模数据存储时很有用

Archive非常适合存储大量的独立的，作为历史记录的数据。因为它们不经常被读取。Archive 拥有高效的插入速度，但其对查询的支持相对较差

Federated将不同的 MySQL 服务器联合起来，逻辑上组成一个完整的数据库。非常适合分布式应用 (opens new window)

Cluster/NDB高冗余 (opens new window)的存储引擎，用多台数据机器联合提供服务以提高整体性能和安全性。适合数据量大，安全和性能要求高的应用

CSV (opens new window)：逻辑上由逗号分割数据的存储引擎。它会在数据库子目录里为每个数据表创建一个 .csv 文件。这是一种普通文本文件，每个数据行占用一个文本行。CSV 存储引擎不支持索引 (opens new window)。

BlackHole：黑洞引擎，写入的任何数据都会消失，一般用于记录 binlog 做复制的中继

EXAMPLE 存储引擎是一个不做任何事情的存根引擎。它的目的是作为 MySQL 源代码 (opens new window)中的一个例子，用来演示如何开始编写一个新存储引擎。同样，它的主要兴趣是对开发者。EXAMPLE 存储引擎不支持编索引。

另外，MySQL 的存储引擎接口定义良好。有兴趣的开发者可以通过阅读文档编写自己的存储引擎 [5] 。

# 应用架构

单点，适合小规模应用

复制（Replication），适合中小规模应用

集群 (opens new window)（Cluster），适合大规模应用

# 索引功能

索引是一种特殊的文件（InnoDB 数据表上的索引是表空间 (opens new window)的一个组成部分），它们包含着对数据表里所有记录的引用指针。索引不是万能的，索引可以加快数据检索操作，但会使数据修改 (opens new window)操作变慢。每修改数据记录，索引就必须刷新一次。为了在某种程度上弥补这一缺陷，许多 SQL 命令都有一个 DELAY_KEY_WRITE 项。这个选项的作用是暂时制止 MySQL 在该命令每插入一条新记录和每修改一条现有之后立刻对索引进行刷新，对索引的刷新将等到全部记录插入/修改完毕之后再进行。在需要把许多新记录插入某个数据表的场合，DELAY_KEY_WRITE 选项的作用将非常明显。另外，索引还会在硬盘上占用相当大的空间。因此应该只为最经常查询和最经常排序的数据列建立索引。注意，如果某个数据列包含许多重复的内容，为它建立索引就没有太大的实际效果。

从理论上讲，完全可以为数据表里的每个字段分别建一个索引，但 MySQL 把同一个数据表里的索引总数限制为16个。

1．InnoDB 数据表的索引

与 InnoDB (opens new window)数据表相比，在 InnoDB 数据表上，索引对 InnoDB 数据表的重要性要大得多。在 InnoDB 数据表上，索引不仅会在搜索数据记录时发挥作用，还是数据行级锁定机制的基础。“数据行级锁定”的意思是指在事务操作的执行过程中锁定正在被处理的个别记录，不让其他用户进行访问。这种锁定将影响到（但不限于）SELECT、LOCKINSHAREMODE、SELECT、FORUPDATE 命令以及 INSERT、UPDATE 和 DELETE 命令。出于效率方面的考虑，InnoDB 数据表的数据行级锁定实际发生在它们的索引上，而不是数据表自身上。显然，数据行级锁定机制只有在有关的数据表有一个合适的索引可供锁定的时候才能发挥效力。

2．限制

如果 WHERE 子句的查询条件里有不等号（WHERE coloum !=），MySQL 将无法使用索引。类似地，如果 WHERE 子句的查询条件里使用了函数（WHERE DAY（column）=），MySQL 也将无法使用索引。在 JOIN 操作中（需要从多个数据表提取数据时），MySQL 只有在主键和外键 (opens new window)的数据类型相同时才能使用索引。

如果 WHERE 子句的查询条件里使用比较操作符 LIKE 和 REGEXP，MySQL 只有在搜索模板的第一个字符不是通配符 (opens new window)的情况下才能使用索引。比如说，如果查询条件是 LIKE 'abc%‘，MySQL 将使用索引；如果查询条件是 LIKE '%abc’，MySQL 将不使用索引。

在 ORDER BY 操作中，MySQL 只有在排序条件不是一个查询条件表达式的情况下才使用索引。（虽然如此，在涉及多个数据表查询里，即使有索引可用，那些索引在加快 ORDER BY 方面也没什么作用）。如果某个数据列里包含许多重复的值，就算为它建立了索引也不会有很好的效果。比如说，如果某个数据列里包含的净是些诸如 “0/1” 或 “Y/N” 等值，就没有必要为它创建一个索引。

# 索引类别

1．普通索引

普通索引（由关键字 KEY 或 INDEX 定义的索引）的任务是加快对数据的访问速度。因此，应该只为那些最经常出现查询条件（WHERE column =）或排序条件（ORDER BY column）中的数据列创建索引。只要有可能，就应该选择一个数据最整齐、最紧凑的数据列（如一个整数类型的数据列）来创建索引。

2．索引

普通索引允许被索引的数据列包含重复的值。比如说，因为人有可能同名，所以同一个姓名在同一个“员工个人资料”数据表里可能出现两次或更多次。

如果能确定某个数据列将只包含彼此各不相同的值，在为这个数据列创建索引的时候就应该用关键字UNIQUE 把它定义为一个索引 (opens new window)。这么做的好处：一是简化了 MySQL 对这个索引的管理工作，这个索引也因此而变得更有效率；二是 MySQL 会在有新记录插入数据表时，自动检查新记录的这个字段的值是否已经在某个记录的这个字段里出现过了；如果是，MySQL 将拒绝插入那条新记录。也就是说，索引可以保证数据记录的独特性。事实上，在许多场合，人们创建索引的目的往往不是为了提高访问速度，而只是为了避免数据出现重复。

3．主索引

在前面已经反复多次强调过：必须为主键字段创建一个索引，这个索引就是所谓的“主索引 (opens new window)”。主索引区别是：前者在定义时使用的关键字 (opens new window)是 PRIMARY 而不是 UNIQUE。

4．外键索引

如果为某个外键 (opens new window)字段定义了一个外键约束条件，MySQL 就会定义一个内部索引来帮助自己以最有效率的方式去管理和使用外键约束条件。

5．复合索引

索引可以覆盖多个数据列，如像 INDEX (columnA, columnB) 索引。这种索引的特点是 MySQL 可以有选择地使用一个这样的索引。如果查询操作只需要用到 columnA 数据列上的一个索引，就可以使用复合索引 INDEX(columnA, columnB)。不过，这种用法仅适用于在复合索引中排列在前的数据列组合。比如说，INDEX (A，B，C) 可以当做 A 或 (A,B) 的索引来使用，但不能当做 B、C 或 (B,C) 的索引来使用。

# 索引长度

在为 CHAR 和 VARCHAR 类型的数据列定义索引时，可以把索引的长度限制为一个给定的字符 (opens new window)个数（这个数字必须小于这个字段所允许的最大字符个数）。这么做的好处是可以生成一个尺寸比较小、检索速度却比较快的索引文件 (opens new window)。在绝大多数应用里，数据库中的字符串数据大都以各种各样的名字为主，把索引的长度设置为10~15 个字符已经足以把搜索范围缩小到很少的几条数据记录了。在为 BLOB 和 TEXT 类型的数据列创建索引时，必须对索引的长度做出限制；MySQL 所允许的最大索引全文索引 (opens new window)文本字段上的普通索引只能加快对出现字段内容最前面的字符串（也就是字段内容开头的字符）进行检索操作。如果字段里存放的是由几个、甚至是多个单词构成的较大段文字，普通索引就没什么作用了。这种检索往往以的形式出现，这对 MySQL 来说很复杂，如果需要处理的数据量很大，响应时间就会很长。

这类场合正是全文索引（full-textindex）可以大显身手的地方。在生成这种类型的索引时，MySQL 将把在文本中出现的所有单词创建为一份清单，查询操作将根据这份清单去检索有关的数据记录。全文索引即可以随数据表一同创建，也可以等日后有必要时再使用下面这条命令添加：

ALTER TABLE tablename ADD FULLTEXT（column1，column2）有了全文索引，就可以用 SELECT 查询命令去检索那些包含着一个或多个给定单词的数据记录了。下面是这类查询命令的基本语法：

SELECT * FROM tablename

WHERE MATCH (column1,column2) AGAINST('word1','word2','word3')

上面这条命令将把 column1 和 column2 字段里有 word1、word2 和 word3 的数据记录全部查询出来。

注解：InnoDB 数据表不支持全文索引。

# 查询和索引

只有当数据库里已经有了足够多的测试数据时，它的性能测试结果才有实际参考价值。如果在测试数据库里只有几百条数据记录，它们往往在执行完第一条查询命令之后就被全部加载到内存里，这将使后续的查询命令都执行得非常快--不管有没有使用索引。只有当数据库里的记录超过了 1000 条、数据总量也超过了 MySQL 服务器上的内存总量时，数据库的性能测试结果才有意义。

在不确定应该在哪些数据列上创建索引的时候，人们从 EXPLAIN SELECT 命令那里往往可以获得一些帮助。这其实只是简单地给一条普通的 SELECT 命令加一个 EXPLAIN 关键字作为前缀而已。有了这个关键字，MySQL 将不是去执行那条 SELECT 命令，而是去对它进行分析。MySQL 将以表格的形式把查询的执行过程和用到的索引等信息列出来。

在 EXPLAIN 命令的输出结果里，第1列是从数据库读取的数据表的名字，它们按被读取的先后顺序排列。type列指定了本数据表与其它数据表之间的关联关系（JOIN）。在各种类型的关联关系当中，效率最高的是 system，然后依次是 const、eq_ref、ref、range、index 和 All（All 的意思是：对应于上一级数据表里的每一条记录，这个数据表里的所有记录都必须被读取一遍——这种情况往往可以用一索引来避免）。

possible_keys 数据列给出了 MySQL 在搜索数据记录时可选用的各个索引。key 数据列是 MySQL 实际选用的索引，这个索引按字节 (opens new window)计算的长度在 key_len 数据列里给出。比如说，对于一个 INTEGER 数据列的索引，这个字节长度将是4。如果用到了复合索引，在 key_len 数据列里还可以看到 MySQL 具体使用了它的哪些部分。作为一般规律，key_len 数据列里的值越小越好。

ref 数据列给出了关联关系中另一个数据表里的数据列的名字。row 数据列是 MySQL 在执行这个查询时预计会从这个数据表里读出的数据行的个数。row 数据列里的所有数字的乘积可以大致了解这个查询需要处理多少组合。

最后，extra 数据列提供了与 JOIN 操作有关的更多信息，比如说，如果 MySQL 在执行这个查询时必须创建一个临时数据表，就会在 extra 列看到 usingtemporary 字样。