本文介绍Mysql数据库和InnoDB存储引擎表的各种类型文件
构成MySQL数据库和InnoDB存储引擎表的各种类型文件,组要有以下文件
- 参数文件: 告诉MySQL实例启动时在哪里可以找到,数据库文件,并且指定某些初始化参数,这些参数定义了某种内存结构的大小等设置
- 日志文件: 用来记录MySQL实例对某种条件做出响应时写入的文件,如错误日志文件、二进制日志文件、慢查询日志文件、查询日志文件等
- socket文件: 当UNIX域套接字方式进行连接时需要的文件
- pid文件: MySQL实例的进程ID文件
- MySQL表结构文件: 用来存放MySQL表结构定义文件
- 存储引擎文件: 因为MySQL表存储引擎的关系,每个存储引擎都会有自己的文件来保存各种数据.这些存储引擎真正存储了记录和索引等数据
1 参数文件
当MySQL示例启动时,数据库会先去读一个配置参数文件,用来寻找数据库的各种文件所在位置以及指定某些初始化参数,这些参数通常定义了某种内存结构有多大等。在默认情况下,MySQL实例会按照一定的顺序在指定的位置进行读取,可以通过命令mysql --help | grep my.cnf
来寻找。
如果启动时没有找到参数文件,这时所有的参数值取决于编译MySQL时指定的默认值和源代码中指定参数的默认值。(Oracle数据库启动时,如果找不到参数文件,是不能进行装载操作的。)
可以通过show variables like 'innodb_buffer%'
命令查看数据库所有参数,也可以通过查看information_schema架构下的GLOBAL_VARIABLES视图进行查找(不建议)。
参数类型分为动态参数和静态参数,动态参数可以在MySQL实例运行中进行更改,静态参数不能更改。可以通过SET | [global | session] system_var_name = expr | [@@global. | @@session. | @@] system_var_name = expr
2 日志文件
日志文件记录了影响MySQL数据库的各种类型活动,包括:
- 错误日志
- 二进制日志
- 慢查询日志
- 查询日志
2.1 错误日志
对MySQL的启动、运行、关闭过程进行了记录。文件不仅记录了所有的错误信息,也记录一些警告信息或正确的信息。用户可以通过命令show variables like 'log_error'
定位该文件。
2.2 慢查询日志(slow log)
慢查询日志可以帮助DBA定位可能存在问题的SQL语句,从而进行SQL语句层面的优化。例如,可以在MySQL启动时设置一个阈值,将运行时间超过该值得所有SQL语句都记录到慢查询日志文件中。通过参数long_query_time来设置,默认值为10,代表10秒。
默认情况下,MySQL数据库不启用慢查询日志,可以通过参数slow_query_log设置。
log-slow-queries:旧版(5.6以下版本)MySQL数据库慢查询日志存储路径。可以不设置该参数,系统则会默认给一个缺省的文件host_name-slow.log。slow-query-log-file:新版(5.6及以上版本)MySQL数据库慢查询日志存储路径。可以不设置该参数,系统则会默认给一个缺省的文件host_name-slow.log
另外一个和慢查询日志有关的参数是log-queries-not-using-indexes,如果运行的SQL没有使用索引,则MySQL数据库同样会将SQL语句记录到慢查询日志文件。
可用该命令查看:show variables like ‘log_queries_not_using_indexes’;
log_throttle_queries_not_using_indexs,用来表示每分钟允许记录到show log的且未使用索引的SQL语句次数。该值默认为0,表示没有限制。(这几个参数在MySQL官方文档没有找到!!!)
MySQL提供的mysqldumpslow命令可以直观的查看慢查询日志的内容。
从MySQL 5.1开始慢查询支持将记录放入mysql架构下的slow_log表。参数log_output指定了慢查询输出的格式,默认为FILE,可以将它设置为TABLE,就可以查询slow_log表了。
2.3 查询日志
查询日志记录了所有对MySQL数据库请求的信息,无论这些请求是否正确执行。默认文件名为:主机名.log。查询日志从MySQL 5.1开始也支持放入mysql架构下的general_log表中。
2.4 二进制日志
二进制日志记录了对MySQL数据库执行更改的所有操作,但是不包括select和show这里操作,因为这类操作对数据库本身没有修改。然而,若操作本身没有导致数据库发生变化,那么该操作可能也会写入二进制日志。
二进制日志的几个作用:
- 恢复:某些数据的恢复需要二进制日志,例如,在一个数据库全备份文件恢复后,用户可以通过二进制日志进行point_in_time的恢复。
- 复制:通过复制和执行二进制日志使一台运行的MySQL数据库与一台MySQL数据库进行实时同步。
- 审计:用户可以通过二进制日志中的信息来进行审计,判断是否对数据库进行注入的攻击。
可以通过参数binlog_format配置二进制存储的格式。在使用恢复和复制同步时,有不同的效果。
当使用事务的表存储引擎时,所有未提交的二进制日志会被记录到一个缓存中去,等该事务提交时直接将缓冲中的二进制日志写入二进制日志文件,而该缓冲区的大小由binlog_cache_size决定,默认大小为32k。binlog_cache_size是基于会话的。在默认情况下,二进制日志并不是在每次写的时候同步到磁盘。因此,当数据库所在操作系统发生宕机时可能会有最后一部分数据没有写入二进制日志文件中。sync_binlog=1表示采用同步写磁盘的方式来写二进制日志,这时写操作不使用操作系统的缓冲来写二进制日志
3 套接字文件
在unix系统下本地连接MySQL可以采用UNIX域套接字方式,这种方式需要一个套接字(socket)文件。套接字文件可由参数socket控制。一般在/tmp目录下名为mysql.sock
4 pid文件
但MySQL实例启动时,会将自己的进程ID写入一个文件中——该文件即为pid文件。由参数pid_file控制。
5 表结构定义文件
因为MySQL插件式存储引擎的体系结构的关系,MySQL数据的存储时根据表进行的,每个表都会有与之对应的文件。但是不论采用何种存储引擎,MySQL都有一个以frm为后缀名的文件,这个文件记录了该表的表结构定义,还用来记录视图的定义。
6 InnoDB 存储引擎文件
与InnoDB存储引擎密切相关的文件包括重做日志文件、表空间文件
6.1 表空间文件
InnoDB采用将存储的数据按表空间进行存放的设计。在默认配置下会有一个初始化大小为10MB,名为ibdata1的文件。该文件就是默认的表空间文件(共享表空间),可以通过参数innodb_data_file_path设置。如
1 | [mysqld] |
这里将/db/ibdata1和/dr2/db/ibdata2两个文件组成表空间。大小为2000,可以自动增长(autoextend)。
设置innodb_data_file_path参数后,所有基于InnoDB存储引擎的表的数据都会记录到该共享表空间中。若设置参数innodb_file_per_table,则用户可以将每个基于InnoDB存储引擎的表产生一个独立表空间。独立表空间的命名规则为:表名.idb。
需要注意:独立的表空间文件仅存储该表的数据,索引和插入缓冲BITMAP等信息,其余信息还是存放在默认表空间中。
6.2 重做日志文件
在默认情况下,在InnoDB存储引擎的数据目录下会有两个名为ib_logfile0和ib_logfile1的文件。每个InnoDB存储引擎至少有1个重做日志文件组,每个文件组下至少有2个重做日志文件。
影响重做日志文件的属性:
- innodb_log_file_size:指定每个重做日志文件的大小。在InnoDB 1.2.x版本之前不得大于等于4GB,在InnoDB 1.2.x之后扩大为512GB。
- innodb_log_files_in_group:指定了日志文件组中重做日志文件的数量,默认为2。
- innodb_mirrored_log_groups:指定了日志镜像文件组的数量,默认为1,表示只有一个文件组,没有镜像。
- innodb_log_group_home_dir:指定了日志文件所在路径,默认为./,表示在MySQL数据库的数据目录下。