Mysql - 运维篇

1. 日志

1.1 错误日志

错误日志是 MySQL 中最重要的日志之一,它记录了当 mysqld 启动和停止时,以及服务器在运行过程中发生任何严重错误时的相关信息。当数据库出现任何故障导致无法正常使用时,建议首先查看此日志。

该日志是默认开启的,默认存放目录 /var/log/,默认的日志文件名为 mysqld.log 。查看日志位置:

show variables like '%log_error%';
Variable_name Value
binlog_error_action ABORT_SERVER
log_error /var/log/mysqld.log
log_error_services log_filter_internal; log_sink_internal
log_error_suppression_list
log_error_verbosity 2

错误日志

手动报错:

# 新窗口实时监测
tail -f /var/log/mysqld.log

# 原窗口修改mysql配置
vim /var/lib/mysql/auto.cnf

# 修改 server-uuid ,去掉一位
[auto]
server-uuid=b4b04363-4f8f-11ee-bc84-fa163e48a1f6

# 重启mysqld, 发生报错
systemctl restart mysqld

# Job for mysqld.service failed because the control process exited with error code. See "systemctl status mysqld.service" and "journalctl -xe" for details.

# 记得恢复回去

手动报错

 

1.2 二进制日志

1.2.1介绍

二进制日志(BINLOG)记录了所有的 DDL(数据定义语言)语句和 DML(数据操纵语言)语句,但不包括数据查询SELECTSHOW)语句。

作用:
①. 灾难时的数据恢复;
②. MySQL主从复制

MySQL8版本中,默认二进制日志是开启着的,涉及到的参数如下:

show variables like '%log_bin%';
Variable_name Value
log_bin ON
log_bin_basename /var/lib/mysql/binlogbinglog是前缀)
log_bin_index /var/lib/mysql/binlog.index
log_bin_trust_function_creators OFF
log_bin_use_v1_row_events OFF
sql_log_bin ON

参数说明:

  • log_bin_basename:当前数据库服务器的 binlog 日志的基础名称(前缀),具体的 binlog 文件名需要再该 basename 的基础上加上编号(编号从000001开始)。
  • log_bin_index:binlog的索引文件,里面记录了当前服务器关联的 binlog 文件有哪些。

binlog

 

1.2.2 格式

MySQL 服务器中提供了多种格式来记录二进制日志,具体格式及特点如下:

日志格式 含义
STATEMENT 基于 SQL 语句的日志记录,记录的是 SQL 语句,对数据进行修改的SQL 都会记录在日志文件中。
ROW 基于行的日志记录,记录的是每一行的数据变更。(默认)
MIXED 混合了 STATEMENTROW 两种格式,默认采用 STATEMENT,在某些特殊情况下会自动切换为 ROW 进行记录。
show variables like '%binlog_format%';
Variable_name Value
binlog_format ROW

如果我们需要配置二进制日志的格式,只需要在 /etc/my.cnf 中配置 binlog_format 参数即可。

 

1.2.3 查看

由于日志是以二进制方式存储的,不能直接读取,需要通过二进制日志查询工具 mysqlbinlog 来查看,具体语法:

mysqlbinlog [ 参数选项 ] logfilename

# 参数选项: 
-d					# 指定数据库名称,只列出指定的数据库相关操作
-o					# 忽略掉日志中的前n行命令。
-v					# 将行事件(数据变更)重构为SQL语句
-vv					# 将行事件(数据变更)重构为SQL语句,并输出注释信息
# 修改表格里 前3行
update stu set age = 4 where id < 9;

查看日志:

mysqlbinlog -v binlog.000013 # 最后一个日志

binlog查看

 

修改日志格式:

vi /etc/my.cnf
# 手动添加:
binlog_format=STATEMENT
# 重启mysqld

修改数据,查看日志:

update stu set age = 5 where id < 9;

 

mysqlbinlog binlog.000014 # 日志格式变化,重新生成。(不用加 -v)

binlog1

 

1.2.4 删除

对于比较繁忙的业务系统,每天生成的 binlog 数据巨大,如果长时间不清除,将会占用大量磁盘空间。可以通过以下几种方式清理日志:

指令 含义
reset master 删除全部 binlog 日志,删除之后,日志编号,将从 binlog.000001 重新开始
purge master logs to 'binlog.*' 删除 * 编号之前的所有日志
purge master logs before 'yyyy-mm-dd hh24:mi:ss' 删除日志为 "yyyy-mm-dd hh24:mi:ss" 之前产生的所有日志
# 8之前的文件被删除 (在mysql命令行中执行)
purge master logs to 'binlog.000008';

# 删除全部
reset master; # 重新生成 000001

也可以在 mysql 的配置文件中配置二进制日志的过期时间,设置了之后,二进制日志过期会自动删除。

show variables like '%binlog_expire_logs_seconds%'; # 单位s, 默认30天
Variable_name Value
binlog_expire_logs_seconds 2592000

 

1.3 查询日志

查询日志中记录了客户端的所有操作语句,而二进制日志不包含查询数据的 SQL 语句。默认情况下,查询日志是未开启的。

show variables like '%general%';
Variable_name Value
general_log OFF
general_log_file /var/lib/mysql/george.log

 

如果需要开启查询日志,可以修改 MySQL 的配置文件 /etc/my.cnf 文件,添加如下内容:

# 该选项用来开启查询日志,可选值:0 或者 1;
# 0 代表关闭, 1 代表开启

general_log=1

# 设置日志的文件名,如果没有指定,默认的文件名为 host_name.log

general_log_file=/var/lib/mysql/mysql_query.log

开启了查询日志之后,在 MySQL 的数据存放目录,也就是 /var/lib/mysql/ 目录下就会出现 mysql_query.log 文件。之后所有的客户端的增删改查操作都会记录在该日志文件之中,长时间运行后,该日志文件将会非常大。

重启mysqld后:

Variable_name Value
general_log ON
general_log_file /var/lib/mysql/mysql_query.log

查询日志

 

1.4 慢查询日志

(见进阶篇 —— ###2.6.2 )

慢查询日志记录了所有执行时间超过参数 long_query_time 设置值并且扫描记录数不小于

min_examined_row_limit 的所有的 SQL 语句的日志,默认未开启。long_query_time 默认为 10 秒,最小为 0, 精度可以到微秒。

show variables like '%_query_%';
Variable_name Value
binlog_rows_query_log_events OFF
ft_query_expansion_limit 20
have_query_cache NO
long_query_time 2.000000
slow_query_log ON
slow_query_log_file /var/lib/mysql/mysql-slow.txt

如果需要开启慢查询日志,需要在 MySQL 的配置文件 /etc/my.cnf 中配置如下参数:

#慢查询日志
slow_query_log=1

#执行时间参数
long_query_time=2

 

默认情况下,不会记录管理语句,也不会记录不使用索引进行查找的查询。可以使用 log_slow_admin_statements 和 更改此行为 log_queries_not_using_indexes,如下所述。

#记录执行较慢的管理语句
log_slow_admin_statements = 1

#记录执行较慢的未使用索引的语句
log_queries_not_using_indexes = 1

上述所有的参数配置完成之后,都需要重新启动 MySQL 服务器才可以生效。

 

2. 主从复制

2.1 概述

主从复制是指将主数据库的 DDLDML 操作通过二进制日志传到从库服务器中,然后在从库上对这些日志重新执行(也叫重做),从而使得从库和主库的数据保持同步。

MySQL 支持一台主库同时向多台从库进行复制, 从库同时也可以作为其他从服务器的主库,实现链状复制。

主从复制

MySQL 复制的优点主要包含以下三个方面:

  • 主库出现问题,可以快速切换到从库提供服务。
  • 实现读写分离,降低主库的访问压力。
  • 可以在从库中执行备份,以避免备份期间影响主库服务。

 

2.2 原理

MySQL 主从复制的核心就是 二进制日志,具体的过程如下:

主从复制1

从上图来看,复制分成三步:

  1. Master 主库在事务提交时,会把数据变更记录在二进制日志文件 Binlog 中。
  2. 从库读取主库的二进制日志文件 Binlog ,写入到从库的中继日志 Relay Log
  3. slave 从库重做中继日志中的事件,将改变反映它自己的数据。

 

2.3 搭建

2.3.1 准备

主从配置

准备好两台服务器之后,在上述的两台服务器中分别安装好MySQL,并完成基础的初始化准备(安装、密码配置等操作)工作。 其中:

# 天翼云
192.168.1.86		# (119.96.241.99)   作为主服务器master
192.168.1.8			# (119.96.173.127)  作为从服务器slave

 

2.3.2 主库配置

(1)修改配置文件 /etc/my.cnf

# mysql 服务ID,保证整个集群环境中唯一,取值范围:1 – 232-1,默认为1

server-id=1

# 是否只读,1 代表只读, 0 代表读写

read-only=0

# 忽略的数据, 指不需要同步的数据库

# binlog-ignore-db=mysql

# 指定同步的数据库

# binlog-do-db=db01

 

(2)重启 MySQL 服务器

systemctl restart mysqld

 

(3)登录 mysql,创建远程连接的账号,并授予主从复制权限

# 创建 watson 用户,并设置密码,该用户可在任意主机连接该MySQL服务

create user 'watson'@'%' identified with mysql_native_password by 'Root@123456';


# 为 'watson'@'%' 用户分配主从复制权限

GRANT REPLICATION SLAVE ON *.* TO 'watson'@'%';

REPLICATION : 复制

 

(4)通过指令,查看二进制日志坐标

show master status ;

查看二进制日志坐标

字段含义说明:
file:从哪个日志文件开始推送日志文件
position:从哪个位置开始推送日志
binlog_ignore_db:指定不需要同步的数据库

 

2.3.3 从库配置

(1)修改配置文件 /etc/my.cnf

# mysql 服务ID,保证整个集群环境中唯一,取值范围:1 – 2^32-1,和主库不一样即可

server-id=2m

# 是否只读,1 代表只读, 0 代表读写

read-only=1

# super-read-only=1 (对超级管理员)

 

(2)重启 MySQL 服务器

systemctl restart mysqld

 

(3)登录 mysql,设置主库配置

CHANGE REPLICATION SOURCE TO SOURCE_HOST='192.168.1.86', SOURCE_USER='watson', SOURCE_PASSWORD='Root@123456', SOURCE_LOG_FILE='binlog.000003', SOURCE_LOG_POS=663;

上述是8.0.23中的语法。如果 mysql 是 8.0.23 之前的版本,执行如下SQL:

CHANGE MASTER TO MASTER_HOST='192.168.1.86', MASTER_USER='watson', MASTER_PASSWORD='Root@123456', MASTER_LOG_FILE='binlog.000003', MASTER_LOG_POS=663;
参数名 含义 8.0.23之前
SOURCE_HOST 主库IP地址 MASTER_HOST
SOURCE_USER 连接主库的用户名 MASTER_USER
SOURCE_PASSWORD 连接主库的密码 MASTER_PASSWORD
SOURCE_LOG_FILE binlog日志文件名 MASTER_LOG_FILE
SOURCE_LOG_POS binlog日志文件位置 MASTER_LOG_POS

 

(4)开启同步操作

start replica ; # 8.0.22之后

start slave ; # 8.0.22之前

 

(5)查看主从同步状态

show replica status ; #8.0.22之后

show slave status ;	#8.0.22之前

主从复制状态.webp

 

2.3.4 测试

(1)在主库 192.168.1.86 上创建数据库、表,并插入数据

create database db01;

use db01;

create table tb_user(
    id int(11) primary key not null auto_increment,
    name varchar(50) not null,
    sex varchar(1)
)engine=innodb default charset=utf8mb4;

insert into tb_user(id,name,sex) values(null,'Tom', '1'),(null,'Trigger','0'), (null,'Dawn','1');

 

(2)在从库 192.168.1.6 中查询数据,验证主从是否同步

从库同步

 

3. 分库分表

 

3.1 问题分析

分库分表1

随着互联网及移动互联网的发展,应用系统的数据量也是成指数式增长,若采用单数据库进行数据存储,存在以下性能瓶颈:

  1. IO瓶颈:热点数据太多,数据库缓存不足,产生大量磁盘IO,效率较低。 请求数据太多,带宽不够,网络IO瓶颈。
  2. CPU瓶颈:排序、分组、连接查询、聚合统计等 SQL 会耗费大量的CPU资源,请求数太多,CPU出现瓶颈。

 

为了解决上述问题,我们需要对数据库进行分库分表处理。

分库分表2

分库分表的中心思想都是将数据分散存储,使得单一数据库/表的数据量变小来缓解单一数据库的性能问题,从而达到提升数据库性能的目的。

 

3.2 拆分策略

分库分表的形式,主要是两种:垂直拆分和水平拆分。而拆分的粒度,一般又分为分库和分表,所以组成的拆分策略最终如下:

拆分策略

 

3.2.1 垂直拆分

(1)垂直分库

垂直分库

垂直分库:以为依据,根据业务将不同表拆分到不同库中。

特点:

  • 每个库的表结构都不一样。
  • 每个库的数据也不一样。
  • 所有库的并集是全量数据。
  • 业务对数据分级管理、维护、监控、扩展;
  • 在高并发下,提高磁盘IO和数据量连接数

 

(2)垂直分表

垂直分表

垂直分表:以字段为依据,根据字段属性将不同字段拆分到不同表中。

特点:

  • 每个表的结构都不一样。
  • 每个表的数据也不一样,一般通过一列(主键/外键)关联。
  • 所有表的并集是全量数据。
  • 冷热数据分离
  • 减少IO过渡争抢,两表互不影响

 

3.2.2 水平拆分

(1)水平分库

水平分库

水平分库:以字段为依据,按照一定策略,将一个库的数据拆分到多个库中。

特点:

  • 每个库的表结构都一样。
  • 每个库的数据都不一样。
  • 所有库的并集是全量数据。
  • 解决了单库大数量,高并发的性能瓶颈问题
  • 提高了系统的稳定性和可用性

 

(2)水平分表

水平分表

水平分表:以字段为依据,按照一定策略,将一个表的数据拆分到多个表中。

特点:

  • 每个表的表结构都一样。
  • 每个表的数据都不一样。
  • 所有表的并集是全量数据。
  • 优化单一表数据量过大而产生的性能问题
  • 避免IO争抢并减少锁表的几率;

 

在业务系统中,为了缓解磁盘IO及CPU的性能瓶颈,到底是垂直拆分,还是水平拆分;具体是分库,还是分表,都需要根据具体的业务需求具体分析。

 

3.3 实现技术

  • shardingJDBC:基于AOP原理,在应用程序中对本地执行的 SQL 进行拦截,解析、改写、路由处理。需要自行编码配置实现,只支持java语言,性能较高。
  • MyCat:数据库分库分表中间件,不用调整代码即可实现分库分表,支持多种语言,性能不及前者。

实现技术