MySql - 基础
1. 杂七杂八
名称 | 全称 | 简称 |
---|---|---|
SQL | 操作关系型数据库的编程语言,定义了一套操作关系型数据库统一标准 | Structured Query Language (SQL) |
快捷键最小语句执行:
1.0 注释
/* 多
行
注
释*/
-- XXXX 单行
# xxxxx 单行
1.1 连接
(1)服务启动停止
以管理员身份运行cmd,进入命令行执行如下指令:
net start mysql80
net stop mysql80
注意 : 上述的 mysql80 是我们在安装MySQL时,默认指定的mysql的系统服务名,不是固定的,如果未改动,默认就是mysql80。
(2)cmd连接
mysql [-h 127.0.0.1] [-P 3306] -u root -p
参数:
-h : MySQL服务所在的主机IP(默认可不写)
-P : MySQL服务端口号, 默认3306(默认可不写)
-u : MySQL数据库用户名
-p : MySQL数据库用户名对应的密码
[]
内为可选参数,如果需要连接远程的MySQL,需要加上这两个参数来指定远程主机IP、端口,如果连接本地的MySQL,则无需指定这两个参数。
使用这种方式进行连接时,需要安装完毕后配置PATH环境变量。
(3)Liunx版本
- 启动MySQL服务
systemctl start mysqld
systemctl restart mysqld
systemctl stop mysqld
- 查询自动生成的root用户密码
grep 'temporary password' /var/log/mysqld.log
# 如果使用默认密码登录不了,那么可以先关闭MySQL的登录密码校验
# 修改 /etc/my.cnf,在 [mysqld] 小节下添加一行:
skip-grant-tables=1
# 重启 mysqld 服务:
systemctl restart mysqld
这种情况下,不用密码就能登录,所以登录后先修改密码复杂度,然后再删掉改掉内容,才能修改密码。
- 修改root用户密码
登录到MySQL之后,需要将自动生成的不便记忆的密码修改了,修改成自己熟悉的便于记忆的密码。
ALTER USER 'root'@'localhost' IDENTIFIED BY 'YourPassword';
执行上述的SQL会报错,原因是因为设置的密码太简单,密码复杂度不够。我们可以设置密码的复杂度为简单类型,密码长度为4。
set global validate_password.policy = 0;
set global validate_password.length = 4;
降低密码的校验规则之后,再次执行上述修改密码的指令。
- 创建用户
默认的root用户只能当前节点localhost访问,是无法远程访问的,我们还需要创建一个root账户,用户远程访问
create user 'root'@'%' IDENTIFIED WITH mysql_native_password BY '1234';
- 并给root用户分配权限
grant all on *.* to 'root'@'%';
- 刷新权限
flush privileges;
- 忘记密码,以
linux
的mysql8.0
为例:
(1)修改MySQL的配置文件(默认为/etc/my.cnf
),在[mysqld]
下添加一行
skip-grant-tables
(2)保存配置文件后,重启MySQL服务
systemctl restart mysqld
(3)再次进入MySQL命令行
mysql -uroot -p
输入密码时直接回车,就会进入MySQL数据库了
(4)选择数据库:
use mysql
(5)使用 update
语句先清空 authentication_string
字段
update user set authentication_string='' where user='root';
(6)再输入 exit
退出 mysql
命令行,再按照步骤1中的流程,删掉配置文件中的那行,并且重启MySQL服务,然后再次进入MySQL命令行。
ALTER USER 'root'@'localhost' IDENTIFIED BY 'YourPassword';
提示:密码要8位及以上,有大小写,有特殊字符,否则不符合密码策略。
刷新MySQL的系统权限相关表,以防止更改后拒绝访问;
flush privileges;
1.2 数据模型
(1)关系型数据库(Relational Database Management System —— RDBMS)
概念:建立在关系模型基础上,由多张相互连接的二维表组成的数据库。
而所谓二维表,指的是由行和列组成的表,如下图(就类似于Excel表格数据,有表头、有列、有行,还可以通过一列关联另外一个表格中的某一列数据)。常见的MySQL、Oracle、DB2、 SQLServer
这些都是属于关系型数据库,里面都是基于二维表存储数据的。简单说,基于二维表存储数据的数据库就成为关系型数据库,不是基于二维表存储数据的数据库,就是非关系型数据库。
特点:
- 使用表存储数据,格式统一,便于维护。
- 使用SQL语言操作,标准统一,使用方便。
(2)数据模型
MySQL是关系型数据库,是基于二维表进行数据存储的,具体的结构图下:
- 可以通过MySQL客户端连接数据库管理系统DBMS,然后通过DBMS操作数据库。
- 可以使用SQL语句,通过数据库管理系统操作数据库,以及操作数据库中的表结构及数据。
- 一个数据库服务器中可以创建多个数据库,一个数据库中也可以包含多张表,而一张表中又可以包含多行记录。
1.3 SQL
全称 Structured Query Language,结构化查询语言。操作关系型数据库的编程语言,定义了一套操作关系型数据库统一标准 。
语法:
在学习具体的SQL语句之前,先来了解一下SQL语言的同于语法。
- SQL语句可以单行或多行书写,以分号结尾。
- SQL语句可以使用 空格/缩进 来增强语句的可读性。
- MySQL数据库的SQL语句不区分大小写,关键字建议使用大写。
- 注释:
- 单行注释:-- 注释内容 或 # 注释内容
- 多行注释:/* 注释内容 */
SQL分类:
SQL语句,根据其功能,主要分为四类:DDL、DML、DQL、DCL。
分类 | 全称 | 说明 |
---|---|---|
DDL | Data Definition Language | 数据定义语言,用来定义数据库对象(数据库,表,字段) |
DML | Data Manipulation Language | 数据操作语言,用来对数据库表中的数据进行增删改 |
DQL | Data Query Language | 数据查询语言,用来查询数据库中表的记录 |
DCL | Data Control Language | 数据控制语言,用来创建数据库用户、控制数据库的访问权限 |
CRUD
- 创建(Create)
- 查询(Retrive)
- 修改(Update)
- 删除(Delete)
1.4 DDL
1.4.1 数据库操作
- 查询所有数据库
show databases ;
- 查询当前数据库
select database();
- 创建数据库
create database [ if not exists ] 数据库名 [ default charset 字符集 ] [ collate 排序规则 ] ;
create database if not exists test03 default charset utf8mb4;
在同一个数据库服务器中,不能创建两个名称相同的数据库,否则将会报错。此时可以通过if not exists 参数来解决这个问题,数据库不存在, 则创建该数据库,如果存在,则不创建。
- 删除数据库
drop database [ if exists ] 数据库名 ;
如果删除一个不存在的数据库,将会报错。此时,可以加上参数 if exists ,如果数据库存在,再执行删除,否则不执行删除。
- 切换数据库
use 数据库名 ;
我们要操作某一个数据库下的表时,就需要通过该指令,切换到对应的数据库下,否则是不能操作的。
说明:上述语法中的database,也可以替换成 schema
1.4.2 表操作
- 查询当前数据库所有表(前提,已经切换use 数据库)
show tables;
- 查看指定表结构
desc 表名 ;
通过这条指令,我们可以查看到指定表的字段,字段的类型、是否可以为NULL,是否存在默认值等信息。
- 查看指定表的建表语句
show create table 表名 ;
通过这条指令,主要是用来查看建表语句的,而有部分参数我们在创建表的时候,并未指定也会查询到,因为这部分是数据库的默认值,如:存储引擎、字符集等。
- 创建表结构
create table 表名 (
字段1 字段1类型 [COMMENT 字段1注释],
字段2 字段2类型 [COMMENT 字段2注释],
字段3 字段3类型 [COMMENT 字段3注释],
......
字段n 字段4类型 [COMMENT 字段4注释]
) [COMMENT 表注释];
注意: [...] 内为可选参数,最后一个字段后面没有逗号
比如,我们创建一张表 tb_user ,对应的结构如下,那么建表语句为:
id | name | age | gender |
---|---|---|---|
1 | 乔治 | 17 | 男 |
2 | 华生 | 22 | 男 |
3 | 威廉 | 27 | 男 |
create table tb_user (
id int comment '编号',
name varchar(50) comment '姓名',
age int comment '年龄',
gender varchar(1) comment '性别'
) comment '用户表';
表操作:修改
- 添加字段 add
ALTER TABLE 表名 ADD 字段名 类型 (长度) [ COMMENT 注释 ] [ 约束 ];
alter table emp add salary int unsigned comment '薪水';
- 修改数据类型 modify
ALTER TABLE 表名 MODIFY 字段名 新数据类型 (长度);
alter table emp modify salary smallint unsigned comment '薪水1';
# 也能够用来 为已存在的表 添加字段
alter table emp modify id int primary key auto_increment comment 'ID';
- 修改字段名和字段类型 change
ALTER TABLE 表名 CHANGE 旧字段名 新字段名 类型 (长度) [ COMMENT 注释 ] [ 约束 ];
# 将 薪水 改为 地址
alter table emp change salary address varchar(60) comment '地址';
- 删除字段 drop
ALTER TABLE 表名 DROP 字段名;
alter table emp drop workno;
- 修改表名 rename to
ALTER TABLE 表名 RENAME TO 新表名;
# or
rename table 表名 to 新表名;
alter table emp rename to tb_emp;
- 删除表
DROP TABLE [ IF EXISTS ] 表名;
可选项
IF EXISTS
,只有表名存在时才会删除该表,表名不存在,则不执行删除操作(如果不加该参数项,删除一张不存在的表,执行将会报错)。
- 删除指定表, 并重新创建表
TRUNCATE TABLE 表名;
注意: 在删除表的时候,表中的全部数据也都会被删除。(表结构不变)
1.5 数据类型
MySQL中的数据类型有很多,主要分为三类:数值类型、字符串类型、日期时间类型。
1.5.1 数值类型
类型 | 大小 | 有符号(SIGNED)范围 | 无符号(UNSIGNED)范围 | 描述 |
---|---|---|---|---|
TINYINT | 1byte | (-128,127) | (0,255) | 小整数值 |
SMALLINT | 2bytes | (-32768,32767) | (0,65535) | 大整数值 |
MEDIUMINT | 3bytes | (-8388608,8388607) | (0,16777215) | 大整数值 |
INT/INTEGER | 4bytes | (-2147483648,2147483647) | (0,4294967295) | 大整数值 |
BIGINT | 8bytes | (-263,263-1) | (0,2^64-1) | 极大整数值 |
FLOAT | 4bytes | (-3.402823466 E+38,3.402823466351 E+38) | 0 和 (1.175494351 E-38,3.402823466 E+38) | 单精度浮点数值 |
DOUBLE | 8bytes | (-1.7976931348623157 E+308,1.7976931348623157 E+308) | 0 和 (2.2250738585072014 E-308,1.7976931348623157 E+308) | 双精度浮点数值 |
DECIMAL | 依赖于M(精度)和D(标度)的值 | 依赖于M(精度)和D(标度)的值 | 小数值(精确定点数)小数值(精确定点数) |
DECIMAL: 如
123.45
,精度为5,标度为2
# 年龄
# 不会出现负数, 而且人的年龄不会太大
age tinyint unsigned comment '年龄',
# 分数
# 总分100分, 最多出现一位小数
score double(4,1) comment '分数'
score double(总长度, 小数点后保留的位数)
1.5.2 字符串类型
类型 | 大小 | 描述 |
---|---|---|
CHAR | 0-255 bytes | 定长字符串 |
VARCHAR | 0-65535 bytes | 变长字符串 |
TINYBLOB | 0-255 bytes | 不超过255个字符的二进制数据 |
TINYTEXT | 0-255 bytes | 短文本字符串 |
BLOB | 0-65 535 bytes | 二进制形式的长文本数据 |
TEXT | 0-65 535 bytes | 长文本数据 |
MEDIUMBLOB | 0-16 777 215 bytes | 二进制形式的中等长度文本数据 |
MEDIUMTEXT | 0-16 777 215 bytes | 中等长度文本数据 |
LONGBLOB | 0-4 294 967 295 bytes | 二进制形式的极大文本数据 |
LONGTEXT | 0-4 294 967 295 bytes | 极大文本数据 |
char
与varchar
都可以描述字符串,char
是定长字符串,指定长度多长,就占用多少个字符,和字段值的长度无关 。而varchar
是变长字符串,指定的长度为最大占用长度 。相对来说,char
的性能会更高些。
# 用户名 username ------> 长度不定, 最长不会超过50
username varchar(50)
# 性别 gender ---------> 存储值, 不是男,就是女
gender char(1)
# 手机号 phone --------> 固定长度为11
phone char(11)
1.5.3 日期时间类型
类型 | 大小 | 范围 | 格式 | 描述 |
---|---|---|---|---|
DATE | 3 | 1000-01-01 至 9999-12-31 | YYYY-MM-DD | 日期值 |
TIME | 3 | -838:59:59 至 838:59:59 | HH:MM:SS | 时间值或持续时间 |
YEAR | 1 | 1901 至 2155 | YYYY | 年份值 |
DATETIME | 8 | 1000-01-01 00:00:00 至 9999-12-31 23:59:59 | YYYY-MM-DD HH:MM:SS | 混合日期和时间值 |
TIMESTAMP | 4 | 1970-01-01 00:00:01 至 2038-01-19 03:14:07 | YYYY-MM-DD HH:MM:SS | 混合日期和时间值,时间戳 |
# 生日字段
birthday date
# 创建时间 createtime
createtime datetime
1.5.4 示例
设计一张员工信息表,要求如下:
- 编号(纯数字)
- 员工工号 (字符串类型,长度不超过10位)
- 员工姓名(字符串类型,长度不超过10位)
- 性别(男/女,存储一个汉字)
- 年龄(正常人年龄,不可能存储负数)
- 身份证号(二代身份证号均为18位,身份证中有X这样的字符)
- 入职时间(取值年月日即可)
create table emp (
id int comment '编号',
workno varchar(10) comment '工号',
name varchar(10) comment '姓名',
gender char(1) comment '性别',
age tinyint unsigned comment '年龄',
idcard char(18) comment '身份证号',
entrydate date comment '入职时间'
) comment '员工表';
1.6 DML
DML英文全称是Data Manipulation Language(数据操作语言),用来对数据库中表的数据记录进行增、删、改操作。
- 添加数据(INSERT)
- 修改数据(UPDATE)
- 删除数据(DELETE)
1.6.0 跨库移动表
rename table 库名.表名 to 库名.表名;
rename table test04.tb_user_pro_1 to test03.tb_user_pro_1;
1.6.1 添加数据
- 给指定字段添加数据
INSERT INTO 表名 (字段名1, 字段名2, ...) VALUES (值1, 值2, ...);
insert into emp(id, workno, name, gender, age, idcard, entrydate)
values (1, '1001', '乔治', '男', 22, '123456789012345678', '2023-11-11');
- 给全部字段添加数据
insert into emp
values (3, '1003', '威廉', '男', 25, '111222333444555666', '2023-12-11');
- 批量添加数据
INSERT INTO 表名 (字段名1, 字段名2, ...) VALUES (值1, 值2, ...), (值1, 值2, ...), (值1, 值2, ...) ;
INSERT INTO 表名 VALUES (值1, 值2, ...), (值1, 值2, ...), (值1, 值2, ...) ;
# 示例
insert into emp
values (4, '1004', 'Linux', '女', 18, '666555499933222111', '2000-11-12'),
(5, '1005', 'kaguya', '女', 19, '666555444333222111', '2009-11-12'),
(6, '1006', 'chika', '女', 20, '666555466633222111', '2010-11-12'),
(7, '1007', 'miyuki', '男', 19, '666555447773222111', '2020-11-12'),
(8, '1008', 'aqua', '男', 20, '666555444883222111', '2030-11-12');
- 插入数据时,指定的字段顺序需要与值的顺序是一一对应的。
- 字符串和日期型数据应该包含在引号中。
- 插入的数据大小,应该在字段的规定范围内。
1.6.2 修改数据
修改数据的具体语法为:
UPDATE 表名 SET 字段名1 = 值1 , 字段名2 = 值2 , .... [ WHERE 条件 ] ;
# 按字段修改
update emp set name = 'Ruby' where workno = '1004';
update emp set name = 'Akane', age = 20 where name = 'chika';
# 全部修改
update emp set entrydate = '2023-12-26';
# 修改某一列数据 为 另一列数据的两倍
update account set account.sum = (money * 2);
修改语句的条件可以有,也可以没有,如果没有条件,则会修改整张表的所有数据。
1.6.3 删除数据
删除数据的具体语法为:
DELETE FROM 表名 [ WHERE 条件 ] ;
# 删除单个
delete from emp where workno = '1008';
# 删除全部
delete from emp;
- DELETE 语句的条件可以有,也可以没有,如果没有条件,则会删除整张表的所有数据。
- DELETE 语句不能删除某一个字段的值(可以使用
UPDATE
,将该字段值置为NULL
即可)。update emp set name = null where workno = '1008';
当进行删除全部数据操作时,datagrip会提示我们,询问是否确认删除,我们直接点击
Execute
即可。
1.7 DQL
DQL英文全称是Data Query Language(数据查询语言),数据查询语言,用来查询数据库中表的记录。
select
字段列表
from
表名列表
where
条件列表
group by
分组字段列表
having
分组后条件列表
order by
排序字段列表
limit
分页参数
- 基本查询(不带任何条件)
- 条件查询(WHERE)
- 聚合函数(count、max、min、avg、sum)
- 分组查询(group by)
- 排序查询(order by)
- 分页查询(limit)
1.7.1 基础查询
- 查询多个字段
SELECT 字段1, 字段2, 字段3 ... FROM 表名 ;
SELECT * FROM 表名 ;
注意 : * 号代表查询所有字段,在实际开发中尽量少用(不直观、影响效率)。
- 字段设置别名
SELECT 字段1 [ AS 别名1 ] , 字段2 [ AS 别名2 ] ... FROM 表名;
SELECT 字段1 [ 别名1 ] , 字段2 [ 别名2 ] ... FROM 表名;
# 示例
select name as '姓名' from emp;
select name '姓名' from emp;
- 去除重复记录
SELECT DISTINCT 字段列表 FROM 表名;
select distinct workaddress '工作地址' from emp;
1.7.2 条件查询
SELECT 字段列表 FROM 表名 WHERE 条件列表 ;
常用的比较运算符如下:
比较运算符 | 功能 |
---|---|
> | 大于 |
>= | 大于等于 |
< | 小于 |
<= | 小于等于 |
= | 等于 |
<> 或 != | 不等于 |
BETWEEN ... AND ... | 在某个范围之内(含最小、最大值) |
IN(...) | 在in之后的列表中的值,多选一 |
LIKE 占位符 | 模糊匹配 ( _ 匹配单个字符, % 匹配任意个字符 ) |
IS NULL | 是NULL |
注意:查询为NULL的数据时,不能使用
= null
常用的逻辑运算符如下:
逻辑运算符 | 功能 |
---|---|
AND 或 && | 并且(多个条件同时成立) |
OR 或 || | 或者(多个条件任意一个成立) |
NOT 或 ! | 非,不是 |
示例:
# 查询没有身份证号的员工信息
select * from emp where idcard is null; # 不能用 ‘ = ’
# 查询有身份证号的员工信息
select * from emp where idcard is not null;
# 查询年龄在15岁(包含) 到 20岁(包含)之间的员工信息
select * from emp where age >= 15 and age <= 20; # 个人推荐 and
select * from emp where age >= 15 && age <= 20;
select * from emp where age between 15 and 20;
# 查询年龄等于18 或 20 或 40 的员工信息
select * from emp where age in(18, 20, 40);
select * from emp where age = 20 || age = 18 || age = 40;
# 查询姓名为两个字的员工信息
select * from emp where name like '__';
# 查询身份证号最后一位是X的员工信息
select * from emp where idcard like '%X';
select * from emp where idcard like '_________________X';
# 查询性别为 男 ,并且年龄在 20-40 岁(含)以内的姓名为三个字的员工。(建议加括号)
select * from emp where gender = '男' and (age between 20 and 40) and name like '___';
1.7.3 聚合函数
将一列数据作为一个整体,进行纵向计算 。
- 常见的聚合函数
函数 | 功能 |
---|---|
count | 统计数量 |
max | 最大值 |
min | 最小值 |
avg | 平均值 |
sum | 求和 |
count :按照列去统计有多少行数据。
- 在根据指定的列统计的时候,如果这一列中有
null
的行,该行不会被统计在其中。sum :计算指定列的数值和,如果不是数值类型,那么计算结果为
null
max :计算指定列的最大值
min :计算指定列的最小值
avg :计算指定列的平均
- 语法
SELECT 聚合函数(字段列表) FROM 表名 ;
注意 :
NULL
值是不参与所有聚合函数运算的。
# 插入一条全null数值,总数会+1
select count(*) from emp; # +1
select count(1) from emp; # +1
示例:
# 统计该企业员工数量
select count(*) from emp; -- 统计的是总记录数
# 统计的是idcard字段不为null的记录数
select count(idcard) from emp;
# 统计西安地区员工的年龄之和
select sum(age) from emp where workaddress = '西安';
对于count聚合函数,统计符合条件的总记录数,还可以通过 count(数字/字符串) 的形式进行统计查询,比如:
select count(1) from emp;
1.7.4 分组查询
- 语法
SELECT 字段列表 FROM 表名 [ WHERE 条件 ] GROUP BY 分组字段名 [ HAVING 分组后过滤条件 ];
where
与having
区别- 执行时机不同:
where
是分组之前进行过滤,不满足where
条件,不参与分组;而having
是分组之后对结果进行过滤。 - 判断条件不同:
where
不能对聚合函数进行判断(where条件里不能有聚合函数),而having
可以。
- 执行时机不同:
注意事项:
- 分组之后,查询的字段一般为聚合函数和分组字段,查询其他字段无任何意义。
- 执行顺序:
where
> 聚合函数 >having
。- 支持多字段分组,具体语法为 :
group by columnA, columnB
示例:
# 根据性别分组 , 统计男性员工 和 女性员工的数量
select gender, count(*) from emp group by gender;
# 查询年龄小于45的员工 , 并根据工作地址分组 , 获取员工数量大于等于3的工作地址
select workaddress, count(*) address_count from emp where age < 45 group by workaddress having address_count >= 3;
# 统计各个工作地址上班的男性及女性员工的数量
select workaddress '工作地址' , gender, count(*) '数量' from emp group by workaddress, gender;
1.7.5 排序查询
- 语法:
SELECT 字段列表 FROM 表名 ORDER BY 字段1 排序方式1 , 字段2 排序方式2 ;
- 排序方式:
- ASC:升序(默认值)
- DESC:降序
注意事项:
- 如果是升序,可以不指定排序方式ASC;
- 如果是多字段排序,当第一个字段值相同时,才会根据第二个字段进行排序 ;
# 甚至可以用 两列数据的计算结果值 来排序
select * from account order by (money/loyalty1);
1.7.6 分页查询
- 语法
SELECT 字段列表 FROM 表名 LIMIT 起始索引, 查询记录数 ;
注意事项:
- 起始索引从0开始,起始索引 = (查询页码 - 1)* 每页显示记录数。
- 分页查询是数据库的方言,不同的数据库有不同的实现,MySQL中是LIMIT
- 如果查询的是第一页数据,起始索引可以省略,直接简写为 limit 10。
示例:
# 查询第1页员工数据, 每页展示10条记录
select * from emp limit 10;
select * from emp limit 0, 10;
# 查询第2页员工数据, 每页展示10条记录 --------> (页码-1)*页展示记录数
select * from emp limit 10, 10;
# 查询性别为男,且年龄在20-40 岁(含)以内的前5个员工信息,对查询的结果按年龄升序排序,年龄相同按入职时间升序排序。
select * from emp where gender = '男' and (age between 20 and 40) order by age, entrydate desc limit 5;
1.7.7 执行顺序
验证:
- 查询年龄大于15的员工姓名、年龄,并根据年龄进行升序排序。
select name , age from emp where age > 15 order by age asc;
- 在查询时,我们给emp表起一个别名 e,然后在select 及 where中使用该别名。
select e.name , e.age from emp e where e.age > 15 order by age asc;
执行上述SQL语句后,我们看到依然可以正常的查询到结果,此时就说明:
from
先执行, 然后where
和select
执行。那where
和select
到底哪个先执行呢?
# 报错 Unable to resolve column 'eage'
select e.name ename, e.age eage from emp e where eage > 15 order by age;
由此我们可以得出结论:
from
先执行,然后执行where
, 再执行select
。此时,此时我们可以给
select
后面的字段起别名,然后在where
中使用这个别名,然后看看是否可以执行成功。
select e.name ename , e.age eage from emp e where e.age > 15 order by eage asc;
结果执行成功。 那么也就验证了:
order by
是在select
语句之后执行的。
综上所述,我们可以看到DQL语句的执行顺序为: from ... where ... group by ... having ... select ... order by ... limit ...
1.8 DCL
- DCL 英文全称是Data Control Language(数据控制语言),用来管理数据库用户、控制数据库的访问权限。
1.8.1 管理用户
- 查询用户
select * from mysql.user;
localhost_user:
huawei_cloud:
其中 Host
代表当前用户访问的主机, 如果为 localhost
, 仅代表只能够在当前本机访问,是不可以远程访问的。 User
代表的是访问该数据库的用户名。在 MySQL
中需要通过 Host
和 User
来唯一标识一个用户。
- 创建用户
CREATE USER '用户名'@'主机名' IDENTIFIED BY '密码';
# 指定ip远程访问
create user 'George'@'120.229.250.95' identified by 'hello123';
# 120.258.下iP都可访问
create user 'George'@'120.258.%' identified by 'hello111';
# 可以在任意主机访问
create user 'Watson'@'%' identified by 'hello123';
# 只能在当前主机localhost访问,远程无法访问云数据库
create user 'Darcy'@'localhost' identified by 'hello123';
- 修改用户密码
ALTER USER '用户名'@'主机名' IDENTIFIED WITH mysql_native_password BY '新密码';
# 实测,不加 with mysql_native_password 也行
alter user 'George'@'120.229.%' identified by 'GeorgeWatson';
alter user 'George'@'120.229.%' identified with mysql_native_password by 'temp1234';
- 删除用户
DROP USER '用户名'@'主机名' ;
drop user 'George'@'120.229.%';
注意事项:
- 在MySQL中需要通过用户名@主机名的方式,来唯一标识一个用户。
- 主机名可以使用 % 通配。
- 这类SQL开发人员操作的比较少,主要是DBA( Database Administrator 数据库管理员)使用。
1.8.2 权限控制
MySQL中定义了很多种权限,但是常用的就以下几种:
权限 | 说明 |
---|---|
ALL, ALL PRIVILEGES | 所有权限 |
SELECT | 查询数据 |
INSERT | 插入数据 |
UPDATE | 修改数据 |
DELETE | 删除数据 |
ALTER | 修改表 |
DROP | 删除数据库/表/视图 |
CREATE | 创建数据库/表 |
上述只是简单罗列了常见的几种权限描述,其他权限描述及含义,可以直接参考 官方文档。
- 查询权限
SHOW GRANTS FOR '用户名'@'主机名' ;
show grants for 'George'@'120.229.%';
root:
Grants for root@localhost | |
---|---|
1 | GRANT SELECT, INSERT, UPDATE, DELETE, CREATE, DROP, RELOAD, SHUTDOWN, PROCESS, FILE, REFERENCES, INDEX, ALTER, SHOW DATABASES, SUPER, CREATE TEMPORARY TABLES, LOCK TABLES, EXECUTE, REPLICATION SLAVE, REPLICATION CLIENT, CREATE VIEW, SHOW VIEW, CREATE ROUTINE, ALTER ROUTINE, CREATE USER, EVENT, TRIGGER, CREATE TABLESPACE, CREATE ROLE, DROP ROLE ON . TO `root`@`localhost` WITH GRANT OPTION |
2 | GRANT APPLICATION_PASSWORD_ADMIN,AUDIT_ABORT_EXEMPT,AUDIT_ADMIN,AUTHENTICATION_POLICY_ADMIN,BACKUP_ADMIN,BINLOG_ADMIN,BINLOG_ENCRYPTION_ADMIN,CLONE_ADMIN,CONNECTION_ADMIN,ENCRYPTION_KEY_ADMIN,FIREWALL_EXEMPT,FLUSH_OPTIMIZER_COSTS,FLUSH_STATUS,FLUSH_TABLES,FLUSH_USER_RESOURCES,GROUP_REPLICATION_ADMIN,GROUP_REPLICATION_STREAM,INNODB_REDO_LOG_ARCHIVE,INNODB_REDO_LOG_ENABLE,PASSWORDLESS_USER_ADMIN,PERSIST_RO_VARIABLES_ADMIN,REPLICATION_APPLIER,REPLICATION_SLAVE_ADMIN,RESOURCE_GROUP_ADMIN,RESOURCE_GROUP_USER,ROLE_ADMIN,SENSITIVE_VARIABLES_OBSERVER,SERVICE_CONNECTION_ADMIN,SESSION_VARIABLES_ADMIN,SET_USER_ID,SHOW_ROUTINE,SYSTEM_USER,SYSTEM_VARIABLES_ADMIN,TABLE_ENCRYPTION_ADMIN,XA_RECOVER_ADMIN ON . TO `root@ localhost` WITH GRANT OPTION |
3 | GRANT PROXY ON ``@`` TO `root@ localhost` WITH GRANT OPTION |
新创建的用户:
Grants for George@120.229.% | |
---|---|
1 | GRANT USAGE ON . TO `George`@`120.229.%` |
- 授予权限 To
GRANT 权限列表 ON 数据库名.表名 TO '用户名'@'主机名';
# 没用,只能看到该数据库,没法在库里建表
grant create on test04 to 'George'@'120.229.%';
# 可以建表
grant create on test04.* to 'George'@'120.229.%';
- 撤销权限 From
REVOKE 权限列表 ON 数据库名.表名 FROM '用户名'@'主机名';
# 一键清零,注意on后面的内容要与grant时一样
revoke all on test04.* from 'George'@'120.229.%';
# grand一张表,revoke all on 该数据库下.* 时:
# There is no such grant defined for user 'George' on host '120.229.%'
注意事项:
- 多个权限之间,使用逗号分隔
- 授权时, 数据库名和表名可以使用 * 进行通配,代表所有。
2. 函数
函数,是指一段可以直接被另一段程序调用的程序或代码。 也就意味着,这一段程序或代码在MySQL中已经给我们提供了,我们要做的就是在合适的业务场景调用对应的函数完成对应的业务需求即可。
函数使用场景:
- 在企业的OA或其他的人力系统中,经常会提供的有这样一个功能,每一个员工登录上来之后都能够看到当前员工入职的天数。 而在数据库中,存储的都是入职日期,如 2000-11-12,那如果快速计算出天数呢?
- 在做报表这类的业务需求中,我们要展示出学员的分数等级分布。而在数据库中,存储的是学生的分数值,如98/75,如何快速判定分数的等级呢?
MySQL中的函数主要分为以下四类:
- 字符串函数
- 数值函数
- 日期函数
- 流程函数。
2.1 字符串函数
MySQL中内置了很多字符串函数,常用的几个如下:
函数 | 功能 |
---|---|
CONCAT(S1,S2,...Sn) | 字符串拼接,将S1,S2,... Sn拼接成一个字符串 |
LOWER(str) | 将字符串str全部转为小写 |
UPPER(str) | 将字符串str全部转为大写 |
LPAD(str,n,pad) | 左填充,用字符串pad对str的左边进行填充,达到n个字符串长度 |
RPAD(str,n,pad) | 右填充,用字符串pad对str的右边进行填充,达到n个字符串长度 |
TRIM(str) | 去掉字符串头部和尾部的空格 |
SUBSTRING(str,start,len) | 返回从字符串str从start位置起的len个长度的字符串 索引从1开始 |
示例:
# concat : 字符串拼接
select concat('hello', ' mysql'); # hello mysql
# lower : 全部转小写
select lower('Hello World'); # hello world
# upper : 全部转大写
select upper('george'); # GEORGE
# lpad : 左填充
select lpad('好', 5, '不'); # 不不不不好
select lpad('好', 5, '非常'); # 非常非常好
select lpad('好', 6, '非常'); # 非常非常非好
# rpad : 右填充
select rpad('收益:10', 10, '0'); # 收益:1000000
# trim : 去除空格
select trim(' nihao woshi '); # nihao woshi
# substring : 截取子字符串
# ==== 索引从1开始 ====
select substring('0123456789', 2, 5); # 12345
select substring('Hello MySQL',1,5); # Hello
#================================================
# 将id变为五位数,不足的前面补0
alter table emp modify id varchar(5);
update emp set id = lpad(id, 5, '0');
2.2 数值函数
常见的数值函数如下:
函数 | 功能 |
---|---|
CEIL(x) | 向上取整 |
FLOOR(x) | 向下取整 |
MOD(x,y) | 返回x/y的模 |
RAND() | 返回0~1内的随机数 |
ROUND(x,y) | 求参数x的四舍五入的值,保留y位小数 |
示例:
# ceil:向上取整 (往大的方向)
select ceil(1.1); # 2
select ceil(-2.1); # -2
# floor:向下取整(往小的方向)
select floor(1.9); # 1
select floor(-2.9); # -3
# mod:取模
select mod(10, 3); # 1
select mod(-10, 3); # -1
select mod(6, 0); # null
select mod(0, 0); # null
select mod(0, 5); # null
# rand:返回0~1内的随机数
# rand(int seed)
# 如果指定种子seed,则会等到一个不变的随机数
select rand(); # 0.7926123727044205
select rand(5); # 0.40613597483014313
select rand(8); # 0.15668530311126755
# round:四舍五入
select round(1.5, 1); # 1.5
select round(1.5, 0); # 2
select round(1.95, 1); # 2.0
select round(-1.45, 1); # -1.5
select round(-9, 1); # -9
select round(9, 10); # 9
案例:
通过数据库的函数,生成一个六位数的随机验证码。
思路: 获取随机数可以通过
`rand()
函数,但是获取出来的随机数是在0-1之间的,所以可以在其基础上乘以1000000,然后舍弃小数部分,如果长度不足6位,补0
select lpad(round(rand() * 1000000, 0), 6, '0');
2.3 日期函数
常见的日期函数如下:
函数 | 功能 |
---|---|
CURDATE() | 返回当前日期 |
CURTIME() | 返回当前时间 |
NOW() | 返回当前日期和时间 |
YEAR(date) | 获取指定 date 的年份 |
MONTH(date) | 获取指定 date 的月份 |
DAY(date) | 获取指定 date 的日期 |
DATE_ADD(date, INTERVAL expr type) | 返回一个日期 / 时间值加上一个时间间隔 expr 后的时间值 |
DATEDIFF(date1,date2) | 返回起始时间 date1 和 结束时间 date2 之间的天数 |
示例:
# curdate:当前日期
select curdate(); # 2023-09-04
# curtime:当前时间 # 14:51:40
select curtime();
# now:当前日期和时间
select now(); # 2023-09-04 14:52:01
# YEAR , MONTH , DAY:当前年、月、日
select year(now()); # 2023
select month(now()); # 9
select day(now()); # 4
select hour(now()); # 14
select minute(now()); # 53
select second(now()); # 46
# date_add:增加指定的时间间隔
select date_add(now(), interval 70 year); # 2093-09-04 15:03:29
select date_add(now(), interval 2 year_month ); # 2023-11-04 15:05:13
select date_add(now(), interval 2 month ); # 2023-11-04 15:03:39
select date_add(now(), interval 20 day ); # 2023-09-24 15:03:48
select date_add(now(), interval 20 day_hour ); # 2023-09-05 11:05:32
# date_sub : 减少指定时间间隔
select date_sub(now(), interval 3 day); # 2023-09-01 15:13:37
# datediff:获取两个日期相差的天数
select datediff('2001-10-31', now()); # -7978
select datediff(now(), '2000-12-20'); # 8293
select datediff(now(), '2023-9-5'); # -1
# ===================================================
# 查询所有员工的入职天数,并根据入职天数倒序排序。
# 思路:入职天数,就是通过当前日期 - 入职日期,所以需要使用datediff函数来完成。
select name, entrydate, datediff(curdate(), entrydate) entrydays from emp order by entrydays desc ;
2.4 流程函数
流程函数也是很常用的一类函数,可以在SQL语句中实现条件筛选,从而提高语句的效率。
函数 | 功能 |
---|---|
IF(value , t , f) | 如果value为true,则返回t,否则返回f |
IFNULL(value1 , value2) | 如果value1不为空,返回value1,否则返回value2 |
CASE WHEN [ val1 ] THEN [res1] ... ELSE [ default ] END | 如果val1为true,返回res1,... 否则返回default默认值 |
CASE [ expr ] WHEN [ val1 ] THEN [res1] ... ELSE [ default ] END | 如果expr的值等于val1,返回res1,... 否则返回default默认值 |
# if
select if(year(now()) = 2023, 'value1', 'value2'); # value1
select if(year(now()) = 2024, 'value1', 'value2'); # value2
select if(false, 'value1', 'value2'); # value2
# ifnull
select ifnull('value1', 'value2'); # value1
select ifnull('', 'value2'); # ''
select ifnull(null, 'value2'); # value2
select ifnull((select idcard from emp where name = '周芷若'), 'value2'); # value2
# case when then else end
# 查询emp表的员工姓名和工作地址 (北京/上海 ----> 一线城市 , 其他 ----> 二线城市)
select name,
case
when workaddress in ('北京', '上海') then '一线城市'
when workaddress is null then '未填写城市'
# when ifnull(workaddress, true) then '未填写城市'
else '二线城市' end '城市星级',
workaddress
from emp;
# 不推荐
select name,
case workaddress
when '北京' then '一线城市'
when '上海' then '一线城市'
# when null then '未填写城市' # 此路不通
else '二线城市' end '城市星级',
workaddress
from emp;
# ====================================================
-- 案例: 统计班级各个学员的成绩,展示的规则如下:
-- >= 85,展示优秀
-- >= 60,展示及格
-- 否则,展示不及格
create table score
(
id int comment 'ID',
name varchar(20) comment '姓名',
math int comment '数学',
english int comment '英语',
chinese int comment '语文'
) comment '学员成绩表';
insert into score(id, name, math, english, chinese)
VALUES (1, 'Tom', 67, 88, 95),
(2, 'Rose', 23, 66, 90),
(3, 'Jack', 56, 98, 76);
select id,
name,
math,
(case when math >= 85 then '优秀' when math >= 60 then '及格' else '不及格' end) '数学等级',
english,
(case when english >= 85 then '优秀' when english >= 60 then '及格' else '不及格' end) '英语等级',
chinese,
(case when chinese >= 85 then '优秀' when chinese >= 60 then '及格' else '不及格' end) '语文等级'
from score;
3. 约束
3.1 概述
概念:约束是作用于表中字段上的规则,用于限制存储在表中的数据。
目的:保证数据库中数据的正确、有效性和完整性。
约束 | 描述 | 关键字 |
---|---|---|
非空约束 | 限制该字段的数据不能为null。字段'' 空,不属于null |
NOT NULL |
唯一约束 | 保证该字段的所有数据都是唯一、不重复的 | UNIQUE |
主键约束 | 主键是一行数据的唯一标识,要求非空且唯一 | PRIMARY KEY |
默认约束 | 保存数据时,如果未指定(不传入)该字段的值,则采用默认值(传入null,就是null) | DEFAULT |
检查约束(8.0.16版本之后) | 保证字段值满足某一个条件 | CHECK |
外键约束 | 用来让两张表的数据之间建立连接,保证数据的一致性和完整性 | FOREIGN KEY |
注意:约束是作用于表中字段上的,可以在创建表/修改表的时候添加约束。
通义千问:
在 MySQL 中,默认约束只能用于非 NULL 字段。 如果一个字段被声明为 NOT NULL 并且有一个 DEFAULT 值,那么当 INSERT 语句不给这个字段提供任何值的时候,就会使用这个 DEFAULT 值。 然而,如果你尝试在一个已经被声明为 NOT NULL 的字段上设置一个 NULL 默认值,你会得到一个错误。
所以如果你试图给一个允许 NULL 的字段设置一个 DEFAULT 值,并在 INSERT 语句中传入 NULL ,则默认值不会生效,最终存储的就是 NULL。
注意:默认约束只有在不给值时才会采用默认值。如果给了null,那值就是null值。
约束示例:
字段名 | 字段含义 | 字段类型s | 约束条件 | 约束关键字 |
---|---|---|---|---|
id | ID唯一标识 | int | 主键,并且自动增长 | PRIMARY KEY, AUTO_INCREMENT |
name | 姓名 | varchar(10) | 不为空,并且唯一 | NOT NULL , UNIQUE |
age | 年龄 | int | 大于0,并且小于等于120 | CHECK |
status | 状态 | char(1) | 如果没有指定该值,默认为1 | DEFAULT |
gender | 性别 | char(1) | 无 |
对应的建表语句为:
create table tb_user
(
id int primary key auto_increment comment 'ID唯一标识',
name varchar(10) not null unique comment '姓名',
age int check ( age > 0 and age <= 120 ) comment '年龄',
staus char(1) default '1' comment '状态',
gender char(1) comment '性别'
);
建表后添加约束:
-- 建完表后添加默认约束
ALTER TABLE 表名 ALTER 列名 SET DEFAULT 默认值;
-- 添加字段约束,也可用来【删除】约束
alter table user modify name varchar(10) unique;
-- 为性别字段添加约束
ALTER TABLE user MODIFY sex ENUM('男', '女') NOT NULL DEFAULT '男';
-- 添加非空约束 add constraint 名字 不加 ''
alter table user add constraint phone_unique unique (phone);
-- 删除
alter table user drop constraint phone_unique;
删除默认约束:
ALTER TABLE 表名 ALTER 列名 DROP DEFAULT;
alter table user alter sex drop default ;
请记住,在为现有表字段添加约束之前,请务必检查你的数据以确保它们满足新约束的要求。否则,可能会导致数据不一致或错误。
3.2 外键约束
外键:用来让两张表的数据之间建立连接,从而保证数据的一致性和完整性。
例子:
左侧的 emp
表是员工表,里面存储员工的基本信息,包含员工的ID、姓名、年龄、职位、薪资、入职日期、上级主管ID、部门ID,在员工的信息中存储的是部门的ID dept_id
,而这个部门的ID是关联的部门表 dept
的主键 id
,那 emp
表的 dept_id
就是外键,关联的是另一张表的主键。
注意:目前上述两张表,只是在逻辑上存在这样一层关系;在数据库层面,并(尚)未建立外键关联,所以是无法保证数据的一致性和完整性的。
语法:
- 添加外键
(被关联的两列数据 存在不一致时,可能无法添加外键)
(emp
表中存在某一 dept_id
,而父表 dept
中没有该 id
,此时插入失败)
# 建表时
CREATE TABLE 表名(
字段名 数据类型,
...
[CONSTRAINT] [外键名称] FOREIGN KEY (外键字段名) REFERENCES 主表 (主表列名)
);
# 添加 记得加括号
ALTER TABLE 表名 ADD CONSTRAINT 外键名称 FOREIGN KEY (外键字段名)
REFERENCES 主表 (主表列名) ;
示例:
外键名称不用加: ``
# 为emp表的 dept_id 字段添加外键约束,关联 dept 表的主键id。
alter table emp
add constraint fk_empId_deptId foreign key (dept_id) references dept (id);
# 创建时设置
create table temp_emp (
id int primary key auto_increment,
name varchar(10) not null,
dept_id int,
constraint fk_emp_dept_id foreign key (dept_id) references dept_temp(id)
);
# 运行完 show create table emp; 如下
Table | Create Table |
---|---|
emp | CREATE TABLE `emp` ( `id` int NOT NULL AUTO_INCREMENT COMMENT 'ID', `name` varchar(50) NOT NULL COMMENT '姓名', `age` int DEFAULT NULL COMMENT '年龄', `job` varchar(20) DEFAULT NULL COMMENT '职位', `salary` int DEFAULT NULL COMMENT '薪资', `entrydate` date DEFAULT NULL COMMENT '入职时间', `managerid` int DEFAULT NULL COMMENT '直属领导ID', `dept_id` int DEFAULT NULL COMMENT '部门ID', PRIMARY KEY (`id`), KEY `fk_empId_deptId` (`dept_id`), CONSTRAINT `fk_empId_deptId` FOREIGN KEY (`dept_id`) REFERENCES `dept` (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci COMMENT='员工表' |
- 删除外键
ALTER TABLE 表名 DROP FOREIGN KEY 外键名称;
alter table emp drop foreign key fk_empId_deptId;
删除 / 更新行为
添加了外键之后,再删除父表数据时产生的约束行为,我们就称为删除/更新行为。具体的删除/更新行为有以下几种:
行为 | 说明 |
---|---|
NO ACTION | 当在父表中删除/更新对应记录时,首先检查该记录是否有对应外键,如果有则不允许删除/更新。 (与 RESTRICT 一致) 默认行为 |
RESTRICT | 当在父表中删除/更新对应记录时,首先检查该记录是否有对应外键,如果有则不允许删除/更新。 (与 NO ACTION 一致) 默认行为 |
CASCADE | 当在父表中删除/更新对应记录时,首先检查该记录是否有对应外键,如果有,则也删除/更新外键在子表中的记录。 |
SET NULL | 当在父表中删除对应记录时,首先检查该记录是否有对应外键,如果有则设置子表中该外键值为null(这就要求该外键允许取null)。 |
SET DEFAULT | 父表有变更时,子表将外键列设置成一个默认的值 (Innodb不支持) |
具体语法为:
ALTER TABLE 表名 ADD CONSTRAINT 外键名称 FOREIGN KEY (外键字段) REFERENCES 主表名 (主表字段名) ON UPDATE CASCADE ON DELETE CASCADE;
alter table emp add constraint fk_emp_dept_id foreign key (dept_id) references dept(id) on update cascade on delete cascade ;
物理外键和逻辑外键
- 物理外键
- 概念:使用foreign key定义外键关联另外一张表。
- 缺点:
- 影响增、删、改的效率(需要检查外键关系)。
- 仅用于单节点数据库,不适用与分布式、集群场景。
- 容易引发数据库的死锁问题,消耗性能。
- 逻辑外键
- 概念:在业务层逻辑中,解决外键关联。
- 通过逻辑外键,就可以很方便的解决上述问题。
在现在的企业开发中,很少会使用物理外键,都是使用逻辑外键。 甚至在一些数据库开发规范中,会明确指出禁止使用物理外键 foreign key
4. 多表查询
4.1 多表关系
项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结构,由于业务之间相互关联,所以各个表结构之间也存在着各种联系,基本上分为三种:
- 一对一(多对一)
- 多对多
- 一对一
(1)一对多
- 案例:部门 与 员工的关系
- 关系:一个部门对应多个员工,一个员工对应一个部门
- 实现:在多的一方建立外键,指向【一】的一方的主键
(2)多对多
- 案例:学生 与 课程的关系
- 关系:一个学生可以选修多门课程,一门课程也可以供多个学生选择
- 实现:建立第三张中间表,中间表至少包含两个外键,分别关联两方主键
对应的SQL脚本:
create table student
(
id int auto_increment primary key comment '主键ID',
name varchar(10) comment '姓名',
no varchar(10) comment '学号'
) comment '学生表';
insert into student
values (null, '黛绮丝', '2000100101'),
(null, '谢逊', '2000100102'),
(null, '殷天正', '2000100103'),
(null, '韦一笑', '2000100104');
create table course
(
id int auto_increment primary key comment '主键ID',
name varchar(10) comment '课程名称'
) comment '课程表';
insert into course
values (null, 'Java'),
(null, 'PHP'),
(null, 'MySQL'),
(null, 'Hadoop');
create table student_course
(
id int auto_increment comment '主键' primary key,
studentid int not null comment '学生ID',
courseid int not null comment '课程ID',
constraint fk_courseid foreign key (courseid) references course (id),
constraint fk_studentid foreign key (studentid) references student (id)
) comment '学生课程中间表';
insert into student_course
values (null, 1, 1),
(null, 1, 2),
(null, 1, 3),
(null, 2, 2),
(null, 2, 3),
(null, 3, 4);
Datagrip查看中间表:
(3)一对一
一对一关系表在实际开发中应用起来比较简单,通常是用来做单表的拆分,也就是将一张大表拆分成两张小表,将大表中的一些基础字段放在一张表当中,将其他的字段放在另外一张表当中,以此来提高数据的操作效率。
如果在业务系统当中,对用户的基本信息查询频率特别的高,但是对于用户的身份信息查询频率很低,此时出于提高查询效率的考虑,我就可以将这张大表拆分成两张小表,第一张表存放的是用户的基本信息,而第二张表存放的就是用户的身份信息。他们两者之间一对一的关系,一个用户只能对应一个身份证,而一个身份证也只能关联一个用户。
- 案例:用户 与 用户详情的关系
- 关系:一对一关系,多用于单表拆分,将一张表的基础字段放在一张表中,其他详情字段放在另一张表中,以提升操作效率
- 实现:在任意一方加入外键,关联另外一方的主键,并且设置外键为唯一的(UNIQUE)
对应的SQL脚本:
create table tb_user(
id int auto_increment primary key comment '主键ID',
name varchar(10) comment '姓名',
age int comment '年龄',
gender char(1) comment '1: 男 , 2: 女',
phone char(11) comment '手机号'
) comment '用户基本信息表';
create table tb_user_edu(
id int auto_increment primary key comment '主键ID',
degree varchar(20) comment '学历',
major varchar(50) comment '专业',
primaryschool varchar(50) comment '小学',
middleschool varchar(50) comment '中学',
university varchar(50) comment '大学',
# unique
userid int unique comment '用户ID',
constraint fk_userid foreign key (userid) references tb_user(id)
) comment '用户教育信息表';
insert into tb_user(id, name, age, gender, phone) values
(null,'黄渤',45,'1','18800001111'),
(null,'冰冰',35,'2','18800002222'),
(null,'码云',55,'1','18800008888'),
(null,'李彦宏',50,'1','18800009999');
insert into tb_user_edu(id, degree, major, primaryschool, middleschool, university, userid) values
(null,'本科','舞蹈','静安区第一小学','静安区第一中学','北京舞蹈学院',1),
(null,'硕士','表演','朝阳区第一小学','朝阳区第一中学','北京电影学院',2),
(null,'本科','英语','杭州市第一小学','杭州市第一中学','杭州师范大学',3),
(null,'本科','应用数学','阳泉第一小学','阳泉区第一中学','清华大学',4);
4.2 多表查询
直接查询会造成笛卡尔积的结果:
select * from emp, dept;
笛卡尔积:笛卡尔乘积是指在数学中,两个集合A集合 和 B集合的所有组合情况。
加上连接查询的条件即可:
select * from emp, dept where emp.dept_id = dept.id;
而由于id为17的员工,没有dept_id字段值,所以在多表查询时,根据连接查询的条件并没有查询到。
分类:
- 连接查询
- 内连接:相当于查询A、B交集部分数据
- 外连接:
- 左外连接:查询左表所有数据,以及两张表交集部分数据
- 右外连接:查询右表所有数据,以及两张表交集部分数据
- 自连接:当前表与自身的连接查询,自连接必须使用表别名
- 子查询
4.3 内连接
内连接查询的是两张表交集部分的数据。(也就是绿色部分的数据)
内连接的语法分为两种:隐式内连接、显式内连接。先来学习一下具体的语法结构。
- 隐式内连接
SELECT 字段列表 FROM 表1 , 表2 WHERE 条件 ... ;
- 显式内连接
SELECT 字段列表 FROM 表1 [ INNER ] JOIN 表2 ON 连接条件 ... ;
示例:
# 查询每一个员工的姓名 , 及关联的部门的名称 (隐式内连接实现)
select emp.name, dept.name from emp, dept where emp.dept_id = dept.id;
-- 为每一张表起别名,简化SQL编写 (显式内连接实现)
select e.name, d.name from emp e inner join dept d on e.dept_id = d.id;
多表查询时给表起别名:
- tableA as 别名1 , tableB as 别名2 ;
- tableA 别名1 , tableB 别名2 ;
使用了别名的多表查询:
注意:
一旦为表起了别名,就不能再使用表名来指定对应的字段了,此时只能够使用别名来指定字段。
4.4 外连接
外连接分为两种,分别是:左外连接 和 右外连接。具体的语法结构为:
- 左外连接
SELECT 字段列表 FROM 表1 LEFT [ OUTER ] JOIN 表2 ON 条件 ... ;
左外连接相当于查询表1(左表)的所有数据,当然也包含表1和表2交集部分的数据。
- 右外连接
SELECT 字段列表 FROM 表1 RIGHT [ OUTER ] JOIN 表2 ON 条件 ... ;
右外连接相当于查询表2(右表)的所有数据,当然也包含表1和表2交集部分的数据。
左 还是 右 取决于 from
后面 table
的出现顺序
示例:
# 查询emp表的所有数据, 和对应的部门信息(对应不到的也要)
select e.*, d.name from emp e left join dept d on e.dept_id = d.id;
# 查询dept表的所有数据, 和对应的员工信息(右外连接)
# =============from emp e 【right → 】 join dept d
select d.* , e.* from emp e right join dept d on e.dept_id = d.id;
# 等价于
select d.*, e.* from dept d left join emp e on d.id = e.dept_id
注意事项:
左外连接和右外连接是可以相互替换的,只需要调整在连接查询时SQL中,表结构的先后顺序就可以了。而我们在日常开发使用时,更偏向于左外连接。
4.5 自连接
4.5.1 自连接查询
自连接查询,顾名思义,就是自己连接自己,也就是把一张表连接查询多次。
SELECT 字段列表 FROM 表A 别名A JOIN 表A 别名B ON 条件 ... ;
而对于自连接查询,可以是内连接查询,也可以是外连接查询。
# 查询员工 及其 所属领导的名字
select e1.name '员工姓名', e2.name '领导名字' from emp e1 join emp e2 on e1.managerid = e2.id;
# 对于mangerid为null的也能显示
select e1.name '员工姓名', e2.name '领导名字' from emp e1 left join emp e2 on e1.managerid = e2.id;
# or
select a.name , b.name from emp a , emp b where a.managerid = b.id;
注意事项:
在自连接查询中,必须要为表起别名,要不然我们不清楚所指定的条件、返回的字段,到底是哪一张表的字段。
4.5.2 联合查询
对于union查询,就是把多次查询的结果合并起来,形成一个新的查询结果集。
SELECT 字段列表 FROM 表A ...
UNION [ ALL ] # 加 all 不去重
SELECT 字段列表 FROM 表B ;
- 对于联合查询的多张表的列数必须保持一致,字段类型也需要保持一致。
- union all 会将全部的数据直接合并在一起(不去重),union 会对合并之后的数据去重。
示例:
# 将薪资低于 5000 的员工 , 和 年龄大于 50 岁的员工全部查询出来
# 当前对于这个需求,我们可以直接使用多条件查询,使用逻辑运算符 or 连接即可。
# 那这里呢,我们也可以通过union/union all来联合查询.
# 去重
select * from emp where salary < 5000
union
select * from emp where age > 50;
select * from emp where salary < 5000 or age > 50;
# 不去重
select * from emp where salary < 5000
union all
select * from emp where age > 50;
4.6 子查询
4.6.1 概述
SQL语句中嵌套SELECT语句,称为嵌套查询,又称子查询。
SELECT * FROM t1 WHERE column1 = ( SELECT column1 FROM t2 );
子查询外部的语句可以是INSERT / UPDATE / DELETE / SELECT 的任何一个。
分类:
根据子查询结果不同,分为:
- 标量子查询(子查询结果为单个值)
- 列子查询(子查询结果为一列)
- 行子查询(子查询结果为一行)
- 表子查询(子查询结果为多行多列)
根据子查询位置,分为:
- where 之后
- from 之后
- select 之后
4.6.2 标量子查询
子查询返回的结果是单个值(数字、字符串、日期等),最简单的形式,这种子查询称为标量子查询。常用的操作符:= <> > >= < <=
示例:
# 查询 "销售部" 的所有员工信息
# 完成这个需求时,我们可以将需求分解为两步:
# (1)查询 "销售部" 部门ID
select id from dept where name = '销售部';
# (2)根据 "销售部" 部门ID, 查询员工信息
select * from emp where dept_id = (select id from dept where name = '销售部');
# 查询在 "方东白" 入职之后的员工信息
select * from emp where entrydate > (select entrydate from emp where name = '方东白');
4.6.3 列子查询
子查询返回的结果是一列(可以是多行),这种子查询称为列子查询。
常用的操作符:IN 、NOT IN 、 ANY 、SOME 、 ALL
操作符 | 描述 |
---|---|
IN | 在指定的集合范围之内,多选一 |
NOT IN | 不在指定的集合范围之内 |
ANY | 子查询返回列表中,有任意一个满足即可 |
SOME | 与ANY等同,使用SOME的地方都可以使用ANY |
ALL | 子查询返回列表的所有值都必须满足 |
示例:
# in
# 查询 "销售部" 和 "市场部" 的所有员工信息
# 分解为以下两步:
# (1)查询 "销售部" 和 "市场部" 的部门ID
select id from dept where name in ('销售部', '市场部');
# (2)根据部门ID, 查询员工信息
select *
from emp
where dept_id in (select id from dept where name in ('销售部', '市场部'));
# all
# 查询比 财务部 所有人工资都高的员工信息
select * from emp where salary > all (select salary from emp, dept where dept_id = dept.id and dept.name = '财务部');
# 或者:
# (1)查询所有 财务部 人员工资
select id from dept where name = '财务部';
select salary from emp where dept_id = (select id from dept where name = '财务部');
# (2) 比 财务部 所有人工资都高的员工信息
select * from emp where salary > all ( select salary from emp where dept_id = (select id from dept where name = '财务部') );
# 又或者 使用 max()函数
select * from emp where salary > (select max(salary) from emp, dept where dept_id = dept.id and dept.name = '财务部');
# 查询比研发部其中任意一人工资高的员工信息
select * from emp where salary > any (select salary from emp, dept where dept_id = dept.id and dept.name = '研发部');
select * from emp where salary > some (select salary from emp, dept where dept_id = dept.id and dept.name = '研发部');
select * from emp where salary > any ( select salary from emp where dept_id = (select id from dept where name = '研发部') );
select * from emp where salary > (select min(salary) from emp, dept where dept_id = dept.id and dept.name = '研发部' );
4.6.4 行子查询
子查询返回的结果是一行(可以是多列),这种子查询称为行子查询。
常用的操作符:= 、<> 、IN 、NOT IN
示例:
# 查询与 "张无忌" 的薪资及直属领导相同的员工信息 ; (或者 = )
select * from emp where (salary, managerid) in (select salary, managerid from emp where name = '张无忌') ;
# 步骤拆解:
# (1)查询 "张无忌" 的薪资及直属领导
select salary, managerid from emp where name = '张无忌';
# (2)查询与 "张无忌" 的薪资及直属领导相同的员工信息 ;
select * from emp where (salary,managerid) = (select salary, managerid from emp where name = '张无忌');
4.6.5 表子查询
子查询返回的结果是多行多列,这种子查询称为表子查询。
常用的操作符:IN
示例:
# 查询与 "鹿杖客" , "宋远桥" 的职位和薪资相同的员工信息
# (1)查询 "鹿杖客" , "宋远桥" 的职位和薪资
select job, salary from emp where name in ('鹿杖客', '宋远桥');
select job, salary from emp where name = '鹿杖客' or name = '宋远桥';
# (2)查询与 "鹿杖客" , "宋远桥" 的职位和薪资相同的员工信息
select * from emp where (job, salary) in (select job, salary from emp where name in ('鹿杖客', '宋远桥'));
# 查询入职日期是 "2006-01-01" 之后的员工信息 , 及其部门信息
# (1)入职日期是 "2006-01-01" 之后的员工信息
select * from emp where entrydate > '2006-01-01';
# (2)查询这部分员工, 对应的部门信息;
select e.*, d.*
from (select * from emp where entrydate > '2006-01-01') e
left join dept d on d.id = e.dept_id;
4.7 案例
部分:
查询年龄小于30岁的员工的姓名、年龄、职位、部门信息(显式内连接)
# on 后 用 and (不建议)(见下面题)
select e.name, e.age, e.job, d.name from emp e join dept d on e.dept_id = d.id and e.age < 30;
# on 后用 where
select e.name , e.age , e.job , d.name from emp e inner join dept d on e.dept_id = d.id where e.age < 30;
这两个查询都会返回相同的结果,因为它们执行了相同的筛选操作,只是采用了不同的语法结构。INNER JOIN 已经确保了只有符合连接条件的行会被包括在结果中,所以 WHERE 子句中的条件与连接条件具有相同的效果。
查询拥有员工的部门ID、部门名称
select d.id, d.name from dept d where id in (select distinct dept_id from emp e where e.dept_id is not null);
# 参考答案 (内连接 保证 交集)
select distinct d.id , d.name from emp e , dept d where e.dept_id = d.id;
查询所有年龄大于40岁的员工, 及其归属的部门名称; 如果员工没有分配部门, 也需要展示出来(外连接)
# 此时这里 on 后面 用 and 报错
# select e.*, d.name from emp e left join dept d on (e.dept_id = d.id) and (e.age > 40);
# 正解
select e.*, d.name from emp e left join dept d on e.dept_id = d.id where e.age > 40 ;
细节:(chatGPT)
第一个查询会返回所有员工的记录,并且会关联到 "dept" 表,但在关联时会考虑年龄大于 40 岁的员工。这意味着结果中可能包括了所有员工,但只有那些年龄大于 40 岁的员工才会与 "dept" 表的记录关联,(只有年龄大于40的,才会与dept连接,获得到部门名称)。
第二个查询将只返回年龄大于 40 岁的员工的记录,并且只有这些员工才会与 "dept" 表的记录关联。
因此,两个查询的结果集不同,第一个查询可能包括了所有员工,但只有符合附加条件的员工才与 "dept" 表关联,而第二个查询只返回符合附加条件的员工,并且他们都与 "dept" 表关联。
第一段代码运行结果:(年龄不满足的部门名称都是null)
查询 "研发部" 所有员工的信息及 工资等级
select e.*, s.grade
from emp e,
dept d,
salgrade s
where (e.dept_id = d.id)
and (d.name = '研发部')
and (e.salary between s.losal and s.hisal);
查询 "研发部" 员工的平均工资
select avg(e.salary) from (select e.* from emp e, dept d where e.dept_id = d.id and d.name = '研发部') e;
# or
select avg(e.salary) from emp e, dept d where e.dept_id = d.id and d.name = '研发部';
查询低于本部门平均工资的员工信息
# 查询低于本部门平均工资的员工信息
# 创建部门平均薪资表
select *
from emp e,
(select avg(salary) avsal, dept_id from emp e1 group by dept_id) as average
where e.dept_id = average.dept_id
and e.salary < average.avsal;
# (参考答案)拆解:
# 查询指定部门平均薪资
select avg(e1.salary) from emp e1 where e1.dept_id = 1;
select avg(e1.salary) from emp e1 where e1.dept_id = 2;
# 查询低于本部门平均工资的员工信息
select *
from emp e2
where e2.salary < (select avg(e1.salary) from emp e1 where e1.dept_id = e2.dept_id);
查询所有的部门信息, 并统计部门的员工人数
# 拆解:
# 查询所有的部门信息
select id, name from dept;
# 统计某个部门的员工人数
select count(*) from emp where dept_id = 1;
# 整合 (子查询在select之后)
select d.id, d.name, (select count(*) from emp e where e.dept_id = d.id) '人数' from dept d;
5. 事务
5.1 简介
事务 是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。
举例:
张三给李四转账1000块钱,张三银行账户的钱减少1000,而李四银行账户的钱要增加1000。 这一组操作就必须在一个事务的范围内,要么都成功,要么都失败。
如果张三成功扣钱,而李四没有收到钱则异常。为了解决上述的问题,就需要通过数据的事务来完成,我们只需要在业务逻辑执行之前开启事务,执行完毕后提交事务。如果执行过程中报错,则回滚事务,把数据恢复到事务开始之前的状态。
注意: 默认MySQL的事务是自动提交的,也就是说,当执行完一条DML语句时,MySQL会立即隐式的提交事务。
5.2 事务操作
模拟案例数据:
create table account
(
id int auto_increment primary key comment '主键ID',
name varchar(10) comment '姓名',
money int comment '余额'
) comment '账户表';
insert into account(id, name, money)
VALUES (null, '张三', 2000),
(null, '李四', 2000);
-- 恢复数据
update account set money = 2000 where name = '张三' or name = '李四';
正常情况:
update account set money = money - 1000 where name = '张三' and money >= 1000;
update account set money = money + 1000 where name = '李四';
异常情况:
英文
.
下面的语句就会报异常
# 一起执行
update account set money = money - 1000 where name = '张三' and money >= 1000;
异常...
update account set money = money + 1000 where name = '李四';
控制事务 一
- 查看 / 设置事务提交方式
SELECT @@autocommit ; # 默认 1 仅限当前会话
SET @@autocommit = 0 ;
- 提交事务
COMMIT;
- 回滚事务
ROLLBACK;
注意:上述的这种方式,我们是修改了事务的自动提交行为, 把默认的自动提交修改为了手动提交, 此时我们执行的DML语句都不会提交, 需要手动的执行commit进行提交。
控制事务 二
- 开启事务(先执行,手动开启)
START TRANSACTION; 或 BEGIN ;
- 提交事务(正常执行完毕)
COMMIT;
- 回滚事务(执行过程中报错)
ROLLBACK;
5.3 事务四大特性 ACID
- 原子性(Atomicity):事务是不可分割的最小操作单元,要么全部成功,要么全部失败。
- 一致性(Consistency):事务完成时,必须使所有的数据都保持一致状态。
如果事务成功的完成,那么数据库的所有变化将生效。
如果事务执行出现错误,那么数据库的所有变化将会被回滚(撤销),返回到原始状态。
- 隔离性(Isolation):数据库系统提供的隔离机制,保证事务在不受外部并发操作影响的独立环境下运行。(两个事务同时运行)
多个用户并发的访问数据库时,一个用户的事务不能被其他用户的事务干扰,多个并发的事务之间要相互隔离。
一个事务的成功或者失败对于其他的事务是没有影响。
- 持久性(Durability):事务一旦提交或回滚,它对数据库中的数据的改变就是永久的。
上述就是事务的四大特性,简称ACID。
5.4 并发事务问题
- 赃读:一个事务读到另外一个事务还没有提交的数据。
比如B读取到了A未提交的数据。
- 不可重复读:一个事务先后读取同一条记录,但两次读取的数据不同,称之为不可重复读。
事务A两次读取同一条记录,但是读取到的数据却是不一样的。
- 幻读:一个事务按照条件查询数据时,没有对应的数据行,但是在插入数据时(失败,主键重复),又发现这行数据已经存在,好像出现了 "幻影"。
5.5 事务隔离级别
为了解决并发事务所引发的问题,在数据库中引入了事务隔离级别。主要有以下几种:
隔离级别 | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|
Read uncommitted | √ | √ | √ |
Read committed | × | √ | √ |
Repeatable Read(默认) | × | × | √ |
Serializable | × | × | × |
- 查看事务隔离级别
SELECT @@TRANSACTION_ISOLATION;
select @@transaction_isolation; # REPEATABLE-READ
- 设置事务隔离级别
SET [ SESSION | GLOBAL ] TRANSACTION ISOLATION LEVEL { READ UNCOMMITTED |
READ COMMITTED | REPEATABLE READ | SERIALIZABLE }
注意:事务隔离级别越高,数据越安全,但是性能越低。
当一个隔离级别为
Serializable
的console
查询了数据,而另一个窗口要插入数据时,会一直卡着不动,直到前者commit
;
6. 范式
以下回复来自文心一言
MySQL范式(Normalization)是数据库设计中的一个重要概念,它涉及到将数据库结构分解为更小的、更易于管理的部分,同时减少数据冗余和提高数据完整性。范式化是数据库优化和标准化的过程,它有助于确保数据的准确性和一致性。
MySQL范式通常分为几个级别,每个级别在结构上对前一个级别进行进一步的优化。以下是前三个范式(1NF、2NF 和 3NF)的简要解释:
6.1 第一范式(1NF)
定义:数据库表的每一列都是不可分割的原子项。
解释:在1NF中,确保表中的每个字段都是最小的数据单元,即字段不可再分。例如,不应将“姓名”和“年龄”合并为一个字段。
6.2 第二范式(2NF)
定义:在满足第一范式的基础上,非主键列必须完全依赖于整个主键,而不是依赖于主键的一部分。
解释:在2NF中,除了满足1NF外,还要求表中的非主键列必须完全依赖于主键。如果主键由多个字段组成(即复合主键),则非主键列不能仅依赖于主键的某一部分。
6.3 第三范式(3NF)
定义:在满足第二范式的基础上,非主键列之间不存在传递依赖关系。
解释:在3NF中,除了满足2NF外,还要求非主键列之间不存在传递依赖关系。这意味着一个非主键列不能通过另一个非主键列间接依赖于主键。
6.4 范式化的好处
- 减少数据冗余:通过分解表结构,可以避免在多个表中重复存储相同的数据。
- 提高数据完整性:范式化有助于确保数据的准确性和一致性。
- 简化查询和维护:结构清晰的表更容易进行查询和优化,也更容易进行维护和更新。
6.4.1 注意事项
虽然范式化有很多好处,但过度范式化也可能导致查询性能下降和复杂性增加。因此,在实际应用中,需要根据具体需求和场景权衡是否进行范式化以及范式化的程度。
6.5 示例
6.5.1 第一范式(1NF)示例
假设我们有一个存储订单信息的表,但它没有满足1NF的要求:
不满足1NF的订单表
CREATE TABLE Orders (
OrderID INT,
Products VARCHAR(255) -- 包含多个产品,用逗号分隔
);
-- 示例数据
INSERT INTO Orders (OrderID, Products) VALUES
(1, 'ProductA,ProductB'),
(2, 'ProductC');
在这个表中,Products
列包含了多个值(用逗号分隔),这违反了1NF的原则。为了满足1NF,我们需要将Products
列拆分为单独的行:
满足1NF的订单表
CREATE TABLE Orders (
OrderID INT PRIMARY KEY
);
CREATE TABLE OrderItems (
OrderID INT,
Product VARCHAR(50),
FOREIGN KEY (OrderID) REFERENCES Orders(OrderID)
);
-- 示例数据
INSERT INTO Orders (OrderID) VALUES (1), (2);
INSERT INTO OrderItems (OrderID, Product) VALUES
(1, 'ProductA'),
(1, 'ProductB'),
(2, 'ProductC');
6.5.2 第二范式(2NF)示例
假设我们有一个学生信息表,但它没有满足2NF的要求:
不满足2NF的学生信息表
CREATE TABLE StudentInfo (
StudentID INT PRIMARY KEY,
CourseName VARCHAR(50),
TeacherName VARCHAR(50)
);
-- 示例数据
INSERT INTO StudentInfo (StudentID, CourseName, TeacherName) VALUES
(1, 'Math', 'Mr. Smith'),
(2, 'English', 'Ms. Johnson');
在这个表中,CourseName
和TeacherName
都依赖于主键StudentID
,但实际上它们应该依赖于一个独立的课程ID。为了满足2NF,我们需要拆分这个表:
满足2NF的学生信息表
CREATE TABLE Students (
StudentID INT PRIMARY KEY
);
CREATE TABLE Courses (
CourseID INT PRIMARY KEY,
CourseName VARCHAR(50),
TeacherName VARCHAR(50)
);
CREATE TABLE StudentCourses (
StudentID INT,
CourseID INT,
FOREIGN KEY (StudentID) REFERENCES Students(StudentID),
FOREIGN KEY (CourseID) REFERENCES Courses(CourseID),
PRIMARY KEY (StudentID, CourseID)
);
-- 示例数据
INSERT INTO Students (StudentID) VALUES (1), (2);
INSERT INTO Courses (CourseID, CourseName, TeacherName) VALUES
(1, 'Math', 'Mr. Smith'),
(2, 'English', 'Ms. Johnson');
INSERT INTO StudentCourses (StudentID, CourseID) VALUES
(1, 1),
(2, 2);
6.5.3 第三范式(3NF)示例
假设我们有一个员工信息表,但它没有满足3NF的要求:
不满足3NF的员工信息表
CREATE TABLE EmployeeInfo (
EmployeeID INT PRIMARY KEY,
Department VARCHAR(50),
ManagerName VARCHAR(50), -- 这里违反了3NF,因为ManagerName依赖于Department
ManagerID INT -- 假设ManagerID是经理的唯一标识
);
在这个表中,ManagerName
依赖于Department
,而不是直接依赖于主键EmployeeID
。为了满足3NF,我们需要进一步拆分这个表:
满足3NF的员工信息表
CREATE TABLE Employees (
EmployeeID INT PRIMARY KEY,
Department VARCHAR(50)
);
CREATE TABLE Managers (
ManagerID INT PRIMARY KEY,
ManagerName VARCHAR(50)
);
CREATE TABLE EmployeeManagers (
EmployeeID INT,
ManagerID INT,
FOREIGN KEY (EmployeeID) REFERENCES Employees(EmployeeID),
FOREIGN KEY (ManagerID) REFERENCES Managers(ManagerID),
PRIMARY KEY (EmployeeID, ManagerID)
);
-- 示例数据
-- 这里省略了具体的INSERT语句,因为它们将类似于之前的示例。
通过这些示例,我们可以看到范式化是如何帮助我们分解复杂的表结构,减少数据冗余,并提高数据完整性的。然而,在实际应用中,也需要考虑查询性能和维护成本,有时候适度地违反范式化原则也是可以接受的。
Comments NOTHING