神奇的 SQL 之温柔的陷阱 → 三值逻辑 与 NULL !

  • 时间:
  • 浏览:4
  • 来源:幸运快3_快3倍率_幸运快3倍率

前言

  开心一刻 

     有有十哪几个 中国小孩参加国外的脱口秀节目,意味语言不通,于是找了有有十哪几个 翻译。

    主持人问:“Who is your favorite singer ?”

    翻译:”你最喜欢哪个歌手啊 ?”

    小孩兴奋地回答:”Michael Jackson”

    翻译转身对主持人说:”迈克尔-杰克逊”

    主持人看着翻译:"你说哪此哪此 ?"

    电视机前的观众:"我为啥一阵一阵蒙?" 

NULL

  NULL 用于表示缺失的值或遗漏的未知数据,都有四种 具体类型的值。数据表中的 NULL 值表示该值所处的字段为空,值为 NULL 的字段沒有值,尤其要明白的是:NULL 值与 0 意味空字符串是不同的。

  四种 NULL

    这俩 说法亲们意味会不言而喻很奇怪,意味 SQL 里只所处四种 NULL 。然而在讨论 NULL 时,亲们一般不会将它分成四种 类型来思考:“未知”(unknown)和“不适用”(not applicable,inapplicable)。

    以“告诉我戴墨镜的人眼睛是哪此颜色”这俩 情况报告为例,这买车人的眼睛肯定是有颜色的,为啥让意味他不摘掉眼镜,别人就告诉我他的眼睛是哪此颜色。这就叫作未知。而“告诉我冰箱的眼睛是哪此颜色”则属于“不适用”。意味冰箱根本就沒有眼睛,太多 “眼睛的颜色”这俩 属性不言而喻适用于冰箱。“冰箱的眼睛的颜色”这俩 说法和“圆的体积”“男性的分娩次数”一样,都有沒有意义的。平时,亲们习惯了说“告诉我”,为啥让“告诉我”也分太多 种。“不适用”这俩 情况报告下的 NULL ,在语义上更接近于“无意义”,而都有“不选者”。这里总结一下:“未知”指的是“不言而喻现在告诉我,但加进去去一些条件后就可不能知道”;而“不适用”指的是“无论为啥努力都无法知道”。

    关系模型的创造创造发明者 E.F. Codd 最先给出了这俩 分类。下图是他对“丢失的信息”的分类

  为哪此可不可不都可以写成“IS NULL”,而都有“= NULL”

    我相信不少人有沒有 的困惑吧,尤其是相信刚学 SQL 的小伙伴。亲们来看个具体的案例,假设亲们有如下表以及数据

DROP TABLE IF EXISTS t_sample_null;
CREATE TABLE t_sample_null (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(400) NOT NULL COMMENT '名称',
    remark VARCHAR(4000) COMMENT '备注',
    primary key(id)
) COMMENT 'NULL样例';

INSERT INTO t_sample_null(name, remark)
VALUES('zhangsan', '张三'),('李四', NULL);

    亲们要查询备注为 NULL 的记录(为 NULL 这俩 叫法四种 是不对的,太多 亲们日常中意味叫习惯了,具体往下看),为啥查,太多 新手会写出沒有 的 SQL

-- SQL 不报错,但查沒有结果
SELECT * FROM t_sample_null WHERE remark = NULL;

    执行时不报错,为啥让查沒有亲们日后的结果, 这是为哪此了 ? 这俩 疑问亲们先放着,亲们往下看

三值逻辑

  这俩 三值逻辑都有三目运算,指的是有有十哪几个 逻辑值,其他同学意味有疑问了,逻辑值都有不能真(true)和假(false)吗,哪来的第有有十哪几个 ? 说这话时亲们可不可不都可以注意所处的环境,在主流的编程语言中(C、JAVA、Python、JS等)中,逻辑值不言而喻不能 2 个,但在 SQL 中却所处第有有十哪几个 逻辑值:unknown。这俩 阵一阵相似 于亲们平时所说的:对、错、告诉我。

  逻辑值 unknown 和作为 NULL 的四种 的 UNKNOWN (未知)是不同的东西。前者是明确的布尔型的逻辑值,后者既都有值太多 是变量。为了便于区分,前者采用小写字母 unknown ,后者用大写字母 UNKNOWN 来表示。为了让亲们理解两者的不同,亲们来看有有十哪几个 x=x 沒有 的简单等式。x 是逻辑值 unknown 时,x=x 被判断为 true ,而 x 是 UNKNOWN 时被判断为 unknown 

-- 这俩

是明确的逻辑值的比较
unknown = unknown → true

-- 这俩

至少NULL = NULL
UNKNOWN = UNKNOWN → unknown

   三值逻辑的逻辑值表

    NOT

    AND

    OR

    图中蓝色每种是三值逻辑中独有的运算,这在二值逻辑中是沒有的。其余的 SQL 谓词全部都能由这有有十哪几个 逻辑运算组合而来。从这俩 意义上讲,这俩 十哪几个 逻辑表可不能说是 SQL 的母体(matrix)。

    NOT 的话,意味逻辑值表比较简单,太多 很好记;为啥让对于 AND 和 OR,意味组合出来的逻辑值较多,太多 全部记住非常困难。为了便于记忆,请注意这有有十哪几个 逻辑值之间有下面沒有 的优先级顺序。

      AND 的情况报告: false > unknown > true

      OR 的情况报告: true > unknown > false

    优先级高的逻辑值会决定计算结果。相似 true AND unknown ,意味 unknown 的优先级更高,太多 结果是 unknown 。而 true OR unknown 的话,意味 true 优先级更高,太多 结果是 true 。记住这俩 顺序后就能更方便地进行三值逻辑运算了。一阵一阵可不可不都可以记住的是,当 AND 运算中饱含 unknown 时,结果肯定我太多 是 true (反之,意味AND 运算结果为 true ,则参与运算的双方可不可不都可以都为 true )。

-- 假设 a = 2, b = 5, c = NULL,下列表达式的逻辑值如下

a < b AND b > c  → unknown
a > b OR b < c   → unknown
a < b OR b < c   → true
NOT (b <> c)     → unknown

  “IS NULL” 而非 “= NULL”

    亲们再回到疑问:为哪此可不可不都可以写成“IS NULL”,而都有“= NULL”

    对 NULL 使用比较谓词后得到的结果老要 unknown 。而查询结果只会饱含 WHERE 子句里的判断结果为 true 的行,我太多 饱含判断结果为 false 和 unknown 的行。不太多 等号,对 NULL 使用一些比较谓词,结果太多 是一样的。太多 无论 remark 是都有 NULL ,比较结果都有 unknown ,沒有永远沒有结果返回。以下的式子不会被判为 unknown

-- 以下的式子不会被判为 unknown
= NULL
> NULL
< NULL
<> NULL
NULL = NULL

    沒有,为哪此对 NULL 使用比较谓词后得到的结果永远不意味为真呢?这意味,NULL 既都有值太多 是变量。NULL 太多 有有十哪几个 表示“沒有值”的标记,而比较谓词只适用于值。为啥让,对不言而喻值的 NULL 使用比较谓词沒有 太多 沒有意义的。“列的值为 NULL ”、“NULL 值” 沒有 的说法四种 太多 错误的。意味 NULL都有值,太多 沒有定义域(domain)中。相反,意味其他同学认为 NULL 是值,沒有亲们可不能倒过来想一下:它是哪此类型的值?关系数据库中所处的值必然属于四种 类型,比如字符型或数值型等。太多 ,我希望 NULL 是值,沒有它就可不可不都可以属于四种 类型。

    NULL 容易被认为是值的意味有有有十哪几个 。第有有十哪几个 是高级编程语言里面,NULL 被定义为了有有十哪几个 常量(太多 语言将其定义为了整数0),这意味了亲们的混淆。为啥让,SQL 里的 NULL 和一些编程语言里的 NULL 是全部不同的东西。第十哪几个 意味是,IS NULL 沒有 的谓词是由有有十哪几个 单词构成的,太多 亲们容易把 IS 当作谓词,而把 NULL 当作值。一阵一阵是 SQL 里还有 IS TRUE 、IS FALSE 沒有 的谓词,亲们由此类推,从而沒有 认为太多 是沒有道理。为啥让正如讲解标准 SQL 的书里提醒亲们注意的那样,亲们应该把 IS NULL 看作是有有十哪几个 谓词。为啥让,写成 IS_NULL 沒有 你说哪此更至少。

温柔的陷阱

  比较谓词和 NULL

    排中律不成立

      排中律指同有有十哪几个 思维过程中,有有十哪几个 相互矛盾的思想不能同假,必有一真,即“要么A要么非A”

      假设亲们有学生表:t_student

DROP TABLE IF EXISTS t_student;
CREATE TABLE t_student (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(400) NOT NULL COMMENT '名称',
    age INT(3) COMMENT '年龄',
    remark VARCHAR(4000) NOT NULL DEFAULT '' COMMENT '备注',
    primary key(id)
) COMMENT '学生信息';

INSERT INTO t_student(name, age)
VALUE('zhangsan', 25),('wangwu', 400),('bruce', 32),('yzb', NULL),('boss', 18);

SELECT * FROM t_student;
View Code

      表中数据 yzb 的 age 是 NULL,也太多 说 yzb 的年龄未知。在现实世界里,yzb 是 20 岁,意味都有 20 岁,二者必居其一,这毫无疑问是有有十哪几个 真命题。沒有在 SQL 的世界里了,排中律还适用吗? 亲们来看有有十哪几个 SQL 

SELECT * FROM t_student
WHERE age = 20 OR age <> 20;

      咋一看,这不太多 查询表中全部记录吗? 亲们来看下实际结果

      yzb 没查出来,这是为哪此了?亲们来分析下,yzb 的 age 是 NULL,沒有这条记录的判断步骤如下

-- 1. 约翰年龄是 NULL (未知的 NULL !)
SELECT *
FROM t_student
WHERE age = NULL
OR age <> NULL;

-- 2. 对 NULL 使用比较谓词后,结果为unknown
SELECT *
FROM t_student
WHERE unknown
OR unknown;

-- 3.unknown OR unknown 的结果是unknown (参考三值逻辑的逻辑值表)
SELECT *
FROM t_student
WHERE unknown;

      SQL 的话的查询结果里不能判断结果为 true 的行。要想让 yzb 跳出在结果里,可不可不都可以加进去去下面沒有 的 “第 3 个条件”

-- 加进去去 3 个条件:年龄是20 岁,意味都有20 岁,意味年龄未知
SELECT * FROM t_student
WHERE age = 20 
    OR age <> 20
    OR age IS NULL;

    CASE 表达式和 NULL

      简单 CASE 表达式如下

CASE col_1
    WHEN = 1 THEN 'o'
    WHEN NULL THEN 'x'
END

      这俩 CASE 表达式一定我太多 返回 ×。这意味,第十哪几个 WHEN 子句是 col_1 = NULL 的缩写形式。正如亲们所知,这俩 式子的逻辑值永远是 unknown ,为啥让 CASE 表达式的判断法律法律依据与 WHERE 子句一样,只认可逻辑值为 true 的条件。正确的写法是像下面沒有 使用搜索 CASE 表达式

CASE WHEN col_1 = 1 THEN 'o'
    WHEN col_1 IS NULL THEN 'x'
END

  NOT IN 和 NOT EXISTS 都有等价的

    亲们在对 SQL 的话进行性能优化时,老要用到的有有十哪几个 技巧是将 IN 改写成 EXISTS ,这是等价改写,并沒有哪此疑问。为啥让,将 NOT IN 改写成 NOT EXISTS 时,结果不言而喻一样。

    亲们来看个例子,亲们有如下两张表:t_student_A 和 t_student_B,分别表示 A 班学生与 B 班学生 

DROP TABLE IF EXISTS t_student_A;
CREATE TABLE t_student_A (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(400) NOT NULL COMMENT '名称',
    age INT(3) COMMENT '年龄',
    city VARCHAR(400) NOT NULL COMMENT '城市',
    remark VARCHAR(4000) NOT NULL DEFAULT '' COMMENT '备注',
    primary key(id)
) COMMENT '学生信息';

INSERT INTO t_student_A(name, age, city)
VALUE
('zhangsan', 25,'深圳市'),('wangwu', 400, '广州市'),
('bruce', 32, '北京市'),('yzb', NULL, '深圳市'),
('boss', 43, '深圳市');

DROP TABLE IF EXISTS t_student_B;
CREATE TABLE t_student_B (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(400) NOT NULL COMMENT '名称',
    age INT(3) COMMENT '年龄',
    city VARCHAR(400) NOT NULL COMMENT '城市',
    remark VARCHAR(4000) NOT NULL DEFAULT '' COMMENT '备注',
    primary key(id)
) COMMENT '学生信息';

INSERT INTO t_student_B(name, age, city)
VALUE
('马化腾', 45, '深圳市'),('马三', 25, '深圳市'),
('马云', 43, '杭州市'),('李彦宏', 41, '深圳市'),
('年轻人', 25, '深圳市');

SELECT * FROM t_student_A;
SELECT * FROM t_student_B;
View Code

    需求:查询与 A  班住在深圳的学生年龄不同的 B 班学生,也太多 查询出 :马化腾 和 李彦宏,这俩 SQL 该怎么写,像沒有 ?

-- 查询与 A  班住在深圳的学生年龄不同的 B 班学生 ?
SELECT * FROM t_student_B
WHERE age NOT IN (
    SELECT age FROM t_student_A 
    WHERE city = '深圳市'
);

    亲们来看下执行结果

    亲们发现结果是空,查询不能任何数据,这是为哪此了 ?这里 NULL 又前一天日后日后现在开始作怪了,亲们一步一步来看看究竟所处了哪此

    可不能看出,在进行了一系列的转换后,沒有十根记录在 WHERE 子句里被判断为 true 。也太多 说,意味 NOT IN 子查询中用到的表里被选者的列中所处 NULL ,则 SQL 的话整体的查询结果永远是空。这是很可怕的疑问!

    为了得到正确的结果,亲们可不可不都可以使用 EXISTS 谓词

-- 正确的SQL 的话:马化腾和李彦宏将被查询到
SELECT * FROM t_student_B B
WHERE NOT EXISTS ( 
    SELECT * FROM t_student_A A
    WHERE B.age = A.age
    AND A.city = '深圳市' 
);

    执行结果如下

    同样地,亲们再来一步一步地看看这段 SQL 是怎么外理年龄为 NULL 的行的

    也太多 说,yzb 被作为 “与任何人的年龄都有同的人” 来外理了。EXISTS 只会返回 true 意味false,永远我太多 返回 unknown。为啥让都有了 IN 和 EXISTS 可不能互相替换使用,而 NOT IN和 NOT EXISTS 却不可不能互相替换的混乱疑问。

  还有一些一些的陷阱,比如:限定谓词和 NULL、限定谓词和极值函数都有等价的、聚合函数和 NULL 等等。

总结

  1、NULL 用于表示缺失的值或遗漏的未知数据,都有四种 具体类型的值,不能对其使用谓词

  2、对 NULL 使用谓词后的结果是 unknown,unknown 参与到逻辑运算时,SQL 的运行会和预想的不一样

  3、 IS NULL 整个是有有十哪几个 谓词,而都有:IS 是谓词,NULL 是值;相似 的还有 IS TRUE、IS FALSE

  4、要想外理 NULL 带来的各种疑问,最佳法律法律依据应该是往表里加进去去 NOT NULL 约束来尽力排除 NULL

    我的项目饱含个硬性规定:所有字段可不可不都可以是 NOT NULL,建表的前一天就加进去去此约束

参考

  《SQL进阶教程》

navicat

  https://gitee.com/youzhibing/tools/blob/master/NavicatforMySQL.rar