神奇的 SQL 之层级 → 为什么 GROUP BY 之后不能直接引用原表中的列

  • 时间:
  • 浏览:0
  • 来源:幸运快3_快3手机版_幸运快3手机版

前言

  开心一刻

感觉不妙呀,弟弟舔它! 不该舔的,舔到怀疑人生了......

GROUP BY 后 SELECT 列的限制

  标准 SQL 规定,在对表进行聚合查询的完后 ,必须在 SELECT 子句中写下面 3 种内容:通过 GROUP BY 子句指定的聚合键、聚合函数(SUM 、AVG 等)、常量。亲戚亲戚我们歌词 来看个例子

  亲戚亲戚我们歌词 有 学生班级表(tbl_student_class) 以及 数据如下 :

DROP TABLE IF EXISTS tbl_student_class;
CREATE TABLE tbl_student_class (
  id int(8) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  sno varchar(12) NOT NULL COMMENT '学号',
  cno varchar(5) NOT NULL COMMENT '班级号',
  cname varchar(20) NOT NULL COMMENT '班级名',
  PRIMARY KEY (id)
) COMMENT='学生班级表';

-- ----------------------------
-- Records of tbl_student_class
-- ----------------------------
INSERT INTO tbl_student_class VALUES ('1', '201901507001', '01507', '影视7班');
INSERT INTO tbl_student_class VALUES ('2', '201901507002', '01507', '影视7班');
INSERT INTO tbl_student_class VALUES ('3', '2019015011503', '01508', '影视8班');
INSERT INTO tbl_student_class VALUES ('4', '2019015011504', '01508', '影视8班');
INSERT INTO tbl_student_class VALUES ('5', '201901509005', '01509', '影视9班');
INSERT INTO tbl_student_class VALUES ('6', '201901509006', '01509', '影视9班');

  亲戚亲戚我们歌词 想统计各个班(班级号、班级名)另二个有几只人、以及最大的学号,亲戚亲戚我们歌词 该为甚写这一查询 SQL ? 让我要要亲戚亲戚我们歌词 应该都有

SELECT cno,cname,count(sno),MAX(sno) 
FROM tbl_student_class
GROUP BY cno,cname;

  原本村里人 会想了,cno 和 cname 原本好多好多 一对一,cno 一旦选取,cname 也就选取了,那 SQL 是都有能要能如此写 ?

SELECT cno,cname,count(sno),MAX(sno) 
FROM tbl_student_class
GROUP BY cno;

  执行报错了:

[Err] 1055 - Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'test.tbl_student_class.cname' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

  提示信息:SELECT 列表中的第二个表达式(cname)没哟 GROUP BY 的子句中,并肩它也都有聚合函数;这与 sql 模式:ONLY_FULL_GROUP_BY 不相容。

  为那此 GROUP BY 完后 必须直接引用原表(没哟 GROUP BY 子句)中的列 莫急,亲戚亲戚我们歌词 慢慢往下看。

SQL 模式

  MySQL 服务器能要能在不同的 SQL 模式下运行,只是 能要能针对不同的客户端以不同的方法 应用那此模式,具体取决于 sql_mode 系统变量的值。 DBA 能要能设置全局SQL模式以匹配站点服务器操作要求,只是 每个程序运行能要能将其会话 SQL 模式设置为其我本人的要求。模式会影响 MySQL 支持的 SQL 语法以及它执行的 数据验证检查,这使得在不同环境中使用MySQL以及将MySQL与一点数据库服务器并肩使用变得更加容易。更多详情请查阅官网:Server SQL Modes。MySQL 版本不同,内容会略有不同(包括默认值),查阅的完后 注意与自身的 MySQL 版本保持一致。

  SQL 模式主要分两类:语法支持类和数据检查类,常用的如下

  语法支持类    

    ONLY_FULL_GROUP_BY

      对于 GROUP BY 聚合操作,只是 在 SELECT 中的列、HAVING 只是 ORDER BY 子句的列,如此在GROUP BY中再次出现 ,如此这一SQL是不合法的

    ANSI_QUOTES

      启用 ANSI_QUOTES 后,必须用双引号来引用字符串,只是 它被解释为识别符,作用与 ` 一样。设置它完后 ,update t set f1="" ...,会报 Unknown column ‘’ in field list 原本的语法错误

    PIPES_AS_CONCAT

      将 || 视为字符串的连接操作符而非 或 运算符,这和Oracle数据库是一样的,也和字符串的拼接函数 CONCAT() 相类似于于

    NO_TABLE_OPTIONS

      使用 SHOW CREATE TABLE 时不必输出MySQL特有的语法主次,如 ENGINE ,这一在使用 mysqldump 跨DB种类迁移的完后 须要考虑

    NO_AUTO_CREATE_USER

      字面意思不自动创建用户。在给MySQL用户授权时,亲戚亲戚我们歌词 习惯使用 GRANT ... ON ... TO dbuser 顺道并肩创建用户。设置该选项后就与oracle操作类似于于,授权完后 须要先建立用户

  数据检查类   

    NO_ZERO_DATE

      认为日期 ‘0000-00-00’ 非法,算不算不算设置顶端的严格模式有关

      1、只是 设置了严格模式,则 NO_ZERO_DATE 自然满足。但只是 是 INSERT IGNORE 或 UPDATE IGNORE,’0000-00-00’依然允许且只显示warning;

      2、只是 在非严格模式下,设置了NO_ZERO_DATE,效果与顶端一样,’0000-00-00’ 允许但显示warning;只是 如此设置NO_ZERO_DATE,no warning,当做完整性合法的值;

      3、NO_ZERO_IN_DATE请况与顶端类似于于,不同的是控制日期和天,算不算可为 0 ,即 2010-01-00 算不算合法;

    NO_ENGINE_SUBSTITUTION

      使用 ALTER TABLE 或 CREATE TABLE 指定 ENGINE 时, 须要的存储引擎被禁用或未编译,该如何正确处理。启用 NO_ENGINE_SUBSTITUTION 时,如此直接抛出错误;不设置此值时,CREATE用默认的存储引擎替代,ATLER不进行更改,并抛出另二个 warning

    STRICT_TRANS_TABLES

      设置它,表示启用严格模式。注意 STRICT_TRANS_TABLES 都有几种策略的组合,单独指 INSERT、UPDATE 再次出现 少值或无效值该如何正确处理:

      1、前面提到的把 ‘’ 传给int,严格模式下非法,若启用非严格模式则变成 0,产生另二个warning;

      2、Out Of Range,变成插入最大边界值;

      3、当要插入的新行中,不涵盖其定义中如此显式DEFAULT子句的非NULL列的值时,该列缺少值;

  默认模式

    当亲戚亲戚我们歌词 如此修改配置文件的请况下,MySQL 是有我本人的默认模式的;版本不同,默认模式好多好多 同

-- 查看 MySQL 版本
SELECT VERSION();

-- 查看 sql_mode
SELECT @@sql_mode;

     亲戚亲戚我们歌词 能要能都看,5.7.21 的默认模式涵盖:

ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION

    而第另二个:ONLY_FULL_GROUP_BY 就会约束:当亲戚亲戚我们歌词 进行聚合查询的完后 ,SELECT 的列必须直接涵盖非 GROUP BY 子句中的列。那只是 亲戚亲戚我们歌词 加进该模式(从“严格模式”到“宽松模式”)呢 ?

    亲戚亲戚我们歌词 发现,上述报错的 SQL

    能正常执行了,只是 一般请况下不推荐原本配置,线上环境往往是“严格模式”,而都有“宽松模式”;都有只是案例中,无论是“严格模式”,还是“宽松模式”,结果都有对的,那是只是 cno 与 cname 唯一对应的,只是 cno 与 cname 都有唯一对应,如此在“宽松模式下” cname 的值是随机的,这就会造成难以排查的难题,有兴趣的能要能去试试。那为那此会有 ONLY_FULL_GROUP_BY 模式呢 亲戚亲戚我们歌词 继续往下看

  阶(order)是用来区分集合或谓词的阶数的概念。谓词逻辑中,根据输入值的阶数对谓词进行分类。= 只是 BETWEEEN 等输入值为一行的谓词叫作"一阶谓词",而像 EXISTS 原本输入值为行的集合的谓词叫作"二阶谓词"(HAVING 的输入值也是集合,但它都有谓词)。以此类推,三阶谓词=输入值为"集合的集合"的谓词,四阶谓词=输入值为"集合的集合的集合"的谓词,只是 SQL 里暂且会再次出现 三阶以上的请况,好多好多 不必太在意。简单点如下图

  谈到了阶,就不得不谈下集合论;集合论是 SQL 语言的根基,只是 它的这一特性,SQL 也被称为面向集合语言。必须从集合的深度来思考,要能明白 SQL 的强大威力。通过上图,相信亲戚亲戚我们歌词 也都能都看,这里不做更深入的讲解了,有兴趣的能要能去查相关资料。

为那此聚合后必须再引用原表中的列

  好多好多 人都知道聚合查询的限制,只是 很少村里人 能正确地理解为那此会有原本的约束。表 tbl_student_class 中的 cname 存储的是每位学生的班级信息,但须要注意的是,这里的 cname 好多好多 每个学生的属性,并都有小组的属性,而 GROUP BY 又是聚合操作,操作的对象好多好多 由多个学生组成的小组,只是 ,小组的属性必须是平均只是 总和等统计性质的属性,如下图

  询问每个学生的 cname 是能要能的,只是 询问由多个学生组成的小组的 cname 就如此意义了。对于小组来说,必须"一共几只学生"只是 "最大学号是几只?"原本的问法才是有意义的。强行将适用于个体的属性套用于团体之上,纯粹是这一分类错误;而 GROUP BY 的作用是将另二个个元素划分成若干个子集,使用 GROUP BY 聚合完后 ,SQL 的操作对象便由 0 阶的"行"变为了 1 阶的"行的集合",此时,行的属性便必须使用了。SQL 的世界都有只是是层级分明的等级社会,将低阶概念的属性用在高阶概念上会导致 秩序的混乱,这是不允许的。此时我相信亲戚亲戚我们歌词 都明白:为那此聚合后必须再引用原表中的列 。

单元素集合也是集合

  现在的集合论认为单元素集合是这一正常的集合。单元素集合和空集一样,主好多好多 为了保持理论的完整性性而定义的。只是 对于以集合论为基础的 SQL 来说,当然也须要严格地区分元素和单元素集合。只是 ,元素 a 和集合 {a} 之间趋于稳定着非常醒目的层级差别。

  这另二个层级的区别分别对应着 SQL 中的 WHERE 子句和 HAVING 子句的区别。WHERE 子句用于正确处理"行"这一 0 阶的对象,而 HAVING 子句用来正确处理"集合"这一 1 阶的对象。

总结

  1、SQL 严格区分层级,包括谓词逻辑中的层级(EXISTS),也包括集合论中的层级(GROUP BY);

  2、有了层级区分,如此适用于个体上的属性就不适用于团体了,这也好多好多 为那此聚合查询的 SELECT 子句中必须直接引用原表中的列的导致 ;

  3、一般来说,单元素集合的属性和其唯一元素的属性是一样的。这一只涵盖另二个元素的集合让我都有只是似乎如此必要特意地当成集合来看待,只是 为了保持理论的完整性性,亲戚亲戚我们歌词 还是要严格区分元素和单元素集合;

参考

  《SQL基础教程》

  《SQL进阶教程》