使用DISTINCT可去除查询重复行,返回唯一记录。其置于select后,对单列或多列组合去重,如SELECT DISTINCT city FROM user_table;多列时以组合作为判断依据,如SELECT DISTINCT name, city FROM user_table;还可用于聚合函数统计唯一值,如count(DISTINCT city);需注意性能影响,建议必要时使用并建立索引,避免在大文本字段操作,NULL值也会参与去重。

在mysql中使用DISTINCT关键字可以去除查询结果中的重复行,只返回唯一的数据记录。它通常放在SELECT后面,用于对一个或多个字段进行去重处理。
DISTINCT的基本用法
当你只想获取某列的唯一值时,可以直接在字段前加上DISTINCT:
SELECT DISTINCT column_name FROM table_name;
例如,有一个用户表user_table,其中city字段有重复数据:
SELECT DISTINCT city FROM user_table;
这条语句会返回所有不重复的城市名称。
对多列进行去重
DISTINCT作用于多个字段时,会将这些字段的组合值视为整体,只有当所有指定字段的值都相同时才会去重:
SELECT DISTINCT column1, column2 FROM table_name;
比如查询不同用户的姓名和城市组合:
SELECT DISTINCT name, city FROM user_table;
即使name相同,只要city不同,就会作为两条独立记录保留。
结合聚合函数使用DISTINCT
DISTINCT也可以用在聚合函数中,如COUNT、SUM等,用于统计唯一值的数量:
SELECT COUNT(DISTINCT city) FROM user_table;
这句查询将返回user_table表中不重复城市的总数。
如果想查看每个部门中不同岗位的数量,可以这样写:
SELECT department, COUNT(DISTINCT job_title) AS unique_jobs FROM employee_table GROUP BY department;
注意事项
DISTINCT会对性能有一定影响,尤其是在大数据量表上操作时。数据库需要排序或哈希处理来识别重复项,因此建议:
- 仅在必要时使用DISTINCT
- 确保相关字段上有适当索引
- 避免在大文本字段(如TEXT类型)上使用DISTINCT
- 注意NULL值也会被当作一种值参与去重
基本上就这些。DISTINCT是简单有效的去重工具,合理使用能让查询结果更清晰准确。


