MSSQL去除重复行的优雅方法（mssql 去重复语句）

随着数据量的增长，数据库中出现了很多重复行，重复的数据会影响查询的准确性和效率。出现重复的原因通常是由于校验失败、语义无关、数据不一致等原因造成的，处理重复数据的一个有效方法就是对表采取去除重复行操作。

微软SQL服务器是使用非常多的数据库服务器，如何在MSSQL服务器中去除重复行呢？最常见的方法就是使用SELECT DISTINCT关键字，语法及示例如下：

“`sql

SELECT DISTINCT 列名 FROM 表名;


比如在名为“users”的表中，把所有重复的name去除：

```sql
SELECT DISTINCT name FROM users;

虽然SELECT DISTINCT可以很方便的实现去重，但是效率不是很高，大多数情况下，有更常见的优雅方式去除重复行，那就是GROUP BY语句，语法与示例如下：

“`sql

SELECT 列名1, 列名2, … FROM 表名 GROUP BY 列名1, 列名2, …;


比如在名为“users”的表中，把所有重复的name去除：

```sql
SELECT name FROM users GROUP BY name;

GROUP BY比SELECT DISTINCT具有更高的效率，而且也可以将重复行合并聚合操作更加的灵活，比如统计平均值、最大值、最小值等。

以上是使用MSSQL去除重复行的优雅方法，当然还有其他的优雅方法，如使用CTE语句，语法及示例如下：

“`sql

WITH CTE

(

SELECT 列名1, …, ROW_NUMBER() OVER(Partition BY 列名 ORDER BY 列名) 排序

FROM 表名

)

SELECT 列名1, … FROM CTE WHERE 排序 = 1;

“`

比如名为“users”的表中，把所有重复的name去除：

“`sql

WITH CTE

(

SELECT name, ROW_NUMBER() OVER(Partition BY name ORDER BY name) AS Rn

FROM users

)

SELECT name FROM CTE WHERE Rn = 1;


总结起来，用mssql更优雅的去除重复行主要可以有以下三种优雅的方法：SELECT DISTINCT关键字、使用GROUP BY语句、使用CTE语句。不同场景使用不同的方法会取得更加理想的效果，但是总的来说，以上都是简单有效的方法去除重复的行。