oracle 删除重复数据

来源:asp之家 时间:2009-07-23 14:46:00 

重复的数据可能有这样两种情况,第一种: 表中只有某些字段一样,第二种是两行记录完全一样。

一、对于部分字段重复数据的删除

1.查询重复的数据  
select 字段1,字段2, count(*) from 表名 group by 字段1,字段2 having count(*) > 1   
例:Select owner from dba_tables group by owner having count(*)>1;
Select owner from dba_tables group by owner having count(*)=1; //查询出没有重复的数据  

2.删除重复的数据

delete from 表名 a where 字段1,字段2 in (select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1)
这种删除执行的效率非常低,对于大数据量来说,可能会将数据库吊死。
另一种高效率的方法是先将查询到的重复的数据插入到一个临时表中,然后再进行删除。
CREATE TABLE 临时表 AS
(
select 字段1,字段2, count(*) as row_num
from 表名
group by 字段1,字段2
having count(*) > 1
);
  上面这句话就是建立了临时表,并将查询到的数据插入其中。
  下面就可以进行这样的删除操作了:
delete from 表名 a
where 字段1,字段2 in (select 字段1,字段2 from 临时表);  

3.保留重复数据中最新的一条记录

在Oracle中,rowid是隐藏字段,用来唯一标识每条记录。所以,只要保留重复数据中rowid最大的一条记录就可以了。  
查询重复数据:
select a.rowid,a.* from 表名 a
where a.rowid != (
select max(b.rowid) from 表名 b
where a.字段1 = b.字段1 and a.字段2 = b.字段2 );   
例:selete from dba_tables a
where a.rowid!=(
select max(rowid) from test b
where a.owner=b.owner);
  删除重复数据,只保留最新的一条数据:
delete from 表名 a
where a.rowid != (
select max(b.rowid) from 表名 b
where a.字段1 = b.字段1 and a.字段2 = b.字段2 )
  使用临时表实现高效查询
create table 临时表 as
(select a.字段1, a.字段2, MAX(a.ROWID) as dataid from 正式表 a
GROUP BY a.字段1,a.字段2);
delete from 表名 a
where a.rowid !=
( select b.dataid from 临时表 b
where a.字段1 = b.字段1 and
a.字段2 = b.字段2 );
commit;

二、对于完全重复记录的删除

对于表中两行记录完全一样的情况,可以用下面语句获取到去掉重复数据后的记录:
select distinct * from 表名
可以将查询的记录放到临时表中,然后再将原来的表记录删除,最后将临时表的数据导回原来的表中。如下:
CREATE TABLE 临时表 AS (select distinct * from 表名);
drop table 正式表;
insert into 正式表 (select * from 临时表);
drop table 临时表;   假如想删除一个表的重复数据,可以先建一个临时表,将去掉重复数据后的数据导入到临时表,然后在从临时表将数据导入正式表中,如下: INSERT INTO t_table_bak
select distinct * from t_table;

标签:oracle,删除,重复数据
0
投稿

猜你喜欢

  • 快速上手基于Anaconda搭建Django环境的教程

    2021-07-02 22:07:13
  • 详解python中asyncio模块

    2022-06-14 05:25:13
  • JS FormData对象使用方法实例详解

    2024-02-25 04:54:46
  • python爬虫之urllib,伪装,超时设置,异常处理的方法

    2022-07-23 23:47:10
  • python 操作mysql数据中fetchone()和fetchall()方式

    2024-01-19 11:02:18
  • python如何获取apk的packagename和activity

    2023-07-11 20:50:19
  • Vue2子组件绑定 v-model,实现父子组件通信方式

    2024-05-02 17:04:13
  • 微信小程序使用component自定义toast弹窗效果

    2024-05-25 15:17:45
  • MS SQL7.0的数据迁移到MySQL上的一种方法

    2008-11-01 16:59:00
  • Oracle SQL性能优化系列学习一

    2010-07-26 13:14:00
  • 深入浅析mybatis oracle BLOB类型字段保存与读取

    2024-01-15 02:21:26
  • Django通过自定义认证后端实现多种登录方式验证

    2022-09-21 20:15:40
  • ASP获取当前页面URL地址(带参数)的方法

    2010-01-14 19:40:00
  • MySQL 有输入输出参数的存储过程实例

    2024-01-24 23:00:01
  • 使用Python+Splinter自动刷新抢12306火车票

    2023-09-17 18:38:52
  • Python中的axis参数的具体使用

    2021-06-14 19:42:53
  • 如何将数据库里的记录生成一个Excel文件?

    2009-12-03 20:09:00
  • Python使用循环神经网络解决文本分类问题的方法详解

    2022-12-01 16:49:05
  • opencv形态学中的孔洞填充详细图解

    2021-08-14 00:44:10
  • asp日期转换成汉字格式程序

    2008-07-08 18:19:00
  • asp之家 网络编程 m.aspxhome.com