Jak znaleźć zduplikowane wartości w tabeli w Oracle?

Question

Jak znaleźć zduplikowane wartości w tabeli w Oracle?

Jakie jest najprostsze polecenie SQL, które zwróci zduplikowane wartości dla danej kolumny i liczbę ich wystąpień w tabeli bazy danych Oracle?

Na przykład: mam JOBS tabelę z kolumną JOB_NUMBER. Jak mogę się dowiedzieć, czy mam jakieś duplikaty JOB_NUMBERs i ile razy są duplikowane?

233

sql oracle duplicate-data

Author: Bill the Lizard, 2008-09-12

Source

13 answers

Inny sposób:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

Działa dobrze (wystarczająco szybko), gdy jest indeks na column_name. Jest to lepszy sposób na usuwanie lub aktualizowanie zduplikowanych wierszy.

46

Author: Grrey,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2012-10-03 23:28:20

select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;

29

Author: JosephStyons,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2008-09-12 15:17:14

Nie musisz nawet mieć liczby w zwracanych kolumnach, jeśli nie musisz znać rzeczywistej liczby duplikatów. np.

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1

15

Author: Evan,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2008-09-13 14:55:49

A może:

SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;

Aby odpowiedzieć na powyższy przykład, wyglądałoby to następująco:

SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;

7

Author: Andrew,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2008-09-12 15:18:28

W przypadku, gdy wiele kolumn identyfikuje unikalny wiersz (np. tabela relacji), możesz użyć następującego

Użyj id wiersza np. emp_dept(empid, deptid, startdate, enddate) Załóżmy, że empid i deptid są unikalne i identyfikują wiersz w tym przypadku

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

I jeśli taka tabela ma klucz podstawowy, to Użyj klucza podstawowego zamiast rowid, np. id to pk, to

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

5

Author: Jitendra Vispute,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2012-09-20 07:25:14

Robienie

select count(j1.job_number), j1.job_number, j1.id, j2.id
from   jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
where  j1.id != j2.id
group by j1.job_number

Wyświetli identyfikatory zduplikowanych wierszy.

4

Author: agnul,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2008-09-12 15:24:34

SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc

4

Author: Wahid Haidari,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2013-04-05 07:10:57

Zwykle używam Oracle Analytic function ROW_NUMBER().

Powiedz, że chcesz sprawdzić duplikaty, które masz w odniesieniu do unikalnego indeksu lub klucza podstawowego zbudowanego na kolumnach (c1, c2, c3). Wtedy pójdziesz tą drogą, wychowując ROWID s wierszy, w których liczba wierszy ROW_NUMBER() wynosi >1:

Select * From Table_With_Duplicates
      Where Rowid In
                    (Select Rowid
                       From (Select Rowid,
                                    ROW_NUMBER() Over (
                                            Partition By c1 || c2 || c3
                                            Order By c1 || c2 || c3
                                        ) nbLines
                               From Table_With_Duplicates) t2
                      Where nbLines > 1)

0

Author: J. Chomel,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-10-24 08:21:15

Oto żądanie SQL, aby to zrobić:

select column_name, count(1)
from table
group by column_name
having count (column_name) > 1;

0

Author: Chaminda Dilshan,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-01-12 12:09:38

Wiem, że to stary wątek, ale to może komuś pomóc.

Jeśli chcesz wydrukować inne kolumny tabeli podczas sprawdzania duplikatów użyj poniżej:

select * from table where column_name in
(select ing.column_name from table ing group by ing.column_name having count(*) > 1)
order by column_name desc;

W razie potrzeby może również dodać kilka dodatkowych filtrów w klauzuli where.

0

Author: Parth Kansara,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2018-07-23 07:57:48

1. rozwiązanie

select * from emp
    where rowid not in
    (select max(rowid) from emp group by empno);

-1

Author: DoOrDie,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2016-02-11 07:01:27

Również u można spróbować czegoś takiego, aby wyświetlić listę wszystkich zduplikowanych wartości w tabeli say reqitem

SELECT count(poid) 
FROM poitem 
WHERE poid = 50 
AND rownum < any (SELECT count(*)  FROM poitem WHERE poid = 50) 
GROUP BY poid 
MINUS
SELECT count(poid) 
FROM poitem 
WHERE poid in (50)
GROUP BY poid 
HAVING count(poid) > 1;

-1

Author: Stacker,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2017-05-12 17:06:38

score 502 · Accepted Answer

select column_name, count(column_name)
from table
group by column_name
having count (column_name) > 1;

502

Author: Bill the Lizard,
Warning: date(): Invalid date.timezone value 'Europe/Kyiv', we selected the timezone 'UTC' for now. in /var/www/agent_stack/data/www/doraprojects.net/template/agent.layouts/content.php on line 54
2008-09-12 15:13:46