Das doppelte Lottchen, oder: Dublettensuche mit Excel 23

Doppelte und mehrfache Einträge in Tabellen einfach finden.
 

Das Verwalten von langen Listen und Tabellen ist ja eines der Hauptanwendungsgebiete von Excel. Dabei kommt es immer wieder vor, dass eine Tabelle bewußt oder unbewußt doppelte Einträge enthält.

Insbesondere, wenn man Daten aus mehreren Quellen zusammenfassen möchte, kommt es oftmals zu einer unerwünschten Häufung identischer Datensätze.

Im heutigen Artikel stelle ich euch drei Möglichkeiten vor, in Excel diesen Dubletten (Tripletten…) auf die Schliche zu kommen:

  • Duplikate entfernen
  • Spezialfilter
  • Bedingte Formatierung

Und so geht’s:

1. Duplikate entfernen

Wichtiger Hinweis zu Beginn: Diese Funktion entfernt die Duplikate aus deiner Ursprungstabelle, d.h. sie werden tatsächlich gelöscht! Im Zweifelsfall solltest Du also vorher eine Kopie der Daten anfertigen.

Stelle dann den Cursor irgendwo in die Datentabelle, welche die vermeintlichen Dubletten enthält. In der Registerkarte “Daten” befindet sich der Menüpunkt “Duplikate entfernen”, den du nun anklicken kannst:

Duplikate entfernen

Duplikate entfernen

Im folgenden Fenster lässt sich jetzt auswählen, welche Spalten für die Ermittlung der Duplikate herangezogen werden sollen. In den meisten Fällen wirst du hier sämtliche Spalten markieren. Wenn deine Tabelle auch Spaltenüberschriften enthält, solltest du auch den entsprechenden Haken setzen:

Duplikate entfernen (2)

Duplikate entfernen (2)

Mit einem Klick auf “OK” werden alle Duplikate aus deiner Ursprungstabelle entfernt:

Bereinigte Liste

Bereinigte Liste

2. Spezialfilter

Anders als die Funktion “Duplikate entfernen” werden hier die doppelten Einträge nur gefiltert, also ausgeblendet. Diese Funktion befindet sich ebenfalls im Register “Daten”, Schaltfläche “Erweitert”.

Spezialfilter

Spezialfilter

Wenn der Listenbereich noch nicht korrekt markiert war, kannst du es im nachfolgenden Fenster nachholen. Um echte Dubletten zu finden, brauchst du keinen Kriterienbereich anzugeben, es werden dann sämtliche Spalten berücksichtigt. Nun hast du zwei Möglichkeiten:

Möglichkeit 1: Du willst die Daten direkt innerhalb der vorhandenen Tabelle filtern

An gleicher Stelle filtern

An gleicher Stelle filtern

Der wichtigste Haken ist natürlich die Option “Keine Duplikate”, die du markieren musst.
In der Statusleiste siehst du hinterher, wieviele Datensätze ausgefiltert wurden:

Gefilterte Liste

Gefilterte Liste

Möglichkeit 2: Die gefilterten Daten sollen an eine andere Stelle kopiert werden.

An andere Stelle kopieren

An andere Stelle kopieren

In diesem Fall musst Du noch den gewünschten Zielbereich angeben (es reicht die Angabe der linken oberen Zelle) und natürlich den Haken “Keine Duplikate” nicht vergessen:

Zweite, bereinigte Liste

Zweite, bereinigte Liste

So erhältst Du eine zweite, dublettenfreie Liste, während die Originaltabelle unverändert bleibt.

3. Bedingte Formatierung

Wenn es lediglich darum geht, alle Zellen zu markieren, deren Inhalte mehrfach in meiner Tabelle vorkommen, dann bietet sich die bedingte Formatierung an.

Ich habe dazu eine Beispieltabelle mit zufälligen Zahlen vorbereitet und möchte jede Zahl markieren, die mehrfach vorkommt:

Beispieltabelle

Beispieltabelle

Dazu markiere ich zunächst meine Datentabelle und rufe dann im Register “Start” die Schaltfläche “Bedingte Formatierung” auf. Hier gibt es den Menüpunkt “Regeln zum Hervorheben von Zellen”. Das Untermenü “Doppelte Werte…” bringt mich zum Ziel:

Regeln zum Hervorheben

Regeln zum Hervorheben


Doppelte Werte

Doppelte Werte

Und so sieht die Tabelle dann aus: Alle Zahlen, die doppelt vorkommen, sind farbig hinterlegt:

Ergebnis: Doppelte Werte

Ergebnis: Doppelte Werte

Dies war aber nur der Pflichtlauf, denn jetzt kommt die Kür!

Abhängig davon, wie oft eine Zahl mehrfach vorkommt, soll noch eine andere Farbe für die Markierung verwendet werden. Dazu entfernen wir zuerst die vorhin gesetzte bedingte Formatierung und markieren erneut den Datenbereich. Dann wählen wir wieder die Schaltfläche “Bedingte Formatierung”, jetzt aber den Menüpunkt “Neue Regel…”

Neue Regeln

Neue Regeln

Als Regeltyp wählen wir “Formel zur Ermittlung der zu formatierenden Zellen verwenden” und geben dann folgende ZÄHLENWENN()-Formel ein:
=ZÄHLENWENN($A$1:$K$24;A1)>1
Als Formatierung habe ich in meinem Beispiel einen grünen Hintergrund gewählt:

Zählenwenn-Regel 1

Zählenwenn-Regel 1

Zu Erläuterung:
In der ZÄHLENWENN()-Funktion gebe ich im ersten Parameter den kompletten absoluten Datenbereich meiner Tabelle an. Der zweite Parameter enthält mein Kriterium. Da beim Aufrufen der Funktion meine aktive Zelle A1 war, gebe ich hier “A1” ein (Wichtig: Keine $-Zeichen verwenden!) und als Bedingung “>1”. Somit wird für jede einzelne Zelle geprüft, ob der Wert dieser Zelle mehr als einmal in der Tabelle vorkommt.

Danach lege ich nach dem gleichen Muster noch eine zweite und eine dritte Regel an:

Weitere Regeln anlegen

Weitere Regeln anlegen

=ZÄHLENWENN($A$1:$K$24;A1)>2 (Formatierung = Gelb)
=ZÄHLENWENN($A$1:$K$24;A1)>3 (Formatierung = Rot)

Regel 3

Regel 3

Insgesamt habe ich somit drei verschiedene Bedingungen definiert:

Drei Regeln definiert

Drei Regeln definiert

Und so sieht mein Ergebnis aus: Zahlen, die zweimal vorkommen sind grün, dreifach vorkommende sind gelb und die Quadletten sind rot markiert!

Endergebnis: Bedingte Formatierung

Endergebnis: Bedingte Formatierung

Du siehst, mit ein bisschen Fantasie macht sogar die Dublettensuche fast noch Spaß!

Das könnte dich auch interessieren:

Und immer daran denken: Excel beißt nicht!

P.S. Die Lösung ist immer einfach. Man muss sie nur finden.
(Alexander Solschenizyn)

P.P.S. Das Problem sitzt meistens vor dem Computer.



Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

23 Gedanken zu “Das doppelte Lottchen, oder: Dublettensuche mit Excel

  • Sabine

    Bei großen Tabellen führen “bedingten Formatierungen” (aus eigener Erfahrung) zu erhöhtem Kaffeekonsum 😉
    Als schnelle Lösung um zu sehen, ob Dubletten vorhanden sind, eignet sich meiner Meinung eine Pivot am besten:
    Die gesuchte Spalte sowohl als Zeilenbeschriftung als auch Werte wählen, ggf. absteigend sortieren und hoffen, dass überall die “1” steht.

    • Martin Weiß Autor des Beitrags

      Hallo Sabine,

      zwischendurch eine Tasse Kaffee ist ja auch nicht schlecht – immerhin kann man dann mal vom Schreibtisch aufstehen 🙂
      Aber es stimmt schon: Bedingte Formatierungen und andere in großem Stil eingesetzte volatile Funktionen können Excel durchaus ins Schwitzen bringen. Und die von dir vorgeschlagene Pivot-Lösung ist definitiv eine gute und extrem schnelle Variante.

      Schöne Grüße,
      Martin

  • Marc Hommelsheim

    Also hier habe ich bis jetzt die beste Lösung gefunden. Allerdings funktioniert es bei mir immer noch nicht so richtig über mehrere Blätter. sobald ich einen doppelten wert in einem anderen Blatt eingebe, markiert er mir die Felder nicht. soll er aber. 🙂
    Erst wenn ich in demselben Blatt den Wert doppelt eingebe, markiert er es mir auch in allen anderen Blättern. Sehr merkwürdig…
    Kann mir einer Weiterhelfen?! 😀

    BG Marc

    • Martin Weiß Autor des Beitrags

      Hallo Marc,

      ich nehme mal an, Du hast die ZÄHLENWENN-Funktion in der Formatierungsregel verwendet. Wenn die Werte auf verschiedenen Arbeitsblättern berücksichtigt werden soll, dann musst Du in jedem Blatt eine leicht angepasste Formel verwenden. Beispiel: Eine Liste liegt im Blatt “Tabelle1” und die zweite Liste liegt im Blatt “Tabelle2”.

      Formatierungsregel für Blatt 1:
      =ZÄHLENWENN($A$1:$A$10;A1)+ZÄHLENWENN(Tabelle2!$A$1:$A$10;A1)>1

      Formatierungsregel für Blatt 2:
      =ZÄHLENWENN($A$1:$A$10;A1)+ZÄHLENWENN(Tabelle1!$A$1:$A$10;A1)>1

      Und Wenn es mehr Blätter sind, müssen eben noch weitere ZÄHLENWENN-Funktionen in die Formel rein. Wichtig ist eben, dass immer auch das jeweils andere Blatt im Bezug enthalten ist.

      Schöne Grüße,
      Martin

  • Sina

    Punkt 3. Bedingte Formatierung, der Pflichtlauf, ist genau die Funktion die ich gesucht habe! Einfach und leicht verständlich erklärt. Zuvor habe ich mich durch einige “Lösungen” gegoogelt, war für mich aber zu kompliziert und umständlich mit teilweise endlos langen Formeln erklärt, die ich leider ohnehin nicht richtig verstanden habe als Excel Dummie.
    Vielen Dank für die gute Erklärung!

    • Martin Weiß Autor des Beitrags

      Hallo Sina,

      vielen Dank für das schöne Feedback. Freut mich, wenn der Artikel helfen konnte.

      Schöne Grüße,
      Martin

  • Andi

    Hallo Martin,
    vielen Dank für Deine hilfreiche Website!
    Ich habe eine Frage bzgl. doppelter Werte (bzw. Firmennamen). Ist es möglich, eine Liste aus Tabellenblatt 1 mit einer Liste aus Tabellenblatt 2 zu vergleichen? Im Ergebnis sollen alle übereinstimmende Namen im Tabellenblatt 2 farblich markiert werden.
    Vielen Dank und Gruß
    Andi

    • Martin Weiß Autor des Beitrags

      Hallo Andi,

      ja, so etwas ist ohne Problem über eine bedingte Formatierung möglich. Beispiel:
      Liste in Tabelle 1 von A1:A100
      Liste in Tabelle 2 von A1:A100

      Markiere die Liste in Tabellenblatt 2 und lege dann eine neue Formatierungsregel mit folgender Formel an:
      =ZÄHLENWENN(Tabelle1!$A$1:$A$100;A1)>0

      Schöne Grüße,
      Martin

  • Lukas

    Hallo zusammen,
    ich würde gerne die jeweilige Dublette farbig markiert bekommen.
    Beispiel Tabelle mit den Werten:
    1
    2
    2
    3
    1

    Ich suche nach der Möglichkeit, die zwei Zellen mit “2” bspw. mit grün und die beiden Zellen mit “3” mit blau zu markieren.

    Lässt sich sowas nur über ein Makro lösen? Wenn ja, gibt es eine Lösung vielleicht schon?

    Danke!

    • Martin Weiß Autor des Beitrags

      Hallo Lukas,

      wenn es immer nur um die beiden Werte geht, dann könntest Du dafür zwei Regeln für eine bedingte Formatierung anlegen:
      =UND(ZÄHLENWENN($A$1:$A$12;A1)>1;A1=2) –> grün
      =UND(ZÄHLENWENN($A$1:$A$12;A1)>1;A1=3) –> blau

      Aber ich vermute mal, dass Du jede beliebige Dublette geht und Du jede Dublettengruppe in einer anderen Farbe darstellen möchtest. Dafür kann ich leider keine Lösung bieten.

      Schöne Grüße,
      Martin

  • Martin Kopf

    Hallo Martin,

    ich habe eine einfache Aufgabe, bekomme die Formel aber leider nicht richtig gebacken.

    Aufgabe: Gleiche Werte in 2 Spalten finden und in der 3. Spalte den gefundenen Wert oder Falsch ausweisen.
    Also eine Wenn-Dann-Funktion.
    z.B. Wenn A1 in C1:C10 enthalten ist, dann zeige mir den gefundenen Wert in B1. Wenn kein Wert gefunden wird, soll in B1 falsch stehen.

    Vielen Dank im Voraus für Deine Unterstützung

    Viele Grüße
    Martin

    • Martin Weiß Autor des Beitrags

      Hallo Martin,

      eine einfache Variante wäre der SVERWEIS. Bezogen auf Dein Beispiel lautet die Formel in B1:
      =WENNFEHLER(SVERWEIS(A1;$C$1:$C$10;1;FALSCH);”falsch”)

      Schöne Grüße,
      Martin

      • Martin Kopf

        Hallo Namenskollege;

        vielen Dank für Deine Unterstützung. Formel hat soweit funktioniert.
        Leider wird aber bei einem positiven Ergebnis nicht die 1 gezeigt (1 in der Formel vor FALSCH) sondern der Wert (Zahl und Wort) aus der Spalte A.
        Wenn die 1 gezeigt wird kann ich Filter setzen und die richtigen Werte sofort sehen.

        Vielen Dank im Voraus für Deine weitere Unterstützung.

        Viele Grüße
        Martin

        • Martin Weiß Autor des Beitrags

          Hallo Martin,

          die 1 in der SVERWEIS-Funktion bedeutet nicht, dass der Wert 1 gezeigt wird, sondern dass der Wert aus der 1. Spalte im angegebenen Bereich zurückgeliefert wird. Und so hatte ich Deine ursprüngliche Frage verstanden. Wenn Du stattdessen möchtest, dass bei einem Treffer immer 1 zurückgegeben wird, geht das z.B. so:

          =WENN(ISTNV(SVERWEIS(A1;$C$1:$C$10;1;FALSCH));”falsch”;1)

          Schöne Grüße,
          Martin

  • Mia

    Hallo Martin,
    das hat mir schon mal sehr geholfen, nur habe ich leider ein kleines Problem.

    Meine Excel-Tabelle besteht aus ca. 700 Zeilen. In den Zellen steht entweder ein x oder sie ist leer, also keine Zahlen.

    Ich möchte, dass nach dem Filtern auf z.B. 3, 5 oder 6 usw. Zeilen (immer unterschiedlich) nur die doppelten Werte (doppelt vorkommende x) der gefilterten Zeilen hervorgehoben werden.

    Wenn ich vor dem Filtern die bedingte Formatierung anwende, sind nach dem Filtern Spalten in denen jetzt nur noch eine Zelle mit einem x steht trotzdem grün gefärbt, was nicht sein soll.

    Gibt es dafür eine Lösung?

    • Mia

      Hinzuzufügen ist vielleicht noch, dass sich die bedingte Formatierung immer genau auf eine Spalte bezieht.
      Es sollen also doppelt vorkommende Werte (doppelt vorkommende x) in einer Spalte, nachdem Filtern auf eine immer unterschiedliche Anzahl auf Zeilen, farblich grün hervorgehoben werden.

      Für deine Hilfe wäre ich dir sehr dankbar!

      • Martin Weiß Autor des Beitrags

        Hallo Mia,

        so etwas geht mit bedingter Formatierung leider nicht. Die Regeln greifen immer auf den gesamten Bereich, egal ob die Zellen ein- oder ausgeblendet sind.

        Schöne Grüße,
        Martin

        • Martin Kopf

          Hallo Martin,

          ich habe mal wieder eine Excel-Herausforderung.
          Auf dem Sachkonto 1360 = Geldtransit werden im Jahr 2016 ca. 1.500 Buchungen gezeigt. Das ist natürlich recht unübersichtlich.
          Üblicherweise findet man den gleichen Betrag in der nächsten Spalte (Soll und Haben) tw. 1 oder 7 Tage zeitversetzt (Spalte Datum).
          Einige Werte kommen aber leider nur in einer Spalte vor weil die Gegenbuchungen fehlen. Diese fehlenden Gegenbuchungen gilt es zu finden (filtern).
          An für sich wäre das einfach zu lösen mit SVERWEIS > Gleiche Werte in zwei oder mehreren Spalten finden
          Die Herausforderung wäre hier aber, dass bei eventuell mehreren gleichen Beträgen die jeweils zeitnah passenden Werte gefunden werden sodass bei eventuell 5 gleichen Werten der eine Wert wo die Gegenbuchung fehlt mit dem richtig dazugehörendem Datum gefunden wird.

          Leider werden beim Download nach Excel die Werte (Soll und Haben) aber nur noch in einer Spalte gezeigt. Der Habenbetrag wird nun mit einem Minuszeichen dargestellt.

          Hier ein Beispiel:
          14.10.2016 1360 1220 2226,79 2226,79 Paypal an Bank
          17.10.2016 1360 1200 -2226,79 PayPal Europe S.a.r.l.

          Jetzt brauche ich für SVER’WEIS aber eine zweite Spalte damit man die nur einmal vorkommenden Werte finden kann. Beim Filtern muss der gleiche (zeitnahe) Wert mit Minus gefunden werden.
          Ich habe nun die Spalte kopiert und durch Formel das Minus entfernt. Durch Abgleich mit der Orginalspalte kann ich dann die Zeilen mit den gleichen Werten (plus und minus) manuell löschen. So finde ich die übrigbleibenden einzelnen Werte. Aber das ganze ist so sehr zeitaufwendig und man kann schnell.die falschen Zeilen löschen.

          Ich suche eine wesentlich effizientere Lösung z.B. mit Filter, sodass nur noch die übrigbleibenden einzelnen Werte gezeigt werden.

          Ich hoffe, dass Du mir eine wesentlich effizientere Lösung zeigen kannst.

          Bis dahin viele Grüße
          Martin

  • Sandy

    Hallo Martin,
    das sind drei sehr tolle Ansätze und der 3. ist für mich am interessantesten.
    Allerdings will es nicht so recht klappen und ich benötige doch Hilfe!
    Ich habe jedes Quartal eine Liste mit Mitarbeiternamen welche angeschrieben werden müssen, um ein doppeltes Anschreiben zu vermeiden muss ich diese mit der Vorgängerliste auf evtl. Doppelungen abgleichen.
    Eindeutige Zuordnung ist über die PersonalNr. möglich. Die Doppelungen hätte ich gern farbig gekennzeichnet so das ich mir diese rausfiltern kann.
    Der Abgleich findet anhand von zwei Excel-Tabellen statt.
    Was empfiehlst du mir?

    • Martin Weiß Autor des Beitrags

      Hallo Sandy,

      meine Empfehlung wäre, alle Quartals-Listen in eine einzige große Tabelle zu kopieren. Zur Unterscheidung kannst Du ja das Quartal in einer separaten Spalte kennzeichnen. Da dann alle Daten in einer Tabelle sind, kannst Du die im Artikel beschriebenen bedingten Formatierungen anwenden.

      Schöne Grüße,
      Martin