Stolperfallen beim Textimport 4

Die "Intelligenz" von Excel beim Textimport austricksen
 

Oft muss man in Excel Listen weiterverarbeiten, die mit anderen Programmen erzeugt wurden und nur im Textformat vorliegen. Das ist im Normalfall auch kein großes Problem, da Excel z.B. Textdateien im CSV-Format (CSV = comma separated value; durch Komma getrennte Werte) wunderbar einlesen und ohne großes Nachfragen auch gleich schön in die richtigen Spalten aufteilen kann.

Zumindestes meistens.

Manchmal ist Excel jedoch ein wenig zu schlau und wandelt Postleitzahlen einfach in Werte um, und schneidet dabei etwaige führenden Nullen einfach ab. Oder aber es wird die Zeichencodierung der Quelldatei nicht richtig erkannt, was zu unschönen Ergebnissen bei Umlauten führen kann.

Mit etwas “Gewußt wie” lässt sich dieses Problem aber leicht umgehen.

Und so geht’s:

Standard-Import einer Textdatei

Ich habe für unser Beispiel eine Postleitzahlendatei vorbereitet. Die Datei enthält alle deutschen Städte mit ihren Postleitzahlen und den dazugehörigen Bundesländern. Sie liegt praktischerweise im CSV-Format vor, die einzelen Spalten sind durch ein Semikolon getrennt.

So sieht die Original-Datei in einem Texteditor aus:

Quelldatei im CSV-Format

Quelldatei im CSV-Format

Über den normalen “Datei-Öffnen”-Dialog importiert Excel die Textdatei ohne Rückfragen, was in unserem Beispiel zu folgendem Ergebnis führt:

Fehlerhaft importierte CSV-Datei

Fehlerhaft importierte CSV-Datei

Das Problem mit den abgeschnittenen Nullen habe ich eingangs schon erwähnt. Dazu kommt, dass die Quelldatei in einem Unicode-Format vorliegt (UTF-8), Excel aber einfach das ANSI-Format annimmt und daher die Umlaute nicht richtig darstellt.

Korrekter Import einer Textdatei

Beim importieren einer CSV-Datei hat man keine Möglichkeit, in irgendeiner Weise einzugreifen. Liegt die Quelldatei aber mit der Dateiendung TXT vor, sieht es gleich ganz anders aus. Es reicht dazu, die vorhandene Datei von PLZ-Liste.csv in PLZ-Liste.txt umzubenennen.

Datei umbenennen in TXT

Datei umbenennen in TXT

Nun startet Excel beim Öffnen nämlich den sogenannten Textkonvertierungs-Assistenten:

Textkonvertierung Schritt 1

Textkonvertierung Schritt 1

Wie man in diesem Bild gut sieht, wählt Excel standardmäßig das Windows-ANSI-Format, was zu den Darstellungsproblemen bei den Umlauten führt. Wir ändern also stattdessen dass Unicode-Format (UTF-8) aus. Tipp: Wenn man nicht genau weiß, was das richtige Format ist, dann probiert man einfach ein paar der angebotenen Einträge aus. In der Vorschau sieht man sofort, ob die Umlaute richtig angezeigt werden:

Textkonvertierung Schritt 1 (angepasst)

Textkonvertierung Schritt 1 (angepasst)

Im zweiten Schritt wird nun das richtige Trennzeichen ausgewählt, in unserem Beispiel also das Semikolon. Damit wird in der Vorschau sofort die richtige Spalteneinteilung angezeigt.
Tipp: Wenn mal eine Datei mit einem exotischen Trennzeichen vorliegt, dann kann man im Feld “Andere:” einfach dieses Zeichen eintragen.

Textkonvertierung Schritt 2

Textkonvertierung Schritt 2

Und im dritten und letzten Schritt müssen wir noch das Format für die PLZ-Spalte ändern, und zwar von “Standard” auf “Text”:

Textkonvertierung Schritt 3

Textkonvertierung Schritt 3

Fertig ist der Import! Da wir die PLZ-Spalte als Textformat definiert haben, werden die Postleitzahlen nun auch mit der führenden Null angezeigt. Und die Umlaute stimmen jetzt ebenfalls.

Hier nochmal die beiden Versionen im Vergleich:

Vorher-Nachher-Vergleich

Vorher-Nachher-Vergleich

Das könnte dich auch interessieren:

Und immer daran denken: Excel beißt nicht!

P.S. Die Lösung ist immer einfach. Man muss sie nur finden.
(Alexander Solschenizyn)

P.P.S. Das Problem sitzt meistens vor dem Computer.



Kommentar erstellen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

4 Gedanken zu “Stolperfallen beim Textimport

  • Kroetchen73

    Hallo,
    wir haben das Problem, dass eine Tab-Stopp getrennte txt Datei in Excel mit den Anführungszeichen angezeigt wird. Diese sollen nachher natürlich nicht mehr angezeigt werden, sondern jeder einzelne Inhalt in einer separaten Spalte. Wie bekommen wir die Anführungszeichen weg und die Inhalte dann in den richtigen Spalten (nicht in jeder Zeile ist auch Inhalt für jede Spalte enthalten). Wir haben in dem Assistenten alle möglichen Variationen angeklickt, aber letztendlich ohne Erfolg. Die Anführungszeichen (insbesondere bei der Artikel-Nummer) gehen nicht weg…. Kann mir hier jemand weiter helfen?

    • Martin Weiß Beitragsautor

      Hallo,

      wenn der Datenkonvertierungsassistent wirklich keine vernünftige Einstellung ermöglicht, dann bleibt zum Schluss noch die ganz banale Funktion mit Suchen und Ersetzen.
      Das heißt, suchen nach Anführungszeichen, ersetzen durch (leeres Feld).

      Grüße,
      Martin