Ein Kollege ist heute über etwas merkwürdiges gestolpert:
Sein Script soll Daten aus einer UTF-8-Tabelle ausgeben in eine CSV-Datei. Die ersten Ergebnisse wollte er dann überprüfen und hat die erzeugte csv-Datei dann aber nicht mit einem Texteditor angeschaut, sondern hat sie bequemerweise per Doppelklick in Excel geöffnet.
Nachdem dort alle Sonderzeichen falsch dargestellt wurden, hat er den Fehler im Script gesucht - ich kam selbst erst ne halbe Stunde nach Beginn der Mithilfe auf die Idee, das Ding in Notepad++ aufzumachen. Ergebnis: Alles ok.
Das Problem lag und liegt einfach darin, dass Excel die csv-Daten als Ansi-codiert betrachtet, die Kodierung also nicht ausliest und auch nicht abfragt. (Open-Office-Calc bietet z.B. einen Dialog an.)
Hat jemand eine Idee, wie man dem Excel beibringt, UTF-8-csv-Dateien richtig einzulesen? Ich kann leider nicht herumexperimentieren, da ich nur OO hier habe (Kollege ist 500 km entfernt).
PS: Umwandeln der csv in Ansi kommt nicht in Frage
Sein Script soll Daten aus einer UTF-8-Tabelle ausgeben in eine CSV-Datei. Die ersten Ergebnisse wollte er dann überprüfen und hat die erzeugte csv-Datei dann aber nicht mit einem Texteditor angeschaut, sondern hat sie bequemerweise per Doppelklick in Excel geöffnet.
Nachdem dort alle Sonderzeichen falsch dargestellt wurden, hat er den Fehler im Script gesucht - ich kam selbst erst ne halbe Stunde nach Beginn der Mithilfe auf die Idee, das Ding in Notepad++ aufzumachen. Ergebnis: Alles ok.
Das Problem lag und liegt einfach darin, dass Excel die csv-Daten als Ansi-codiert betrachtet, die Kodierung also nicht ausliest und auch nicht abfragt. (Open-Office-Calc bietet z.B. einen Dialog an.)
Hat jemand eine Idee, wie man dem Excel beibringt, UTF-8-csv-Dateien richtig einzulesen? Ich kann leider nicht herumexperimentieren, da ich nur OO hier habe (Kollege ist 500 km entfernt).
PS: Umwandeln der csv in Ansi kommt nicht in Frage

Kommentar