Excel in CSV mit UTF8-Codierung
Ich habe eine Excel-Datei, die hat ein paar Spanische Zeichen (Tilden, etc.) muss ich umwandeln in eine CSV-Datei als eine Datei importieren. Allerdings, wenn ich Als CSV Speichern es verstümmelt das "spezielle" Spanische Zeichen, die nicht ASCII-Zeichen. Es scheint auch, dies zu tun mit der linken und rechten Zitate und lange Striche, die angezeigt werden, stammen von den ursprünglichen Benutzer erstellen der Excel-Datei in Mac.
Da CSV ist nur eine text-Datei, die ich bin sicher, es kann mit einem UTF8-Codierung, so dass ich vermute, es ist eine Einschränkung in Excel, aber ich bin auf der Suche nach einem Weg, um aus Excel -, CSV-und halten Sie die nicht-ASCII-Zeichen intakt.
InformationsquelleAutor der Frage Jeff Treuting | 2010-11-19
Du musst angemeldet sein, um einen Kommentar abzugeben.
Eine einfache Lösung ist die Verwendung von Google-Tabelle. Einfügen (nur Werte, wenn Sie mit komplexen Formeln) oder importieren Sie das Blatt dann download CSV. Ich habe gerade versucht ein paar Zeichen und es funktioniert ziemlich gut.
HINWEIS: Google Sheets hat Einschränkungen beim Import. Sehen hier.
HINWEIS: Seien Sie vorsichtig mit sensiblen Daten mit Google Sheets.
EDIT: Eine andere alternative - im Grunde Sie verwenden VB-makro oder add-ins zu zwingen, den speichern als UTF8. Ich habe nicht versucht, eine dieser Lösungen, aber Sie klingt vernünftig.
InformationsquelleAutor der Antwort nevets1219
Habe ich gefunden OpenOffice's Tabellenkalkulation, Calc, ist wirklich gut im Umgang mit CSV-Daten.
In der "Speichern unter..." - dialog, klicken Sie auf "Format-Optionen", um die verschiedenen Kodierungen für die CSV. LibreOffice auf die gleiche Weise funktioniert, soweit ich weiß.
InformationsquelleAutor der Antwort aendrew
Speichern Sie die Excel-Blatt als "Unicode-Text (.txt)". Die gute Nachricht ist, dass alle internationalen Zeichen in UTF16 (beachten Sie, nicht in UTF8). Allerdings, das neue "*.txt" - Datei (TAB getrennt, nicht durch Kommas getrennt, und daher ist kein echtes CSV.
(optional), es sei denn, Sie können eine tabulatorgetrennte Datei zu importieren, verwenden Sie Ihre Lieblings-text-editor und ersetzen Sie die TAB-Zeichen mit Komma ",".
Importieren *.txt-Datei in die Ziel-Anwendung. Stellen Sie sicher, kann es akzeptieren, im UTF16-format.
Wenn UTF-16 korrekt umgesetzt mit Unterstützung für nicht-BMP-code-Punkte, können Sie konvertieren Sie einen UTF-16-Datei zu UTF-8 ohne Informationen zu verlieren. Ich überlasse es Ihnen, Ihre Lieblings-Methode, dies zu tun.
I verwenden Sie dieses Verfahren zum importieren von Daten aus Excel in Moodle.
InformationsquelleAutor der Antwort elomage
Ich weiß, das ist eine alte Frage, aber ich kam zufällig auf diese Frage, während kämpfen mit den gleichen Fragen wie die OP.
Nicht gefunden haben, keine der angebotenen Lösungen ein gangbarer Weg, den ich zu entdecken, wenn es einen Weg gibt, um dies zu tun, nur mit Excel.
Glücklicherweise habe ich festgestellt, dass die verlorenen Zeichen-Problem passiert nur (in meinem Fall) beim speichern aus xlsx-format in das csv-format. Ich habe versucht, das speichern im xlsx-Datei zu xls zuerst, dann in csv. Es funktionierte tatsächlich.
Bitte versuchen Sie es und sehen, ob es für Sie arbeitet. Viel Glück.
InformationsquelleAutor der Antwort Eric
Können Sie iconv Befehl unter Unix (auch auf Windows-als libiconv).
Nach dem speichern als CSV-Datei unter Excel in der Befehlszeile setzen:
(denken Sie daran, zu ersetzen cp1250 mit Ihrer Codierung).
Arbeitet schnell und ideal für große Dateien wie PLZ-Datenbank, die nicht importiert werden können, zu GoogleDocs (400.000 Zellen-limit).
InformationsquelleAutor der Antwort pmilewski
Nur "der einfache Weg", dies zu tun, ist wie folgt. Erste, erkennen, dass es einen Unterschied gibt zwischen dem, was angezeigt und was verborgen in Excel .csv-Datei.
(1) Öffnen einer Excel-Datei, wo haben Sie die info (.xls -, .xlsx)
(2) In Excel, wählen Sie "CSV (Trennzeichen-getrennt) (*.csv) als Dateityp und speichern unter, Typ.
(3) In NOTEPAD (zu finden unter "Programme" und dann Zubehör im Start-Menü), öffnen Sie die gespeicherte .csv-Datei in Editor
(4) Dann wählen -> Speichern unter..und am unteren Rand des "speichern unter" - box, es gibt ein select-Feld mit der Aufschrift "Codierung". Wählen Sie "UTF-8" (NICHT mit ANSI-oder Sie verlieren alle Akzente etc.). Nach der Auswahl von UTF-8, dann speichern Sie die Datei auf einen leicht anderen Namen als das original.
Diese Datei ist in UTF-8 und behält alle Zeichen und Akzente und kann importiert werden, beispielsweise in MySQL und andere Datenbank-Programme.
Diese Antwort stammt aus dieses forum.
InformationsquelleAutor der Antwort Nick
Anderen, die ich nützlich fand:
"Zahlen" ermöglicht encoding-Einstellungen beim speichern als CSV.
InformationsquelleAutor der Antwort leander
Können Sie dies tun, auf einem modernen Windows-Computer, ohne software von Drittanbietern. Diese Methode ist zuverlässig und es werden Daten behandeln, die beinhaltet, zitiert Kommas, zitiert tab-Zeichen, CJK-Zeichen, etc.
1. Speichern von Excel -
In Excel, speichern Sie die Daten auf
file.txt
mit dem TypUnicode Text (*.txt)
.2. PowerShell Starten
Laufen
powershell
aus dem Start-Menü.3. Laden Sie die Datei in PowerShell
4. Speichern Sie die Daten als CSV -
InformationsquelleAutor der Antwort Don Cruickshank
"nevets1219" ist direkt über Google docs, aber wenn Sie einfach "importieren" die Datei, die es oft nicht konvertieren zu UTF-8.
Aber wenn Sie importieren Sie die CSV in eine vorhandene Google-Tabelle tut es konvertiere zu UTF-8.
Hier ist ein Rezept:
Die resultierende Datei wird in UTF-8
InformationsquelleAutor der Antwort RedYeti
Für diejenigen, die für eine völlig programmatischen (oder zumindest auf server-Seite) Lösung, ich habe großen Erfolg mit catdoc - xls2csv-tool.
Installieren catdoc:
Konvertierung:
Dies ist rasend schnell.
Beachten Sie, dass es wichtig ist, dass Sie die
-d utf-8
Flagge, sonst wird es zu codieren, wird die Ausgabe in die Standard -cp1252
Codierung, und Sie laufen Gefahr, Informationen zu verlieren.Beachten Sie, dass
xls2csv
auch funktioniert nur mit.xls
- Dateien, funktioniert es nicht mit.xlsx
- Dateien.InformationsquelleAutor der Antwort mpowered
Was über die Verwendung von Powershell.
InformationsquelleAutor der Antwort Michael Schau
So lustig wie es scheinen mag, ist die einfachste Möglichkeit, die ich gefunden, um meine 180 MB Tabelle in ein UTF8-CSV-Datei war, wählen Sie die Zellen in Excel, kopieren und einfügen, um den Inhalt der Zwischenablage in SublimeText.
InformationsquelleAutor der Antwort oscaroscar
Ich war nicht in der Lage zu finden, eine VBA-Lösung für dieses problem auf dem Mac Excel. Es gibt einfach zu sein schien, keine Möglichkeit, die Ausgabe in UTF-8-text.
So musste ich schließlich aufgeben, VBA, bit die Kugel und gelernt AppleScript. Es war nicht annähernd so schlimm, wie ich gedacht hatte.
Lösung ist hier beschrieben:
http://talesoftech.blogspot.com/2011/05/excel-on-mac-goodbye-vba-hello.html
InformationsquelleAutor der Antwort anroy
Ausgehend von einer Windows-Umgebung, speichern und die Arbeit mit der Datei wie gewohnt in Excel, aber dann öffnen Sie die gespeicherte Excel-Datei in Gnome-Gnumeric (kostenlos). Speichern Gnome-Gnumeric - Arbeitsblatt als CSV-Datei, die - für mich jedenfalls - speichert es als UTF-8 CSV.
InformationsquelleAutor der Antwort spring_chicken
Einfache Möglichkeit, es zu tun: download open office (hier), laden Sie das Arbeitsblatt und öffnen Sie die excel-Datei (
.xls
oder.xlsx
). Dann einfach speichern Sie Sie als text-CSV-Datei und ein Fenster öffnet sich Fragen, um zu halten das aktuelle format oder speichern als .ODF-format. wählen Sie "halten Sie das aktuelle format" und im neuen Fenster wählen Sie die option, die besser für Sie arbeitet, nach der Sprache, dass Ihre Datei ist geschrieben worden. Für die Spanische Sprache zu wählen Westeuropa (Windows-1252/WinLatin 1
) und die Datei funktioniert Prima. Wenn Sie wählen Sie Unicode (UTF-8
), es ist nicht zur Arbeit gehen, mit den spanischen Zeichen.InformationsquelleAutor der Antwort Yessus
Speichern der xls-Datei (Excel-Datei) als Unicode-text=>Datei wird gespeichert im text-format (.txt)
Format ändern .txt in .csv-Datei (die Datei umbenennen von XYX.txt zu XYX.csv -
InformationsquelleAutor der Antwort Mena
Ich kam auch auf das gleiche problem, aber es gibt eine einfache Lösung für dieses.
Funktioniert es perfekt und eine csv-Datei generiert, die importiert werden können, in jeder software. Ich importierte diese csv-Datei in meine SQLITE-Datenbank und es funktioniert perfekt mit allen unicode-Zeichen intakt.
InformationsquelleAutor der Antwort Krish
Eine zweite option "nevets1219" ist öffnen Sie Ihre CSV-Datei in Notepad++ und eine Konvertierung nach ANSI.
Wählen Sie in der oberen Menüleiste :
Encoding -> Konvertierung in Ansi
InformationsquelleAutor der Antwort SequenceDigitale.com
einfachste Weg:
keine Notwendigkeit, Open office und google docs
andere code-Seite, die Sie möchten
nicht öffnen mit Ms-office sowieso!!!
Jetzt haben Sie eine tab-getrennte CSV-Datei.
InformationsquelleAutor der Antwort Solivan
Ich geschrieben habe ein kleines Python-Skript zum exportieren von Arbeitsblättern in UTF-8.
Den Sie gerade haben, um die Excel-Datei als ersten parameter gefolgt von den Platten, die Sie exportieren möchten. Wenn Sie nicht das Blatt, das Skript exportiert alle Arbeitsblätter in der Excel-Datei.
InformationsquelleAutor der Antwort Julian
Unter Excel 2016, haben wir eine CSV-export-option gewidmet UTF-8-format.
InformationsquelleAutor der Antwort Nolmë Informatique
Excel speichert in der Regel eine csv-Datei als ANSI-Kodierung statt utf-8.
Einer option korrigieren Sie die Datei mit Notepad oder Notepad++:
InformationsquelleAutor der Antwort Jason Williams
Encoding -> Konvertierung in Ansi kodiert es im ANSI - /UNICODE. Utf8 ist eine Teilmenge von Unicode. Vielleicht in ANSI kodiert werden richtig, aber wir reden hier von UTF8, @SequenceDigitale.
Gibt es schnellere Möglichkeiten, wie das exportieren als csv ( Trennzeichen-getrennt ) und dann das öffnen der csv mit Notepad++ ( kostenlos ), dann die Codierung > Konvertieren zu UTF8. Aber nur, wenn Sie haben, dies zu tun einmal pro Datei. Wenn Sie ändern müssen und export fequently, dann ist der beste LibreOffice oder GDocs Lösung.
InformationsquelleAutor der Antwort Lucas
Microsoft Excel verfügt über eine option zum exportieren der Tabelle mit Unicode-Codierung. Siehe folgenden screenshot.
InformationsquelleAutor der Antwort vladaman
öffnen .csv-gut mit notepad++. wenn Sie sehen, Ihre Codierung ist gut (Sie sehen alle Zeichen so wie Sie sein sollten) drücken Sie die Codierung , dann konvertieren zu ANSI
sonst - finden Sie heraus, was ist deine aktuelle Codierung
InformationsquelleAutor der Antwort Marius Gri
andere Lösung ist, die Datei zu öffnen von winword und speichern Sie es als txt speichern und dann wieder öffnen von excel-und es wird funktionieren, ISA
InformationsquelleAutor der Antwort Essam Altantawi
Speichern-Dialog > Extras > Web-Optionen - > Register Kodierung
InformationsquelleAutor der Antwort Elia Weiss
Stieß auf das gleiche problem und gegoogelt aus diesem post. Keiner der oben genannten für mich gearbeitet. Endlich habe ich konvertiert meine Unicode .xls zu .xml (wählen Sie "Speichern unter ..." XML-Kalkulationstabelle 2003) und es produziert den richtigen Charakter. Dann schrieb ich im code zum Parsen der xml-und extrahierte Inhalte für meinen Gebrauch.
InformationsquelleAutor der Antwort Silent Sojourner
Andere Möglichkeit ist, öffnen Sie die UTF-8 CSV-Datei in Notepad, wo es korrekt dargestellt werden.
Ersetzen Sie alle "," mit Registerkarten.
Fügen Sie diese in eine neue excel-Datei.
InformationsquelleAutor der Antwort Martin
Ich habe das gleiche problem und kommen über diese add-in , und es funktioniert hervorragend in excel 2013 neben excel 2007 und 2010, die es erwähnen.
InformationsquelleAutor der Antwort academic.user