Encoding Tests
CSV test files in UTF-8 (no BOM), UTF-8 with BOM, Shift_JIS, and CP932. For mojibake debugging and CSV import testing. Includes Japanese rows.
UTF-8(BOMなし)のCSVテストファイル
utf8.csv / 659 B
UTF-8 BOM付きのCSVテストファイル
utf8-bom.csv / 662 B
Shift_JISのCSVテストファイル
sjis.csv / 514 B
CP932(機種依存文字含む)のCSVテストファイル
cp932.csv / 518 B
Bedeutung des Zeichencode-Tests
Bei der Verarbeitung von <code>CSV</code>-Dateien mit japanischen Zeichen tritt Zeichenkorruption durch Kodierungsunterschiede häufig auf. Die Unterstützung variiert je nach Tool, z. B. wird <code>UTF-8</code> mit BOM beim Import in Excel empfohlen.
Verwenden Sie diese Testdateien, um zu überprüfen, ob die CSV-Importfunktion und Textverarbeitungsbibliotheken verschiedene Zeichenkodierungen korrekt verarbeiten können.
Merkmale der Hauptzeichencodes
- UTF-8: Am häufigsten. Standard in den meisten Programmiersprachen.
- UTF-8 BOM: Empfohlen beim Öffnen von CSV in japanischer Sprache in Excel. Hat 3 Bytes von EF BB BF am Anfang.
- Shift_JIS: Weit verbreitet in Windows-Umgebungen. Einige Zeichen (wie 〜, −, usw.) können Probleme verursachen.
- CP932: Erweiterte Version von Shift_JIS. Unterstützt gerätespezifische Zeichen wie 髙, 﨑 und Hakkenklammern.