CSVのRFC

2007/08/07 12:27:36

カテゴリ

SEもどきのメモ

  • 2007-08-07 公開
  • 2020-10-13 更新

CSVは歴史的に様々な仕様があるが、RFCができている。

目次

RFC

2007-08-07

2020-10-13 追記

  • RFC 7111 としてアップデートがされているとのこと

概要

  • 表形式データをテキストファイルで記述するためのフォーマット
    • 列区切りを , 、行区切りを改行(CrLf)で記述
    • 改行コードはCrLf固定
    • "" でくくった間は改行を含めなんでもあり。" のエスケープは ""
  • MIME タイプは text/csv

関連情報

  • , の代わりにTABで区切ったものが TSV
  • pgadmin3 などでは : 区切りもある

Excel 関連

  • 以前のバージョンのExcelではCSV出力はShift-JISで保存された
  • 最近のExcelでCSV保存を無意識にすると、BOM付きUTF-8 で出力される
    • ファイル形式: CSV UTF-8 (コンマ区切り)がUTF-8、 CSV (コンマ区切り)がShift-JIS
  • Excel で開いた際に自動識別が適切に動作するようにするには、BOM付きUTF-8(改行コードCrLf)もしくはShift-JIS形式にするとうまくいく率が高い

コメント