【pandas】csvの読み込みと出力(read_csv・to_csvの基本まとめ)

pandasにはcsvの読み込みや出力の機能がありとても便利です。

そこで、今回は読み込みに使うread_csv関数と出力に使うto_csv関数の基本的な使い方をまとめていきたいと思います。

どちらの関数も似たような使い方なのですぐに理解できます。

csvを読み込む方法

  • read_csv関数を使う
  • 日本語が含まれるファイルの読み込みにはencodingを使用

read_csv関数でよく使う引数

pandasのread_csvの公式サイトはコチラ

引数デフォルト値意味
filepath_or_buffer必須引数csvのファイルパスやURLを渡します。
sep','区切り文字を渡しますが、csvの読み込みなら変更不要。
dtypeNone整数(int)や小数(float)などのデータ型を指定できる。
dictで列ごとに個別に指定することも可能。
列にNaNがあるときint型は指定できない
convertersが優先される。
encodingNone読み込むときの文字コードを指定する。
日本語を含むcsvなら'utf_8''shift_jis''cp932'などを使用

このほかにもたくさんの引数があります。

欠損や空白、日付の処理など様々なことができます。

以下の記事ではread_csv関数の全52個の引数をまとめています。

関連記事

pandasでcsvをDataFrameとして読み込めるととっても便利ですよね。 ですが、ただ読み込むだけでなく、indexや読み込む行列を指定したり、欠損値を処理したりいろんなことができるとなお便利です。 そこで、この記事で[…]

以下のcsvファイルを使って開いてみます。

csvファイルの読み込み

ファイルパスを指定するだけでも開けますが、日本語が含まれる場合はencodingを指定しないと文字化けの原因になります。

'utf_8''shift_jis''cp932'のどれかで開けるはずです。

csvに出力する方法

  • to_csv関数を使う
  • 日本語を含むときはencodingを使用

to_csv関数でよく使く引数

pandasのto_csvの公式サイトはコチラ

引数デフォルト値意味
filepath_or_buffer必須引数保存先のディレクトリとファイル名を渡します。
拡張子(.csv)を忘れずにつけましょう。
sep','区切り文字を渡しますが、csvの読み込みなら変更不要。
dtypeNone整数(int)や小数(float)などのデータ型を指定できる。
dictで列ごとに個別に指定することも可能。
列にNaNがあるときint型は指定できない
convertersが優先される。
encodingNone読み込むときの文字コードを指定する。
日本語を含むcsvなら'utf_8''shift_jis''cp932'などを使用

出力のときは以下のように書きます。

出力したファイルの保存先は filepath_or_buffer に指定できます。

ファイルパスやディレクトリを理解しておく必要があります。

それらは以下の記事に詳しくまとめています。

関連記事

パソコンを使ったことがあるのなら一度は聞いたことがあるとは追うこれらの言葉「ファイル・フォルダ・ディレクトリ」の違いを説明していきたいと思います。 本棚に本がたくさん入っているようにフォルダ(ディレクトリ)の中にファイルが入っている[…]

関連記事

今回は「ルートディレクトリ・カレントディレクトリ・ファイルパス」の説明をします。 もし、「ディレクトリ」という言葉が分からない場合は下の記事をご覧ください。 [sitecard subtitle=関連記事 url="https[…]

まとめ

今回はcsvファイルの読み込みと出力をまとめました。

特に読み込みのときは、様々な引数を使うことで欠損の処理や日付の処理などができます。詳しくは以下の記事でまとめています。

関連記事

csvをDataFrameとして読み込むときに日付の処理ができると便利ですよね。 この記事では、Pythonのpandasでread_csv関数の日付に関する処理を紹介してきます。 ほかのread_csv関数の引数は以下の記事[…]

関連記事

pandasでcsvをDataFrameとして読み込めるととっても便利ですよね。 ですが、ただ読み込むだけでなく、indexや読み込む行列を指定したり、欠損値を処理したりいろんなことができるとなお便利です。 そこで、この記事で[…]