【Python】pandasのデータフレームの行・列を追加する方法

今回はDataFrameの行や列を追加・削除する方法を紹介します。リストや配列、Seriesを使うことで可能になります。

列の追加に関するドキュメントはコチラ

DataFrameの作成方法は以下の記事をご覧ください

関連記事

データ分析ではPythonのpandasが有名ですよね。とくに大量のデータを処理できるデータフレーム(DataFrame)は使いこなせると便利です。 そこで今回は、データフレームの作成方法を紹介していきたいと思います。 [it[…]

以下では次のDataFrameに対して処理を行っていきます。このコードはGoogle Colaboratoryやjupyter notebook、jupyter lab上で実行できます。

元のデータフレーム

行・列の追加

列を末尾に追加

  • 列名を指定する
  • 全行に同じ値を追加できる
  • リストや配列は行数と同じ長さにする
  • Seriesはindexを指定すると好きな行に追加できる
列を追加したデータフレーム

9列目のように1列目と2列目の値の和を追加することも可能です。

行を末尾に追加

  • .locメソッドを使って行名を指定する
  • 全行に同じ値を追加できる
  • リストや配列は列数と同じ長さにする
  • Seriesはindexを指定すると好きな列に追加できる

列に追加するときも、行に追加するときもSeriesを使う場合はindex引数で場所を指定します。column引数はありません。

行を追加したデータフレーム

9行目のように1行目と2行目の和を考えることも可能です。このときデータ型は自動で処理されます。1,2列の和はfloat(小数)で計算されて、30.00、110.00となていますが、3列目はstr文字列の和なのでabと結合されています。

今回は和なので数値でも文字列でも処理できましたが、一般にデータ型が異なる場合は他の演算(差・商・積)を行うとエラーになるので注意が必要です。

DataFrameのデータ型に関する記事は近日公開予定です。

まとめ

いかがでしたか?

今回はDataFrameに行や列を追加する方法を紹介しました。基本的には行名や列名を指定してリストや配列を渡してあげると完結ですね

特に、Seriesでindexを指定すると特定の場所に要素を追加できるので便利ですから覚えておきたいですね。