【pandas】DataFrameの最大値・最小値を抽出する方法(max・min・describe)

この記事ではPythonのpandasでDataFrameの最大値や最小値を求める方法を解説していきます。

後半には日付データに関することも書いています。

以下のDataFrameを使います。

最大値と最小値などをまとめて抽出

  • describe関数を使う
  • データ数・平均・最大・最小・標準偏差・四分位数のDataFrameを返す
describeメソッドの戻り値

describe関数の公式ページはコチラ

max・minメソッドを使う方法

  • 最大値はmaxメソッド、最小値はminメソッドを使う。
  • 最大・最小値を格納したSeriesを返す
  • 両方とも使い方は同じ
  • axis=0(デフォルト)で列方向の最大値を求める。
  • axis=1で行方向の最大値を求める。

maxの公式ページはコチラ

minの公式ページはコチラ

列ごとの最大・最小値を求める

行ごとの最大・最小値を求める

全体の最大・最小値を求める

  • max・minメソッドを二回使う
  • intを返す

同じように全体の最小値を求めることも可能です。

日付の最大・最小

以下のDataFrameのbirth列に関して最大と最小を求めてみます。

元のデータフレーム
  • pd.to_datetime関数でdatetime64に変換しています。
  • 日付の最大値は現在日時に最も近い日付を返します。
  • 日付の最小値は現在日時から最も遠い日付を返します。

datetime64でないと文字列として最大と最小が返されるので注意が必要です。

関連記事

Pythonのpandasで平均値や中央値、最頻値を求める方法を紹介します。 今回紹介するメソッドは引数が似ているので使いやすいと思います。 平均値と中央値では以下のDataFrameを使います。 import pand[…]

まとめ

今回は最大と最小の求め方に関して見ていきました。

その他の統計量も一気に求めるならdescribe関数が便利ですね。

今回紹介した関数やメソッドはどれも簡単に使えると思います。

参考になれば幸いです。