平均 mean

投稿者: | 2022-07-21

https://deepage.net/features/pandas-mean.html#nan値を無視しない

  • skipna=True
    • 欠損値を無視して、それ以外で平均値を出す
  • skipna=False
    • 欠損値を無視しない
    • NaNが1つでも含まれていると平均値はNaNになる(計算されない)
  • numeric_only=True
    • データ型がfloat,int,boolのみで平均値を計算する
    • Falseの場合、全ての型で計算できないか試みる

例)列Dは実は文字列、列BにはNaNあり

そのままmeanすると、列で計算される。
列BのNaNは除いて平均値がでる。またC列は文字列のため計算されない。
列Dは文字列「123456」÷6で計算されてしまう

skipna=Falseだと、平均値はNaNになる(計算されない)

numeric_only=Trueにすると、float,int,boolのみ計算されるため、見た目が数値で実は文字列だった場合の混乱を避けることが出来る