ダミー変数 get_dummies(途中)

投稿者: | 2022-07-21

https://note.nkmk.me/python-pandas-get-dummies/

  • カテゴリの値ごとに項目をわけて保持し、データが該当する項目に1、それ以外の項目に0を付与するなどして作成した変数を「ダミー変数」と呼ぶ
  • 例)顧客データの性別コード(gender_cd)をダミー変数化し、顧客ID(customer_id)とともに表示

① pd.get_dummies( データフレーム, ダミー変数化する項目 )

② pd.get_dummies( データフレーム, ダミー変数化する項目,
drop_first = True, prefix = 〜, prefix_sep = 〜)

  • drop_first :

変更前

pd.get_dummies(df_customer[['customer_id', 'gender_cd']], columns=['gender_cd'])