read_csvのオプション

投稿者: | 2022-02-17

オプション使用例内容備考
sep or delimitersep=’\t’指定文字で区切って読み込む 
headerheader=None
header=1
ヘッダー行を指定しない
ヘッダー行を指定する
 
namesnames=[‘colA’, ‘colB’, ‘colC’]カラム名を指定 
index_colindex_col=’id’インデックスラベルを指定する 
usecolsusecol=[1,3,5]
usecol=[‘colA’, ‘colC’]
読み込む列を指定する 
prefixprefix=’copy_’, header=Noneheader=Noneの場合のみで有効
カラム名が「copy_0, copy_1…」になる
 
dtype①dtype=str
②dtype={‘col_A’: ‘str’, ‘col_C’: ‘int’}
読み込み時に列の型を指定 
skiprows①skiprows=5
②skiprows=[1,3,6]
読み込まない行を指定する
①0~5行を読み込まない
②1,3,6行を読み込まない(start:0)
 
skipfooterskipfooter=2, engine=’pyton’下から除外する行数を指定 
nrowsnrows=5何行目までを読む込む 
na_valuesna_values=[‘-‘]指定記号をNaNとして読み込む
(通常のNaNはそのまま)
 
parse_datesparse_dates=[‘colB’]その列をdatetimeで読み込む 
 thousands thousands=’,’ 3桁区切りを除外
読み込み後はその列はfloat型になる
ただし一部文字列が含まれたりするとうまく変換できないことがある。その場合はコチラを参照