投稿者「WP_MIWA_KY」のアーカイブ

.pyスクリプトの実行、シバン行、バッチ

.pyスクリプトの実行方法 Pythonランチャー（py.exe）バッチファイル（.bat） Macの場合 python.exeのインストール場所シバン行で直接実行する cf. シバンはモジュールを実装するときには不… 続きを読む »

仮想環境

前提参考URL 仮想環境の作成注意点：作成された仮想環境のディレクトリは隠しファイル（.ディレクトリ名）になっている手順概要 macOS Windows 仮想環境の切り替え mac Windows コマンドプロンプ… 続きを読む »

ライブラリのディレクトリ構成

ライブラリの格納ディレクトリ 3種類のライブラリがある標準ライブラリディレクトリ site-packageディレクトリユーザー別site-packagesディレクトリ種類 Unix系OS Windows 標準ライブ… 続きを読む »

例外処理

例外処理まとめ（GoogleDoc）例外処理まとめ

桁数、文字数指定、位置揃え、ゼロ埋め、など

USAGE 数値の出力桁数を指定する数値に桁区切りを入れる表示する文字数を指定する文字のアラインメント（位置揃え）ゼロパディング参考）zfill fromat と f文字列での桁数表記 num = 99.12… 続きを読む »

east_asian_width()

len()は文字列の長さを返すため、全角も半角も同じ1文字でカウントする文字列の幅を求める基準としては使えない east_asian_width()の戻り値戻り値説明 F Fullwidht：全角文字 H Half… 続きを読む »

テキスト（文字列）操作

行に分割するスペース文字で分割する生徒と点数の間はスペースがあるカンマで分割する計算する文字列を数値に変換する必要がある printでカンマなどで連結して使った場合、変なスペースが入る（※箇所）フォーマット済… 続きを読む »

スクレイピング・1

メニューを取得投稿データを書き込む（CSV）

pyautoguiでコロンやアスタリスクが入力不可

以下のファイルを修正する PATAHは読み替える参考HP：https://ninthcode.net/211003-pyautogui/ import sys > sys.executable でPythonのイ… 続きを読む »

データをCSVに格納する

ファイルを作成し、書き込む HTMLテーブルを読み込んでCSVで書き出す <手順＞ TABLE構造 editors.csv Webから文字列で取得し、StringIOオブジェクトでラップすればファイルとして扱える … 続きを読む »

to_csvのオプション（クォート設定）

note.nkmk.meよりクォートを付けてCSVファイルを書き込むクォート設定を行って書き出す to_csvのクォート設定定数説明 csv.QUOTE_MNIMAL 「特別な文字」が含まれる場合のみダブルクォー… 続きを読む »

read_csvのオプション

オプション使用例内容備考 sep or delimiter sep=’\t’ 指定文字で区切って読み込む header header=Noneheader=1 ヘッダー行を指定… 続きを読む »

Jupyter Widgets

https://ipywidgets.readthedocs.io/en/latest/index.html ToggleButton CheckBox Dropdown RadioButtons With dynami… 続きを読む »

データの揺れ

Python実践データ分析100本ノック第2章より商品名の揺れ現状のユニークアイテム一覧半角全角スペース、大文字小文字の混在を解消する金額欠損値の補完今回の流れ欠損値の場所を特定その商品名を取得（ユニークで… 続きを読む »

pandasは賢いので列に数値と文字列が混在すると、その数値もオブジェクトとして出力してしまう

dfの後方の列を先頭に移動する

三項演算子でif文を1行で書く

参考HP：note.nkmk.me 通常のif文三項演算子を使ったif文 ①条件によって、値を切り替える場合 ②条件によって、処理を切り替える場合 ③値を返さない式（Noneを返す式）でもよい ④複数の条件式を論理演算… 続きを読む »

JupyterからPDF→Typora→WPアップ方法

以前、Chromeを利用していたときは、JupyterからHTML出力＞Chromeで開き、それをPDF化していた。しかしあまりにも重いため、Safariを使用。その時のPDF出力方法を記載。ただPDFの文字サイズが大き… 続きを読む »

二分探索

検索するリストは昇順で並び替えておく線形探索に比べ、激速い

Regex末尾のカンマを取り除く

末尾のカンマを取り除く列数が異なるCSVをPandasで取得。その後、末尾のカンマを取り除く正規表現列数が異なるCSVをpandasで呼び込む際、列名を作って強制的に読み込むと最大列数に不足する行にはカンマが付与さ… 続きを読む »

Jupyter環境構築・作業フォルダの変更

jupyter notebookの起動ディレクトリを変更するすでにJNを利用している場合、以下フォルダの「jupyter_notebook_config.py」ファイルを修正する（またはjupyter_lab_conf… 続きを読む »

Python環境構築・PATHを通す

Windwos版 PATHの通し方 PATHを通してないと以下のエラーが発生する「’Python’は、内部コマンドまたは外部コマンド、操作可能なプログラムまたはバッチファイルとして認識されていません」 PATHを通す… 続きを読む »

条件に応じて値を代入（iloc, where, mask）

Sファイルの個人情報を削除する

Selenium CSSセレクタ・XPath早見表

selen の最初の書き出し。忘れがち。 https://www.selenium.dev/documentation/webdriver/ MEMO ブラウザを操作するには基本の型プロセスを殺す前提知識（HTML… 続きを読む »

Seleniumを終了する

終了と閉じる終了こちらが大事 quiteではない閉じるアクティブな現在のタブを閉じるプロセス終了のため最終的にはquit()する必要がある順番的には、close()→quit() プロセスが終了されたか確認す… 続きを読む »

Selenium準備編

Seleniumに必要なもの動作確認 WebDriverの起動許可（Mac）ブラウザの操作テスト

pyAutoGui 基本

基本マウス操作マウスの移動（絶対座標）メソッド説明 pag.easeInQuad 開始は遅く、終了は早く pag.easeOutQuad 開始は早く、終了遅く pag.easeInOutQuad 開始と終了は早く… 続きを読む »

TyporaからWordPressへの投稿方法

Typeoraの設定「Typora」→「設定」より起動時のフォルダ起動時のフォルダを以下に設定画像の保存場所起動時フォルダが上記の場合、画像フォルダは「./Markdown/${filename}.assets… 続きを読む »

クロス集計 crosstab

pd.crosstab(df[‘-‘],df[‘-‘],) カテゴリデータ（カテゴリカルデータ、質的データ）のカテゴリごとのサンプル数（出現回数・頻度）の算出などが可能。 … 続きを読む »

2つのDFの差異（pd.isin、todict、all）

参考HP pd.isin()、todict()、all()を利用すれば出力可能 df1.isin(df2)としてしまうと、同じ行列であれば突合可能（＝compare）しかし、2つのDFの行数や列数（行名、列名）が違うと… 続きを読む »

from glob import glob

型混在・強制的に数値やNaNに変換 to_numeric()

型が混在するケース混在なしの場合（列:int）文字列（文字列の空白含む）が混在（列:int） NaNが混在する場合（列:int） NaNが混在する場合（列:str）列を全て int に変換 pd.to_numeri… 続きを読む »

重たいCSVの先頭だけをチラ見したいとき

2つのDataFrameを比較する

2つのDFを比較するには「この」の方法がベストただし、2つのDFの列名はあわせておく必要あり比較する列を切り出しておくとよい理由：他列に余計なNaNや文字列が含まれていると比較できないためあくまで比較したい列だけ… 続きを読む »

A value is trying to be a set on a copy of a slice from a DataFrame.

スライスのコピー参考HP：https://note.nkmk.me/python-pandas-setting-with-copy-warning/https://note.nkmk.me/python-pandas-… 続きを読む »

メモリ使用量の削減

正確なメモリ使用量を表示させる object型が含まれる場合、メモリ使用量は正確に表示されない df.info()またはdf.memory_usage()にオプションを付与すれば表示可能 df.info(memory_u… 続きを読む »

日付の加工

サンプル作成 DatetimeIndexに変換年、月を追加年度を追加

Styler.format

Styler.format(　formatter=None,　subset=None,　na_rep=None,　precision=None,　decimal=’.’,　thousands=No… 続きを読む »

pandas 条件抽出

query サンプルCSV 主な条件抽出の記法上：Booleanインデックス法（Boolean選択法）下：クエリー欠損値NaNがある場合の注意点 NoneやNanがある列に対して文字列メソッドを適用して条件とすると… 続きを読む »

pandas オプション設定

参考HP：pandasのオプション設定を確認・変更する方法 Jupyter labの行列の最大値を設定するデフォルトに戻す

概要表示のため、ちょっとしたDFを作成したい

DataFrameの作り方６種（理解してないとだめ）参考HP：https://www.self-study-blog.com/dokugaku/python-pandas-dataframe-make/ サンプルデータ… 続きを読む »

pandas スタイル・フォーマット

メモ： TODO: Seriesに対して桁区切りとかはできるのか？ # %の列を追加 df[‘件数_%’] = df[‘顧客コード’] / df[‘顧客コード’].sum() # 列名を変更 df.rename(colu… 続きを読む »

pandas 行や列の削除 – df.drop()

行を削除(行名で指定) 行を削除(行番で指定) 列を削除(列名で指定) 列を削除(列番で指定) 行と列を同時に削除

duplicated、drop_duplicates（重複）

重複行をすべて確認したい場合 duplicatedはデフォルトでは、最初の値「以外」を重複（True）として扱う重複した行をすべてを表示させたい場合は、keep=False（カンマ不要）をセットする sort_valu… 続きを読む »

pandasの「型」

型を確認する（df.dtypes）型を変換する読み込み時（dtype）一括変換列ごとに変換読み込み後（astype）注意：元のDataFrameは変更されない一括変換列ごとに変換インデックスの型を変換し… 続きを読む »

データ概要確認

基本 df.isnull().any() は、DF全体で欠損値があるかないか（Boolean）型を確認特定の型の列名を表示各列に含まれるユニークな要素の数ある列の要素ごとの件数

matplotlib 日本語設定など

japanize_matplotlib

read_csv時に日付の列をdatetime型に変換

デフォルトこのようなCSVをread_csvで読み込む際、datetime型で読み込みたい（デフォルトだとobject型で読み込まれる）デフォルトで読み込むとobject型となる parse_dates=[] par… 続きを読む »

サイズ大CSVを、chunkサイズで読み込む

手法1 手法2

サンプルDF作成・出力、フォルダ内のpklファイルを全結合

サンプルDFを作成後、pklで出力するフォルダ内のpklファイルを全結合（concat）一部エリアの売上を集計

condaとpip（古い）

conda conda list conda search conda config conda info conda install パッケージのインストール conda update パッケージの更新 c… 続きを読む »

乱数発生

cumsum()を利用すると折線などのグラフデータが作成しやすい一様乱数乱数（標準正規分布）乱数（整数）一次元の複数個のndarrayは工夫が必要（？）同じ乱数を使いたい（seed）

STYLE関数

Jupyterより未まとめ

Jupter labで日本語PDF出力

変更前：Export Notebook As…>PDF で出力しても日本語が抜ける参考HP 以下のファイルを修正するだけ /Users/*****/opt/anaconda3/share/jupyte… 続きを読む »

unique

Series.unique() Series.value_counts() pandas.Series.nunique()pandas.DataFrame.nunique() pandas.Series.nunique(… 続きを読む »

merge と join

・2つのDataFrameの連結において・merge()とjoin()なら、汎用的なmerge()を使ったほうが良い・merge()は、pd.merge()のほうが使いやすそう（df.merge()より）・キーに列… 続きを読む »

JupyterでDataFrameを横並びにする

cookbook P256に記載の方法ではDF同士がふっついてしまいNG（？）以下でよい → 参考HP

内包表記による複数ファイル読み込み

9 pandasオブジェクトの結合

データ結合の種類【77】DataFrameに新たな行を追加 locインデクサ appendメソッドカラム名を書き出す 1000行をappendする【78】複数のDataFrameを接合 concat 縦にそのまま連… 続きを読む »

サンプルDataFrameを作成

DataFrameをつくるここがわかりやすい：【Python】pandasのデータフレームを作成する方法6つ関連記事：サンプルDF作成・出力、フォルダ内のpklファイルを全結合 df = pd.DataFrame(*… 続きを読む »

月	火	水	木	金	土	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31