VSCODE・JUPYTERショートカット
VSCODE_Win VSCODE_Mac Jupyter lab
VSCODE_Win VSCODE_Mac Jupyter lab
こちらが最新版(テスト前)
□各会社ごとの提供ファイルの仕様を確認 □PDFのPWを解除する ■PDFの各ページを画像として取り出す □画像から対象箇所をマスキングする(OCRもできるはず) ・住所・名前 □その画像をプレビューする(マスキングが正… 続きを読む »
loggingとloggerは区別する 親子を区別する 両者の使い分け ①logging.basicConfig()親 ②logging.StreamHandler()子(ロガー利用時) ③logging.FileHan… 続きを読む »
どんなエラー 例 対策 どう処理すればよいか?
getの置き換え 英単語 想像できる意味 load ファイルなどを読み込みする fetch / retrieve 外部(APIなど)からデータを取得する search 何らかの検索処理(IDでの取得ではなく、条件での取得… 続きを読む »
pyautoguiのインストール 結論 経緯 opencsvのインストール https://self-development.info/pythonで画像認識・画像処理を行なうためにopencvをイン/
ライブラリpython-pptx
例外の種類
例外処理 エラーの階層 https://docs.python.org/ja/3/library/exceptions.html#exception-hierarchy finally else
グローバル変数 グローバル変数とローカル変数 関数内からグローバル変数を書き換える global をつける ローカル変数やグローバル変数を出力する 関数内のローカル変数を出力するlocals()という関数がある 実行する… 続きを読む »
手軽にIPythonで複数行のスクリプトを入力して確認したいときに便利 キーボード操作 Ctrl+O、Ctrl+J、以降 Ctrl+J で複数行に入力可能 ちなみに、readlinesの複数行入力の終了は、Mac:ctr… 続きを読む »
P252
位置引数 キーワード引数 デフォルト引数 デフォルト引数でリストや辞書型を使う場合の注意点 デフォルト引数のlを指定せずに100と入力すると、初回は空リスト[ ]に100が追加される ただし同じことを続けると[100]に… 続きを読む »
一時ファイルを活用する https://docs.python.org/ja/3/library/tempfile.html tempfileをimportすると、そのTemporaryFile関数を使うと、I/Oバッフ… 続きを読む »
CSVファイルへの書き込み WindowsでCSVファイルをopenすると
プログレスバー 進捗の見える化 ポイントはループで利用 for文のin直後にtqdmを加える ループ中にprintがあると表示が大変 ctrl + C で停止 desc=で、バーのタイトルがつく(例の場合「test」) … 続きを読む »
書き込む 読み込む 読み込む(readline) チャンクで読み込む seekで移動 WIndowsの場合は改行コードが2文字分になるため、複数行の文字列をファイルに書き込む場合は ‘newline=\n’ を追加すると… 続きを読む »
fromatメソッドやf-stingを使ってもできるが、Template関数を使った方法は、元となる文字列を読み込み専用にできるというメリットがある 変数sに別の文字列を代入してしまうことを防止できるし、ほかの人が作成し… 続きを読む »
モード’w’でファイルをopenし、書き込み後に中身をみるため読み込もうとするとエラーになるしかし読み込みのためにモードを’r’にしてopenしなおすのも面倒書き込みと読み… 続きを読む »
基本形 df.groupby(グループ分けカラム).agg({集約カラム: 集約関数}) グループ分けカラム データをグループに分割して、計算する単位になる 集約カラム そのカラムのデータ(値)を使って集約される 集約関… 続きを読む »
コメント スプレッドシートOBJ(ss)を取得 シートOBJ(sh)を取得(直接取得) シートOBJ(sh)を取得(ss経由) シートIDの取得 SS名およびsh名の取得 シートのセル範囲を取得 シートの全範囲を取得 範… 続きを読む »
各行の列数が異なるとエラー 解消方法1 解消方法2 または、skiprows や usecols で読み込む範囲を狭めて(構造化された箇所だけを)読み込むやり方でもよい 過去分・算定からNG行だけを取出し、再作成
これはなんだ?Seriesの列名を変更? dfの列名を変更
https://note.nkmk.me/python-pandas-rank/
https://deepage.net/features/pandas-mean.html#nan値を無視しない skipna=True 欠損値を無視して、それ以外で平均値を出す skipna=False 欠損値を無視し… 続きを読む »
https://note.nkmk.me/python-pandas-get-dummies/ カテゴリの値ごとに項目をわけて保持し、データが該当する項目に1、それ以外の項目に0を付与するなどして作成した変数を「ダミー変… 続きを読む »
ある関数に、書き足すことなく機能を追加できる(関数の上書き) 本来は関数中に含めないほうがよいものをデコレーターで処理するなど デコレーターに必要なもの(4つ) *args **kwargs 関数内関数 ←高階関数ともい… 続きを読む »
Noneは特殊な値 NoneはBooleanだとFalseで評価されるが、Falseとは違う意味がある Noneは存在しないを意味する 空の値 ゼロの整数とfloat、空文字列(”)、空リスト([])、空タプル(())… 続きを読む »
ここがわかりやすい– http://ailaby.com/yield/– https://tokitsubaki.com/python-yield-statement/598/ return yi… 続きを読む »
timeitモジュールは小さなコードの計測に便利だが、関数やプログラム全体の分析はcProfileモジュールがよい cProfileモジュールはPythonのプロファイラー(プロファイリングを行うソフト)であり、プログラ… 続きを読む »
線形探索と比べて処理時間が大幅に短くなる(めちゃくちゃ速い) 事前にソートが必要 データが昇順にソートされ並んでいる中から、目的のデータが真ん中より右にあるかを調べる作業を繰り返す。
数学の英語表現https://kimini.online/blog/archives/6479
参考URL IPythonやJupyterで使えるコマンド 「!」を使ったシステムコマンド 「%」を使ったマジックコマンド例 %quickref : マジックコマンド一覧 %pwd:現フォルダ %cd 移動 % cat … 続きを読む »
pythonにはswith文がないため、if〜elifを使う場合がある 実は、辞書を使うと楽になる if~elseを使った場合(よくあるケース) 辞書を使うと… 辞書でgetを使い、辞書になかった場合のデフォ… 続きを読む »
パスが通ってないと、こんなエラーが出る。 importする場所の指定がない場合、pythonはあらかじめ「決まったフォルダ」を探しに行く。 環境変数に登録されたPATHがそれにあたる。 そこにも見つからないため、Modu… 続きを読む »
環境変数pathを確認 pathにmylibを追加する 一時的に登録する これは一時的なものっぽい 削除する場合は「sys.path.remove(~~~~)」 永続的に登録するには環境変数に登録するしかない(下部) 恒… 続きを読む »
ここでやっとわかった 理想の書き方
プロジェクト構成(ゼロから学ぶPythonより) 【図で解説】Python アプリケーション推奨のフォルダ構成(ディレクトリ構成) 【図で解説】Pythonで自作モジュール(or パッケージ)をimportするために知っ… 続きを読む »
関数 def function()のこと モジュール Pythonファイル(.py)を指す。このファイル名がモジュール名になる ただし、モジュールは別のファイルからimportされることを念頭に実装を行う そのため、イン… 続きを読む »
df.empty Series/DataFrameが完全に空の場合はTrueを返す NaNが含まれていると空とはみなさない 空 → True 空でない → False https://pandas.pydata.org/… 続きを読む »
help(引数) 組み込み関数以外は、事前にimportが必要 help() (引数なし) ヘルプユーティリティが起動する 調べたいことを入力すると、 mathのヘルプが表示される manコマンド 基本的な画面操作は以下… 続きを読む »
ファイル数をチェック ファイル名をチェック パターン最新 パターン前回 実行例文
https://teratail.com/questions/6awlnff8pa23e7 メイン テストデータ作成用
pythonファイルで計測 timeit.timeit()にlambda式を使う jupyterで計測する場合はコレ デフォルト値 ループ数(n)を変える 繰り返し数(r)を変える timeの方がわかりやすい?
msoffcrypto pywin32com
MEMO 基本 作業フォルダをつくる→ファイルをコピー→フォルダを開く
同名フォルダがない場合、指定フォルダを作成する 同名フォルダがあった場合、2回警告し、上書きされる(元のデータは消える)
copy2 コピー元:ファイル コピー先:ファイル または フォルダ(内) デフォルトで上書きされる(警告なし) copy2はパーミッションとメタデータ(作成者、作成日、更新日など)もコピーされる copytree コピ… 続きを読む »
例1. Excelのセル(9,1)からセル番地(A9)を取得する coordinate例2. Excelのセル(9,1)からセル番地(A9)を取得する get_column_letter例3. Excelのセル番地(C9… 続きを読む »
書き込み 読み込み
OLD
『データサイエンス100本ノック構造化データ加工編ガイドブック』より 1.ローデータ 2.型変換なしver 3.型変換ありver
列「Country」の[note 9]を除外したい場合
<変更前df> <変更後df>
3桁区切りはCSVデータ読み込み時にthousands=’,’ を使ってfloat型に変換することができるが、一部文字列が含まれたりするとうまく変換できないことがある 以下だと読み込みんだ後で、intに変換することができ… 続きを読む »
参考URL https://note.nkmk.me/python-pandas-map-applymap-apply/
列Nameが「name_A」の場合、その隣の列Valueの値を取得する(これがベストかは不明) 関数にするなら
参考HP:https://linus-mk.hatenablog.com/entry/2019/02/02/200000 SettingWithCopyWarning は警告であり、エラーではない。ただし、その処理が自分… 続きを読む »
辞書を使う その前にリストとは リストは複数の要素を順番に管理でき、簡単に取り出せる デメリット:要素の内容と順番を覚えておかなければならない 辞書であれば情報を「見出しキー」と「値」で管理できる つくる リストから辞書… 続きを読む »
concatとmergeの違い 項目 pd.concat pd.merge 用途 縦横に結合したい場合※単純に縦または横に結合するだけ 共通のデータ列で結合したい場合 結合するobjs指定 [df1, df2](戻り値:… 続きを読む »
参考URL:https://note.nkmk.me/python-pandas-shift/ 時系列でない場合 shift() を利用する ずらした場合、そこにはNaNが入るため、列はfloat型に変換される ずらした… 続きを読む »
MEMO Sphinx関係 会社PCのAnaconda削除とPython環境再構築 主な用途 Pandas Selenium Numpy Pythonの標準ライブラリには何が入っている? それ以外のもの Sphinx T… 続きを読む »
まだ作成中
XPATH https://developer.mozilla.org/ja/docs/Web/XPath
ダウンロードする このWebページのリクエストが成功したかどうかは、Responseオブジェクトのstatus_code属性を調べればわかる request.code.ok = HTTPプロトコルの「200」(Not F… 続きを読む »
退屈本P260 シバン行
https://pythonscraping.com/pages/auth/login.php
基本 基本的なフォーム https://pythonscraping.com/pages/files/form.html ソース <h2>Tell me your name!</h2> <f… 続きを読む »
暗号化されていない通信は盗み取ることが可能 SSLはそれを防ぐため、ブラウザ(ユーザーPC)とサーバー間で「通信の暗号化」を行う 実は「SSL」は古い規格の名称(2014年に脆弱性が発見され翌年には使用禁止) 現在はより… 続きを読む »
参考HP:https://vaaaaaanquish.hatenablog.com/entry/2017/06/25/202924 参考HP:https://myafu-python.com/syntax/library… 続きを読む »
参考HP APIとは Aplication Programming Interface アプリの機能を外部から呼び出すための約束ごと あるアプリがAPIとして外部に公開されているのであれば、APIを通じて我々はそのアプリ… 続きを読む »
Seleniumを利用
pathlib.Pathオブジェクトはテキスト操作でもとても便利 自動でファイルをclose()してくれるのでwith文が不要 ファイルオブジェクトのように、読み込み・書き込み用と別々に作成する必要がない 1行ずつ読み込… 続きを読む »
ファイルの書き込みは通常write()を使ってきた 実はprint()関数を使った書き込みも便利 ファイルオブジェクトに書き込むときは、file引数に指定する 改行文字(\n)は自動的に出力される write()は数値な… 続きを読む »
クリップボードにコピー、ペースト pyautoguiでは日本語が使えないため、これを利用する
メモリの情報や型を確認する メモリを開放する ①使わないデータは読み込まない ②使い終わったらメモリを開放する Pythonはそもそもメモリ管理されているため、不要という記事もある? ③ライブラリを利用する(mylibへ… 続きを読む »
参考HP:pythonで自作関数をモジュール化・パッケージ化
optionとして、以下がある
リスト内包表記の記法 [ 式 for 変数 in シーケンス ] ループより内包表記が便利 前後を入れ替えることで並びが変わる
コマンドライン引数とは プログラムを実行する際に指定する引数のこと 引数の渡し方 取得方法
__file__ モジュールで利用する場合 if __name__ == ‘__main__’: