2022-11-01から1ヶ月間の記事一覧
Python初学者が「Zen of Python & PEP 8 検定試験」を受けてみて感じたことのメモ。 1.Zen of Python & PEP 8 検定試験を受けてみた感想 2.Zen of Python & PEP 8 検定試験を受けてみた結果 1.Zen of Python & PEP 8 検定試験を受けてみた感想 率直に…
tabula-pyがpdf上の表をテキスト抽出できる優秀ツールであることは下記で述べたとおり。 kojikoji75.hatenablog.com kojikoji75.hatenablog.com だが、値を抽出するといってもOCR処理ができるというわけではなく、あくまでpdf上の「テキストとして認識できる…
tabula-pyを使って複数の表が記載されたpdfファイルをDataFrameへ読み込んだ時どんな感じになっているのか、VSCodeでステップ実行したときのメモ。 表が複数掲載されたpdfファイルを仮に用意。今回は以下のようなもの。 下記のようなシンプルなコードにブレ…
いまだに使う機会があるバッチ。 下記はiniファイルからフォルダパスやファイル名などの設定値を引っ張る例。(※テキストファイル系ならなんでもよい) まずは外部ファイル側。以下のようなsettings.iniを用意。 path1=\\server001\test\ filename1=template…
PDF読み込みの必要が生じたので使ってみたメモ。どちらも用途をうまく使い分けるとかなり使えそう。 1.pdf2txt.py インストール 使い方 2.tabula-py インストール 使い方 3.まとめ 1.pdf2txt.py pdf2txt.pyはPDFをテキスト化してくれるもの。特にテ…
にわかのメモ。 1.Pandasとは 2.業務でよく使いそうなPandasとopenpyxlサンプル 1.Pandasとは Pythonは学習コストが低いわりにいろんなことができてとても使いやすい言語。 そのPythonを触る中でも、とにかく便利でユニークな存在なのがPythonのライブ…