TechNote

事務屋のおぼえがき

【Python】tabula.read_pdfで読み込めるpdfと読み込めないpdf(IndexError: list index out of range)

tabula-pyがpdf上の表をテキスト抽出できる優秀ツールであることは下記で述べたとおり。 kojikoji75.hatenablog.com kojikoji75.hatenablog.com (adsbygoogle = window.adsbygoogle || []).push({}); だが、値を抽出するといってもOCR処理ができるというわけ…

【Python】tabula.read_pdfでDataFrameにどんなデータが取得されるか

tabula-pyを使って複数の表が記載されたpdfファイルをDataFrameへ読み込んだ時どんな感じになっているのか、VSCodeでステップ実行したときのメモ。 (adsbygoogle = window.adsbygoogle || []).push({}); 表が複数掲載されたpdfファイルを仮に用意。今回は以…

【以外によく使う】バッチから外部ファイル(txtやini)読み込んで値を取得する方法

いまだに使う機会があるバッチ。 下記はiniファイルからフォルダパスやファイル名などの設定値を引っ張る例。(※テキストファイル系ならなんでもよい) (adsbygoogle = window.adsbygoogle || []).push({}); まずは外部ファイル側。以下のようなsettings.ini…

【Python】PDFの表テーブル読込ライブラリ(pdf2txt、tabula-py)使い方・使用感

PDF読み込みの必要が生じたので使ってみたメモ。どちらも用途をうまく使い分けるとかなり使えそう。 (adsbygoogle = window.adsbygoogle || []).push({}); 1.pdf2txt.py インストール 使い方 2.tabula-py インストール 使い方 3.まとめ 1.pdf2txt.py…

【Python】業務でよく使いそうなPandasとopenpyxlサンプル(にわかのメモ)

にわかのメモ。 1.Pandasとは 2.業務でよく使いそうなPandasとopenpyxlサンプル 1.Pandasとは Pythonは学習コストが低いわりにいろんなことができてとても使いやすい言語。 そのPythonを触る中でも、とにかく便利でユニークな存在なのがPythonのライブ…

【Python】バッチからPythonスクリプト実行サンプル(文字化け対策、引数渡しsys.argv、画面pause、引数の最大個数など)

1.バッチからPythonを起動(文字化け対策) 2.バッチから引数ありでPythonを起動 3.バッチからPythonを起動したときに画面pause 4.バッチからPythonを起動する際の引数の最大個数について 1.バッチからPythonを起動(文字化け対策) まずは単純に…

【Python】クローズドネットワークでインストール不要のWinPythonを使う

インストールが許可されていないクローズドなネットワークでPythonを使いたい状況になったときにWinPythonが便利だったのでメモ。 (adsbygoogle = window.adsbygoogle || []).push({}); 1.WinPythonとは 2.WinPythonの導入 3.WinPythonの使い方 4.VS…

Chocolateyインストール直後のパスのこと(Environment Vars (like PATH) have changed)

前記事で「情シスが複数同じマシンを用意したいときとかにも便利」みたいなことを書いたが、ひとつ懸念点メモ。例えばRubyをChorolateyを使ってインストール後、すぐにRuby -v とすると以下のようなエラーが出た。 ruby : 用語 'ruby' は、コマンドレット、…

Windowsのパッケージ管理ツールChocolateyを使う(いまさら)

Windowsでアプリのインストール時にはexeやmsiなどのインストーラをダウンロードして、GUIでポチポチとインストール操作が必要。 できればLinuxのapt-getやyumのようにCLIからインストールしたいところ。 そこでChocolatey(読みは"チョコレーテイ")。 (ads…

WindowsでWSLファイルシステムを見る

Windowsのフォルダエクスプローラ上からWSLファイルシステムを見るには フォルダエクスプローラのアドレスバーに下記を打つ。 \\wsl$ 結果 WSL構築と利用―Windows10で利用するLinux環境作者:川口 直也カットシステムAmazonWindows Subsystem for Linux(WSL…

Adobe Readerで毎回出てくる右メニューの非表示化を記憶させる

Adobe ReaderでPDFファイルを開くと毎回出てくる右メニューをデフォルトで非表示にするには設定が必要だったのでメモ。今回非表示にしたいのは下記の部分。 (adsbygoogle = window.adsbygoogle || []).push({}); まずは下図の部分をクリックして非表示にする…

AdobeAcrobatまたはReaderに問題があります。AcrobatまたはReaderを実行している場合終了して絡もう一度やり直してください。(0:521)

エラーメッセージ Adobe Acrobat または Readerに問題があります。 Acrobat または Reader を実行している場合終了して絡もう一度やり直してください。(0:521) (adsbygoogle = window.adsbygoogle || []).push({}); 現象 ブラウザ内にPDFを表示させるような…

特定のタスクを監視するバッチ

メモリの使用状況を把握するなら、普通にタスクマネージャーでいいと思うが、表示順序に変動があったりして、タスクマネージャー見逃してる部分がような不安がある。そこで最近意外とよく使うようになったコマンドがtasklist。サマリ 1.コマンドプロンプト…

【REGZA HDD修復6】古いxfs_repairによる修復

Ubuntu 14.10を入れた物理マシンを用意した。 なぜ仮想ではなく物理かというと、修復したいHDDがギリギリ認識するかしないかというレベルだから。そしてなぜUbuntu 14.10かというと、xfs_repairのそれなりに古いバージョンが必要だから。 kojikoji75.hatenab…

【REGZA HDD修復5】REGZA修復ツールを使った成功例

別のHDDでREGZA修復ツールの成功例が見れたのでメモしておく。 (adsbygoogle = window.adsbygoogle || []).push({}); マウントできるような状態の機器では下記のように「(3)修復する録画機器」と「(4)修復する記憶領域」が選択できる状態となる。 これ…

【REGZA HDD修復4】VirtualBox上の古いUbuntuでxfs_repairを試す

古いバージョンのxfs_repairが必要そうだということが見えてきた。これから何種類かのUbuntuのバージョンを試していく必要がありそうだと思ったので、VirtualBoxを使った方法に方向転換。(※そもそもデバイス認識するかどうかのところに難ありの状況だったの…

【REGZA HDD修復3】xfsprogsパッケージをダウングレードできないか?

xfs_repairの古いバージョンが必要らしいことがわかってきた。 このあたりについてよくわかっていないので調べたことのメモ。 (結論としては、以下の対処法では対応不可のため、Ubuntuの別バージョンをインストールすることにした。) パッケージをダウング…

【REGZA HDD修復2】wrong fs type, bad option, bad superblock on...でマウントできない

1.マウントしてみる まず接続されているデバイスの確認。 $ sudo fdisk -l (adsbygoogle = window.adsbygoogle || []).push({}); 結果 ディスク /dev/loop1: 55.5 MiB, 58183680 バイト, 113640 セクタ 単位: セクタ (1 * 512 = 512 バイト) セクタサイズ …

【REGZA HDD修復1】録画HDDがPCで認識しなくなったときに最低限試せることメモ

REGZA録画に使用した外付けHDDの復旧時に最低限試せることのメモ。Ubuntu環境を用意し、下記コマンドでデバイスが認識しているかを確認。 $ sudo fdisk -l 認識している場合、デバイスがdev/sdb1などとなっていることが多い。 (※認識していない場合、REGZA…

ubuntu + Let'sNoteでバックライト調整ができなくなったときの対応方法

REGZA HDD復旧対応中に起きたこと。 Ubuntuを入れているLet'sNoteへHDD修復ツールをインストール後に再起動すると、画面の輝度調整が効かなくなっていた。 暗くて作業がしにくいので対応した際のメモ。 カーネルパラメータの調整で修復するとよい模様。 sudo…

【Ruby】IO/File周辺

irbによる動作検証。 読み込みについて FileクラスはIOクラスを継承している。 IO#readは末尾まですべて読み込む。今回の読み込み対象のファイル まず、closeで閉じてやる必要がある書き方。 file = File.open('c:/sample/foo.txt') puts file.read file.clo…

【Ruby】Array#rassocの動き

問題集駆動学習。解説にある説明だけではrassocの動きがよくわからないので、挙動から探る。 rassocの説明 rssocメソッドは配列の配列を検索します。その1番目の要素が引数に渡っている要素と等しい最初の要素を返します。 実際の動き obj = [[1, 2], [3, 4]…

VirtualBox で Not in a hypervisor partition (HVP=0)

VirtualBoxでUbuntu起動時に下記エラー。何度か遭遇するがその都度忘れるのでメモ。 仮想マシン”〇〇〇”のセッションを開けませんでした。詳細(D) Not in a hypervisor partition (HVP=0) (VERR_NEM_NOT_AVAILABLE).VT-x is disabled in the BIOS for all CP…

ネットワーク上の共有プリンタインストール時に「ポリシー設定が原因で、この印刷キューに接続できません」エラー

共有プリンタインストール時に以下のエラーメッセージ。これはレジストリ修正で簡単に解決するが、レジストリキーの場所を毎回忘れるのでメモ。 ポリシー設定が原因で、この印刷キューに接続できません (adsbygoogle = window.adsbygoogle || []).push({}); …

iPad/iPhoneのパスコードがわからない状態での初期化手順

1.背景 2.パスコードがわからない状態での初期化手順 (adsbygoogle = window.adsbygoogle || []).push({}); 1.背景 レンタルiPadの契約満了に伴う返却時は、送られてきた返却キットに同梱されている「初期化手順」に従って初期化を行う必要がある。 こ…

「信頼されたルート機関」に証明書をインポートするためのコマンド

「信頼されたルート機関」というのはIEのインターネットオプションでいうところの、ここのこと。 信頼されたルート機関 (adsbygoogle = window.adsbygoogle || []).push({}); ここにcerファイルをインポートするために、これまでせこせこと手動でインポート…

Wi-Fi環境切り替えバッチ

社内にそれぞれ用途が違う複数の種類のWi-Fiがあり、大量のマシンにそれらを設定していく必要が生じたので、それ用のバッチの作成したときのメモ。 (adsbygoogle = window.adsbygoogle || []).push({}); 1.Wi-Fiプロファイルの準備 2.Wi-Fi接続のための…

バッチで仮想ドライブ(.vhdx)をマウントしてinetcacheフォルダ削除

背景 大量のユーザプロファイルディスク(←これが仮想ディスク(.vhdx))があり、このユーザプロファイルごとにinetcacheフォルダ(IEのキャッシュがたまる場所)をもつような特殊な環境があるとする。今回、仮想ディスクをマウント⇒inetcacheフォルダの中…

Windows7/8.1からWindows10へStickyNoteの付箋データを移行する

Windows7/8.1からWindows10への付箋データの移行は単純にsntファイルの移動だけでは済まない。今回Windows7/8.1からWindows10へ付箋データを正常に移行できたのでそのときのメモ。 1.移行元マシン(Windows7やWindows8.1)の付箋データをコピー 移行元マシ…

サーバの時刻がずれてきたときの対応メモ(w32tmコマンドにひととおり触れる)

ActiveDirectory環境であればドメインに参加しているPCはADサーバから時刻をもらっている。 なのでPCの時刻がずれてきたらADサーバがどこから時刻をもらっているかを確認する必要がある。状態を確認するためのコマンド。ここで、どこから時刻をもらっている…