tabula-pyがpdf上の表をテキスト抽出できる優秀ツールであることは下記で述べたとおり。 kojikoji75.hatenablog.com kojikoji75.hatenablog.com (adsbygoogle = window.adsbygoogle || []).push({}); だが、値を抽出するといってもOCR処理ができるというわけ…
tabula-pyを使って複数の表が記載されたpdfファイルをDataFrameへ読み込んだ時どんな感じになっているのか、VSCodeでステップ実行したときのメモ。 (adsbygoogle = window.adsbygoogle || []).push({}); 表が複数掲載されたpdfファイルを仮に用意。今回は以…
いまだに使う機会があるバッチ。 下記はiniファイルからフォルダパスやファイル名などの設定値を引っ張る例。(※テキストファイル系ならなんでもよい) (adsbygoogle = window.adsbygoogle || []).push({}); まずは外部ファイル側。以下のようなsettings.ini…
PDF読み込みの必要が生じたので使ってみたメモ。どちらも用途をうまく使い分けるとかなり使えそう。 (adsbygoogle = window.adsbygoogle || []).push({}); 1.pdf2txt.py インストール 使い方 2.tabula-py インストール 使い方 3.まとめ 1.pdf2txt.py…
にわかのメモ。 1.Pandasとは 2.業務でよく使いそうなPandasとopenpyxlサンプル 1.Pandasとは Pythonは学習コストが低いわりにいろんなことができてとても使いやすい言語。 そのPythonを触る中でも、とにかく便利でユニークな存在なのがPythonのライブ…
1.バッチからPythonを起動(文字化け対策) 2.バッチから引数ありでPythonを起動 3.バッチからPythonを起動したときに画面pause 4.バッチからPythonを起動する際の引数の最大個数について 1.バッチからPythonを起動(文字化け対策) まずは単純に…
インストールが許可されていないクローズドなネットワークでPythonを使いたい状況になったときにWinPythonが便利だったのでメモ。 (adsbygoogle = window.adsbygoogle || []).push({}); 1.WinPythonとは 2.WinPythonの導入 3.WinPythonの使い方 4.VS…
前記事で「情シスが複数同じマシンを用意したいときとかにも便利」みたいなことを書いたが、ひとつ懸念点メモ。例えばRubyをChorolateyを使ってインストール後、すぐにRuby -v とすると以下のようなエラーが出た。 ruby : 用語 'ruby' は、コマンドレット、…
Windowsでアプリのインストール時にはexeやmsiなどのインストーラをダウンロードして、GUIでポチポチとインストール操作が必要。 できればLinuxのapt-getやyumのようにCLIからインストールしたいところ。 そこでChocolatey(読みは"チョコレーテイ")。 (ads…
Windowsのフォルダエクスプローラ上からWSLファイルシステムを見るには フォルダエクスプローラのアドレスバーに下記を打つ。 \\wsl$ 結果 WSL構築と利用―Windows10で利用するLinux環境作者:川口 直也カットシステムAmazonWindows Subsystem for Linux(WSL…
Adobe ReaderでPDFファイルを開くと毎回出てくる右メニューをデフォルトで非表示にするには設定が必要だったのでメモ。今回非表示にしたいのは下記の部分。 (adsbygoogle = window.adsbygoogle || []).push({}); まずは下図の部分をクリックして非表示にする…
エラーメッセージ Adobe Acrobat または Readerに問題があります。 Acrobat または Reader を実行している場合終了して絡もう一度やり直してください。(0:521) (adsbygoogle = window.adsbygoogle || []).push({}); 現象 ブラウザ内にPDFを表示させるような…
メモリの使用状況を把握するなら、普通にタスクマネージャーでいいと思うが、表示順序に変動があったりして、タスクマネージャー見逃してる部分がような不安がある。そこで最近意外とよく使うようになったコマンドがtasklist。サマリ 1.コマンドプロンプト…
Ubuntu 14.10を入れた物理マシンを用意した。 なぜ仮想ではなく物理かというと、修復したいHDDがギリギリ認識するかしないかというレベルだから。そしてなぜUbuntu 14.10かというと、xfs_repairのそれなりに古いバージョンが必要だから。 kojikoji75.hatenab…
別のHDDでREGZA修復ツールの成功例が見れたのでメモしておく。 (adsbygoogle = window.adsbygoogle || []).push({}); マウントできるような状態の機器では下記のように「(3)修復する録画機器」と「(4)修復する記憶領域」が選択できる状態となる。 これ…
古いバージョンのxfs_repairが必要そうだということが見えてきた。これから何種類かのUbuntuのバージョンを試していく必要がありそうだと思ったので、VirtualBoxを使った方法に方向転換。(※そもそもデバイス認識するかどうかのところに難ありの状況だったの…
xfs_repairの古いバージョンが必要らしいことがわかってきた。 このあたりについてよくわかっていないので調べたことのメモ。 (結論としては、以下の対処法では対応不可のため、Ubuntuの別バージョンをインストールすることにした。) パッケージをダウング…
1.マウントしてみる まず接続されているデバイスの確認。 $ sudo fdisk -l (adsbygoogle = window.adsbygoogle || []).push({}); 結果 ディスク /dev/loop1: 55.5 MiB, 58183680 バイト, 113640 セクタ 単位: セクタ (1 * 512 = 512 バイト) セクタサイズ …
REGZA録画に使用した外付けHDDの復旧時に最低限試せることのメモ。Ubuntu環境を用意し、下記コマンドでデバイスが認識しているかを確認。 $ sudo fdisk -l 認識している場合、デバイスがdev/sdb1などとなっていることが多い。 (※認識していない場合、REGZA…
REGZA HDD復旧対応中に起きたこと。 Ubuntuを入れているLet'sNoteへHDD修復ツールをインストール後に再起動すると、画面の輝度調整が効かなくなっていた。 暗くて作業がしにくいので対応した際のメモ。 カーネルパラメータの調整で修復するとよい模様。 sudo…
irbによる動作検証。 読み込みについて FileクラスはIOクラスを継承している。 IO#readは末尾まですべて読み込む。今回の読み込み対象のファイル まず、closeで閉じてやる必要がある書き方。 file = File.open('c:/sample/foo.txt') puts file.read file.clo…
問題集駆動学習。解説にある説明だけではrassocの動きがよくわからないので、挙動から探る。 rassocの説明 rssocメソッドは配列の配列を検索します。その1番目の要素が引数に渡っている要素と等しい最初の要素を返します。 実際の動き obj = [[1, 2], [3, 4]…
VirtualBoxでUbuntu起動時に下記エラー。何度か遭遇するがその都度忘れるのでメモ。 仮想マシン”〇〇〇”のセッションを開けませんでした。詳細(D) Not in a hypervisor partition (HVP=0) (VERR_NEM_NOT_AVAILABLE).VT-x is disabled in the BIOS for all CP…
共有プリンタインストール時に以下のエラーメッセージ。これはレジストリ修正で簡単に解決するが、レジストリキーの場所を毎回忘れるのでメモ。 ポリシー設定が原因で、この印刷キューに接続できません (adsbygoogle = window.adsbygoogle || []).push({}); …
1.背景 2.パスコードがわからない状態での初期化手順 (adsbygoogle = window.adsbygoogle || []).push({}); 1.背景 レンタルiPadの契約満了に伴う返却時は、送られてきた返却キットに同梱されている「初期化手順」に従って初期化を行う必要がある。 こ…
「信頼されたルート機関」というのはIEのインターネットオプションでいうところの、ここのこと。 信頼されたルート機関 (adsbygoogle = window.adsbygoogle || []).push({}); ここにcerファイルをインポートするために、これまでせこせこと手動でインポート…
社内にそれぞれ用途が違う複数の種類のWi-Fiがあり、大量のマシンにそれらを設定していく必要が生じたので、それ用のバッチの作成したときのメモ。 (adsbygoogle = window.adsbygoogle || []).push({}); 1.Wi-Fiプロファイルの準備 2.Wi-Fi接続のための…
背景 大量のユーザプロファイルディスク(←これが仮想ディスク(.vhdx))があり、このユーザプロファイルごとにinetcacheフォルダ(IEのキャッシュがたまる場所)をもつような特殊な環境があるとする。今回、仮想ディスクをマウント⇒inetcacheフォルダの中…
Windows7/8.1からWindows10への付箋データの移行は単純にsntファイルの移動だけでは済まない。今回Windows7/8.1からWindows10へ付箋データを正常に移行できたのでそのときのメモ。 1.移行元マシン(Windows7やWindows8.1)の付箋データをコピー 移行元マシ…
ActiveDirectory環境であればドメインに参加しているPCはADサーバから時刻をもらっている。 なのでPCの時刻がずれてきたらADサーバがどこから時刻をもらっているかを確認する必要がある。状態を確認するためのコマンド。ここで、どこから時刻をもらっている…