TechNote

とあるエンジニアのただのメモ

DPC調査「病院情報の公表」がついに10/1に迫る!とりあえず準備完了。

本件、どういった主旨の話かというと「DPC病院は自院のWebサイトに病院指標データおよびそれに対する説明文を2016/10/1時点で公開しておかないと、次年度の機能評価係数Ⅱに関わってきますよ~」という宿題を厚労省が課してきたというお話です。

aaaaa

具体的には全部で7つの指標データとそれに対する説明(一般市民がみてもわかるような説明)を病院Webサイトで公開しないといけないのですが、この作業を進めるにあたってはきちんと仕様書みたいなものが公開されており、結構丁寧に算出条件が説明がなされています。 使用するファイルは様式1、様式4、Dファイルの3つです。

この作業をやり始めて、上流から降りてきた仕様書を見ながらひたすらコードを書いていたプログラマ時代の感覚と似ている、というかほぼ同じ!?という感想を持ちました。最近は人から仕様が降りてくるということもない(自分設計/自分製造)ので非常に懐かしい感覚でした。SQLだけでは事足りず(実際はSQLだけでもいけるかも)、各設問ごとにプログラムを書いて値を算出していきました。コード残しておいたほうが後からみても分かるしね。

最低限の注意点(あたりさわりのない部分だけ)

久々にAccessを使用しました。まずはAccessに全使用ファイル(平成27年度のFF1,FF4,Dファイルを全て)をインポートしていくわけですが、インポート時、Accessはインポートファイルの最初の数行でフィールドのデータ型を自動判定してしまいます。このため、何も考えずにインポートすると様式1のインポート時に「統括番号」がはじかれたりします(最初の数行で「数値型」と判定される→フィールドが数値型に設定される→後半のレコードに文字列型がちらほらでてくる→型の違いによるインポートエラー)。このようなときは、きちんとインポート時にデータ型を指定してあげましょう。「統括番号」は今回大事な抽出条件の一つなので漏れがないほうがいいです。 (統括番号に限らないので、①インポート→②インポートエラーテーブルを確認→③一旦テーブル削除→④インポート時に該当フィールドのデータ型を変更→繰り返し....とトライアンドエラー方式で、漏れなくデータがインポートできるまで)

また、久々に様式1の構造に触れるよう方は、きちんとファイルの特徴をつかんでおくべきです。事前につかんでおかないと二度手間になることが多々あります(経験談)。ファイルの特徴を知るにはこの本がおすすめです。 [amazonjs asin="4840740364" locale="JP" title="DPCデータ分析 アクセス・SQL活用編"]

また、仕様書はきちんと読みましょう。例えば「術前日数」「術後日数」の算出がありますが、わたしは最初、入院日~手術実施日、手術実施日~退院日で算出してしまいました。あとで仕様書をよく読むと、入院日と退院日を使うのではなく、様式1開始日と様式1終了日を使うということに気付き、二度手間になりました。

仕様書以前に、"平成28年度「DPC導入の影響評価に係る調査」実施説明資料"を読みましょう。これがたぶん前提知識です。これを読んだことのある人にとっては今回の仕様書に書かれていることは特に新しいことでもなく、上記のような勘違いによる二度手間は発生しないのかも知れません。 [ads1]

個人的に知りたいところ

様式1は平成26年度から構造が大きく変更になりました。ちょうどその頃以降、わたしはDPCデータと関わる機会がなくなったので、新様式1の構造について詳しく知りませんが、「素人が簡単に分析しにくい構造に変わった」という認識だけがあります。(新様式1のデータフォーマットが詳しく公開されているのかどうかすら確認していません。) そのため今回、様式1は基本的にすべて旧様式1形式で出力して分析を始めました。ですが途中で気付いたのですが、データの持ち方が変わったことによるものか、昔からある項目でも旧様式1形式で出力しようとすると出力されない項目があったりしました。そこは結局、新様式1形式から引っぱってくることでカバーできましたが、もしかして新様式1の仕様はすべて公開されていて、最近では一般的にも分析は新様式1形式を用いて行うものなのかな。

【追記】 単に横持ちが縦持ちに変わっただけのようですね。ということは旧様式1出力時にある項目が出力されないのはただのうちのシステムのバグなのかも知れません。 http://stagira.hatenablog.com/entry/2016/08/12/001427

さいごに

それにしても、今回はDPC調査事務局からhtmlジェネレータなども公開されていて、「ここに結果や説明を入力後、html出力ボタンを押してね→それを自院のwebサイトへ設置してね→css等は自院のサイトデザインに合わせて適当に調整してね」など、きちんとWebサイト公開に関する手順も用意されており、DPC調査事務局にとっても医療機関にとってもこれは結構大きな動きだったんじゃないかと思いました。 設置時のルールで、「自院の標榜科名称が標準名称と違う場合は、画面表示させるのは自院標榜科名称とし、標準名称はhtmlのコメントに残す」などの細かいルールもあったりと、なかなか細かいことまできっちり決められています。ここまで技術的に攻めてきたのは初めてのような気がします。 医療機関へのエンジニア(または医療情報技師)の配置を暗に推奨しているということでしょうか。

[amazonjs asin="4822231917" locale="JP" title="すべてExcelでできる! 経営力・診療力を高める DPCデータ活用術 (NHCスタートアップシリーズ)"] [amazonjs asin="4840743002" locale="JP" title="これからの地域の急性期医療を考えるDPCデータ活用の多彩な展開"] [ads2]