ラベル EBM の投稿を表示しています。 すべての投稿を表示
ラベル EBM の投稿を表示しています。 すべての投稿を表示

2013年7月5日金曜日

EBMの復習

紛らわしいEBMの公式をまとめておきます。
疾患あり疾患なし合計
検査陽性真陽性(a)偽陽性(b)a+b
検査陰性偽陰性(c)真陰性(d)c+d
合計a+cb+da+b+c+d
  • 感度(sensitivity) = 真陽性率 = a/a+c
  • 特異度(specificity) = 真陰性率 = d/b+d
  • 有病率(prevalence) = a+c/a+b+c+d
  • 正確度(accuracy) =  a+d/a+b+c+d
  • 偽陽性率(false positive) = type I error = b/b+d
  • 偽陰性率(false negative) = type II error = c/a+c
  • 陽性的中率(positive predictive value) = a/a+b
  • 陰性的中率(negative predictive value) = d/c+d
  • 陽性尤度比(positive likelihood rate) = 感度/(1-特異度)
  • 陰性尤度比(negative likelihood rate) = (1-感度)/特異度

2013年6月29日土曜日

Experience Based Medicineの陥穽

Wikipediaによると、伝説の医師会長武見太郎氏は
「(医師の集団は)3分の1は学問的にも倫理的にも極めて高い集団、3分の1はまったくのノンポリ、そして残りの3分の1は、欲張り村の村長さんだ」
と嘆いたという。これが事実だとして、3軒ドクターショッピングをしたとすると、サイコロを振って5や6が出る確率で名医、3や4が出る確率で凡医、1や2が出る確率で村長さんに当たることになります。樹形図を書いてみれば一目瞭然ですが、1回も村長さんに当たらない確率が8/27、1回当たる確率が12/27、2回当たる確率が6/27、3回とも当たってしまう確率が1/27となるわけです。7/27の方が当たりが悪いわけで、医者ってのは、大半は村長さんだと思かもしれません。逆に8/27の方がマスコミが言うのとは違って村長さんはいないと思うかもしれません。しかし、実際には、この過半数を超える方々の判断は事実とは異なってしまうのです。

実際、3例くらいのサンプルでは、その中にまともな医者がゼロだったとしても、その95%信頼区間は、0-1.0としか言えないわけです。(cf. wikipedia "Rule of tree"

そんな少ない経験に即した判断の陥穽を避けるためのツールが、悪名高い「偏差値」のもととなった正規分布なのです。大雑把に言って、偏差値70以上と30以下は2.5%ずつ、60-70と30-40は16%ずつ、残る40-60は63%という訳です。

2011年8月24日水曜日

家庭医のEpley手技


BPPVの症状
  • Attack:突然発作的に起き、短時間持続し、特定頭位で繰り返すめまい。
  • Blurred:回転するというよりも目がぼやけるという感じ。
  • Check Complications:難聴、耳鳴、失神、眼前暗黒感などは認めない。
BPPVの診断:Dix-Hallpike法
  1. 座位にて水平に左45°回旋する。
  2. その位置から懸垂頭位に落とし込む。
  3. 右側も同様に検査。(右側は左側の2倍の頻度らしい…)
BPPVの治療:Epley法
  1. 懸垂頭位で患側に45°頸部を捻転し維持。
  2. 懸垂頭位を保ちながら頭部を徐々に健側下に90°捻転し維持。
  3. 頸部捻転を維持しながら健側下の側臥位にして維持。
  4. 頭部を屈曲して座位にする。
言葉にすると分かりづらいが、イメージとしては頭側から患者さんを見て金庫のダイヤルと見做す。首を内側のダイヤル、肩(胴体)を外側のダイヤル、1クリック45°とすれば、まず患側に内側のダイヤルを1つ、そして反対側に2つ、次に外側のダイヤルを反対側に2つ。結果として内側のダイヤルである首は、正面から患側に3つ分移動している。そこから座位へさせるので患側と反対側のベッドサイドに腰掛けて終了である。YouTubeに多くの動画が投稿されているので、一度見ておいてください。


疑問:非専門医である家庭医がEpley手技を行った場合でも有効か?
⇒今回は、参考文献1をGATE frame(参考文献2)の方法で、Critical Appraisalを行って見ました。

参考文献

  1. Canalith repositioning maneuver for benign paroxysmal positional vertigo: randomized controlled trial in family practice. Canadian Family Physician June 2007 vol. 53 no. 6 1048-1053
  2. The GATE frame: critical appraisal with pictures. Rod Jackson University of Auckland, New Zealand.

2011年7月13日水曜日

χより始めよ。


今回は、先日札幌で開かれた日本プライマリ・ケア連合学会で発表したものに教育的な改変を加えたものを披露させて頂いた。基本的な筋は、このブログで以前公開した「MGHの症例検討会キーワード50 ーコーパス言語学で学ぶ医学英語ー」を発展させたもので、1990年から2011年までのCPCコーパスを前半と後半に分け、後半の語彙のkeynessを算出したものだ。意外な結果が出て、嵌ってしまい、発表までの2ヶ月くらい色々文献を渉猟した。確定的な結論には結びつかなかったが、自分にとっては有意義なものとなりました。今回は、それに下記3点を膨らませたものを勉強会で紹介した次第。
  1. χ2検定の方法(SOSの公式):χ2統計量は2×2表(自由度1)に限れば、電卓でも簡単に計算でき、意外と予備研究や日常の業務改善の効果を測定するのに有用だと思っている。そこで、本投稿のタイトルにもした。SOSの公式というのは、たすき掛けの差をSquareし、Overall totalを分子(Overだから上)に、Subtotalsを分母(Subだから下)にして計算する手順をまとめたものです。
  2. English for Specific Purpose(ESP):以前の投稿でも書いたが、個人でも自分の専門分野の論文のコーパスが容易に作れる時代になったので、コンコーダンサーを導入することでテーラーメイドの英語の学習ができることの紹介。コンコーダンサーを利用して、ティアニー先生のClinical Pearlを1つ紹介します。
  3. 「臨床医学の誕生」からHarvard Medical SchoolでのThe New Pathway導入に至る経緯。アメリカ合衆国という国のresponseの速さと継続性、これは我々も素直に見習う必要がある。
スライドは折角Keynoteで作成したので、音声をつけてYouTubeで公開しようと思ったのですが、30分を超えてしまうので断念しました。しかし普段自分の発表を聞くということがなかったので録音を聞いて口演の拙さを認識するいい機会になりました。代わりにPowerpoint形式で出力し、Scribdで公開します。

NEJM@ランチョン

リンク集

2011年3月21日月曜日

公園の河童

 前回のSEAで出てきた「κ統計値(Cohen's kappa)」について掘り下げてみました。

κ統計値の意義と計算法:
 インフルエンザを多く診てきて、咽頭後壁に出来る上咽頭から縦に襞状にカーテンのように降りてくるリンパ濾胞の腫大が所見として特異性が高い印象を持っていました。文献検索をしてみましたが、そのような文献は見つけることができず、プチリサーチをしてみた結果が、下記tableです。

迅速検査陽性
 迅速検査陰性
 計
咽頭後壁襞状リンパ濾胞あり
3
1
4
咽頭後壁襞状リンパ濾胞なし
2
4
6
5
5
10
 迅速検査をGolden Standardとすると、咽頭後壁襞状リンパ濾胞の検査特性は、感度=3/5=0.6、特異度=4/5=0.8となります。これは、迅速検査がある程度正しい場合に、咽頭所見の妥当性(validity)、確度(accuracy)、つまり的中の度合いを示しています。[1]しかし実際には、迅速検査自体が、そんなにあてになる検査ではないので、せいぜいで検査結果の信頼性(reliability)、精度(precision)、つまりブレない度合いを評価するほうが良いと思われます。
 実際の計算は、判断の一致率をPo,偶然の一致率をPeとすると、以下の式で表される。[2]
κ統計値=(Po-Pe)/(1-Pe)
例のように、カテゴリー数が陽性と陰性というふうに2つの場合、以下のように比較的簡単に筆算でも計算することができます。
Po=実際の一致率=(3+4)/10=0.7
陽性結果が偶然一致する確率=4/10*5/10=0.2
陰性結果が偶然一致する確率=6/10*5/10=0.3
Pe=結果が偶然一致する確率=0.2+0.3=0.5
κ値=(0.7-0.5)/(1-0.5)=0.4
 カテゴリー数が多く計算が面倒な場合には、Rなどの統計ソフトを使うのが便利です。fmsbパッケージを使った例の計算の場合のスクリプトを示します。fmsbパッケージは、上掲書で使われた有用な関数をまとめたものです。
> install.packages("fmsb") #fmsbパッケージをインストールします
--- このセッションで使うために、CRANのミラーサイトを選んでください ---
URL 'http://cran.md.tsukuba.ac.jp/bin/macosx/leopard/contrib/2.12/fmsb_0.2.tgz' を試しています
Content type 'application/x-gzip' length 78762 bytes (76 Kb)
開かれた URL
==================================================
downloaded 76 Kb
ダウンロードされたパッケージは、以下にあります /var/folders/cb/cbprP5nfG7Ciei1Q9q4QaU+++TI/-Tmp-//RtmpyRYuFO/downloaded_packages
> library(fmsb) #fmsbパッケージの読み込み
> Kappa.test(matrix(c(3,1,2,4),2,2,byrow=T)) #
$Result
Estimate Cohen's kappa statistics and test the null hypothesis
that the extent of agreement is same as random (kappa=0)
data: matrix(c(3, 1, 2, 4), 2, 2, byrow = T)
Z = 1.2649, p-value = 0.1030
95 percent confidence interval:
-0.1680515 0.9680515
sample estimates:
[1] 0.4
$Judgement
[1] "Fair agreement"
>
Rを使うと、カテゴリー数が多くなっても計算できること、95%信頼区間まで計算してくれること、Landis and Koch[3]の基準による判定までしてくれるというメリットがあります。

κ統計値の応用:
 κ統計値は前回のSEAでのように身体所見の信頼性を検討する文献などで用いられることが多いのですが、今回は先日完結したドラマERにトリビュートして、ドイツの医師会誌"Deutsche Ärzteblatta"の国際版に発表された救急外来でのトリアージシステムを比較検討した文献[4]を紹介します。以下に見るように、ESIの基準が信頼性が高いようです。その理由は、"ESI Handbook"の図2-1のアルゴリズムを見ると一目瞭然なのですが、「KISSの原則」に則っているということがあるようです。
Manchester Triage Scale (MTS)
  • 成人患者における4つの解析 (n = 50〜167)で、κ = 0.31〜0.62
Australasian Triage Scale (ATS)
  • 成人患者における6つの解析 (n = 20〜3,650)で、κ = 0.25〜0.56
Canadian Triage and Acuity Scale (CTAS)
  • 成人患者における8つの解析 (n = 50〜32,261)で、κ = 0.68〜0.89
  • 小児患者における4つの解析 (n = 54〜1,618)で、κ = 0.51〜0.72
Emergency Severity Index (ESI)
  • 成人患者における12の解析(n = 202〜3,172)で、κ = 0.46〜0.91
  • 16歳未満の小児患者における1つの解析(n = 150)で、κ = 0.82
参考文献
[3] Landis JR, Koch GG. The measurement of observeragreement for categorical data. Biometrics 1977; 33: 159-74.
[4] Dtsch Arztebl Int. 2010 December; 107(50): 892–898. Modern Triage in the Emergency Department

2010年12月28日火曜日

MGHの症例検討会キーワード50 ーコーパス言語学で学ぶ医学英語ー

【背景】学生時代に遡る。ある助教授の先生が、名医になる方法として、New England Journal of Medicine(以下NEJMと略す)のシリーズ”Case records of the Massachusetts General Hospital”を10年間続けて読むことを挙げていた。忙しさにかまけ実行せず、すっかりと藪が身についてしまった。最近、”Better late than never.”という諺に希望を見出し、ぼちぼち目を通すが、単語力の不足が堪える。そこで効率よく単語を覚えるために同シリーズで頻回に使用される単語の単語帳を試作した。

【目的】”Case records of the Massachusetts General Hospital”で使用される単語のうち記憶があやふやな単語の頻度上位50単語の単語帳を試作する。

【対象】”Case records of the Massachusetts General Hospital”を1990年1月4日号から2010年12月23日号までの894回分を対象とした。

【方法】
ステップ1:オリジナル記事の検索
 NEJMホームページからARTICLES→Browse all articles→Case records of the Massachusetts General Hospital→Specific date rangeで”From: Jan 1990 To: Dec 2010”と設定して、Searchボタンをクリック。

ステップ2:テキスト化する。
 テキスト・エディタ(Windowsではメモ帳)を起動して、上記オリジナル記事1回分を1テキストファイルにひたすらコピー&ペーストする。その際、ファイル名はcase+西暦+年間通し症例番号.txtとして適当なディレクトリに保存する。

ステップ3:コンコンダンサーソフトAntConcでWord Listを作成する。
 a) 早稲田大学Laurence Anthony先生のホームページから”AntConc”をダウンロードする。(Windows、MacOS、Linux、それぞれのバージョンがある。)同時に、同ページのOther resourcesから後の設定で使う”Someya Lemma List (with no hyphenated words)”もダウンロードし、zipファイルを解凍しておく。

 b) AntConcの設定する。素のままでは、例えば、be動詞のam、are、is、was、were、been、beingは全部別単語となってしまうので"lemmatisation"の設定が必要になります。Tool PreferencesのWord ListでLemma List OptionsのUse lemma list fileをチェックし、Openボタンを押して、先に解凍した”e_lemma_no_hypen.txt”を選択、Loadボタンを押す。表示されたら、OKボタンを押し、下のApplyボタンを押す。

 c) Word Listを作成する。File→Open Dir...でテキストを保存したディレクトリを開くと、中のテキストファイルが読み込まれる。それから、Word Listタグをクリックし、Startボタンを押す。暫く待つと、下図のように単語の頻度が得られる。



 d)結果を出力する。File→Save Output to Text File... で結果を適当な場所に保存する。デフォルトでは、ファイル名はantconc_results.txtとなる。

4.表計算ソフトで読み込み、整理、出力
 先に出力したantconc_results.txtをタブ区切りの表として表計算ソフトに読み込む。順位や頻度、変化形の列を削除し、分かる単語の行を削除していく。分からない単語が50になったところでその範囲をコピーする。

5.単語帳を作る。
 ブラウザでライフサイエンス辞書オンラインサービスEtoJ Vocabを開き、「英文テキストを入力」の欄に表計算ソフトでコピーした内容をペーストする。オプション設定は、「▼結果を単語帳形式▼で出力する」にして送信ボタンを押す。

【結果】上記の作業で得られた結果を示す。(アルファベット順になっていることに注目)
  1. abrasion □ 摩耗, 擦過, 剥離, 侵食, (病名) 表皮剥脱, 擦過傷, 擦過創
  2. advent □ 出現, 到来
  3. anovulation □ 無排卵, 無排卵症, 排卵障害
  4. apply □ 適用する, 応用する, 申請する, あてはまる, 充てる, アプライする
  5. attach □ 付着する, 添付する, 関連する
  6. bout □ 発作
  7. bruise □ 挫傷, 打撲, 打撲傷, 打身, ((動詞)) 傷つける
  8. concatenate □ 連鎖状の
  9. concomitant □ 随伴性の, 同時の, 併用の, 付随物
  10. confine □ 限局する, 制限する, 限定する, 拘束する
  11. confluence □ (培養細胞が接着面いっぱいに広がった状態) コンフルエンス, 集密
  12. contiguous □ 近接する
  13. corroborate □ 実証する, 確証する
  14. corrugated □ しわが寄った, ひだ状の
  15. debilitate □ 衰弱させる
  16. dehiscence □ (病名) 離開, 披裂, 裂開
  17. depict □ 描写する, 示す, 表す
  18. detach □ 脱離する, 剥離する, 離れる, 引き離す
  19. distinctive □ 特有の, 特徴的な, 弁別的な
  20. ensue □ 後に続く, 結果として起こる
  21. entail □ 必要とする, (必然的に) 伴う
  22. equivocal □ 多義的な, 疑わしい, 不確かな
  23. exclusively □ もっぱら, 独占的に, 排他的に
  24. hallmark □ (顕著な) 特徴, (品質などの) 証明
  25. illicit □ 違法な
  26. impinge □ 衝突する, 侵害する, 影響する
  27. inconclusive □ 決定的でない, 不確定の
  28. inconspicuous □ 目立たない
  29. indolent □ 無痛性の, 緩徐進行型の
  30. nonetheless □ ((文頭で用いて)) にもかかわらず
  31. obviate □ 除去する, 取り除く, 不必要にする
  32. poultry □ (食用の飼い鳥) 家禽, 家禽類
  33. predilection □ 偏向, 偏好
  34. presumably □ おそらく, 多分
  35. profuse □ 大量の
  36. putative □ 推定上の, 仮想の
  37. pyknotic □ 核濃縮の
  38. recrudescence □ 再発
  39. sequester □ 隔離する, 隔絶する, 捕捉する
  40. sessile □ 固着の, ((植物)) 無柄の
  41. spillage □ 溢流
  42. tangle □ もつれ, 濃縮体, ((動詞)) もつれる
  43. tentative □ 仮の, 試みの
  44. tether □ 繋ぎ止める, 繋留する, 係留する
  45. tortuous □ 蛇行状の
  46. tuft □ 房
  47. vault □ (かまぼこ様の形状) 円蓋, ((動詞)) 跳躍する
  48. vicinity □ 近傍, 近く
  49. violaceous □ (皮膚の紫色への変色を指す) 紫色の
  50. whereas □ 他方では, 一方では, ところが, しかるに
【考察】
 コーパス言語学とは、Wikipediaの記載によると、「実際に使用された言語資料の集成をコーパスと呼ぶが、最近では特に電子化された言語資料のことを指す。そのコーパスを利用して、より実際的な言語の仕組みを探る学問がコーパス言語学である。」と説明されている。つまり、従来の規範文法に従った言語学ではなく、実際に書かれたり話されたりする言葉を基にした言語学をいう。医学分野でいうEBM同様、演繹思考から帰納思考へ転換した概念である。コーパス言語学やEBMが言語学や医学の世界にデビューしたのは同時期であるが、これは偶然ではなく、コンピュータにより大量のデータの蓄積・解析が可能になったことが関係していると考えられる。
 コーパス言語学は、文学作品の作者の判定や作品の真贋など文献学に応用されることが多かったが、近年では自然科学の範囲にも応用され始め、科学論文の剽窃判定や精神医学分野では、自殺者の作品や遺書が解析の対象になっている。
 近年、コンピュータや記憶媒体、それらの上で走るソフトの高性能化、低価格化により個人レベルでも大量データの処理が可能になってきた。それに伴い、個人が自分の専門分野に必要なコーパスを作り、解析することが容易になってきた。そこで英語教育界に生まれたのがESP(English for Specific Purpose)という概念である。極論すれば、呼吸器学の研究者は、産婦人科学の文献はもちろん内科学一般の文献でさえ読む必要はないのである。自分の関心分野の文献さえ読めればよいと割り切れば、関心分野の論文を集め、コンコーダンサーソフトで解析すれば、読むのに必要な単語が得られるわけである。AntConc日本語チュートリアルを繙けば、論文を書こうと思ったときも、知っているが使い方の分からない単語の例文がたちどころに得られ、その単語が他のどういう単語と組み合わせて使われるか(コロケーション)を把握することが出来る。

【結語】
 読んだ文献、読みたい英語文献はテキスト化しておくと、コンコーダンサーソフトで解析することにより、テーラメイドの単語帳や例文集を容易に作成することができる。

2010年8月11日水曜日

オープンソースとオープンアクセス

 オープンソースの文献管理ソフトMendeleyとオープンアクセスの学術文献データベースCiNiiを利用すれば、上記のようなことが10分かそこらで出きるってことを長々と説明してしまいました。
 オープンソースソフトについては、YouTubeで"Revolution OS"というビデオを観て頂ければその経緯が分かるでしょう。
 オープンアクセスとは、ネット上で学術論文を誰でもアクセスできるようにするということです。各研究者が関連分野の雑誌を購読するコストが馬鹿にならないってことやアメリカなどでは税金からの補助を受けてなされた研究成果が納税者に公開されない矛盾から生じた運動。
 方法論には、2つある。「金の道」と呼ばれるオープンアクセスパブリッシングと「緑の道」と呼ばれるオープンアクセスセルフアーカイブという方法である。前者は、オンライン・ジャーナルの形態を残し、アクセスを自由化するという穏健な改革的方法。後者は、極論すれば、ジャーナルを廃し、各施設・各学会・、各人が発表物をネット上にアーカイブするという革命的方法。何故、金と緑の道なのかは、私も正確なところは知らないが、想像するに、ジャーナルという形態をとると、組織運営のため、資金を調達する必要が出てくる一方、セルフアーカイブであれば、各施設や個人が少額を負担するだけで済み、紙も必要がないから、地球環境にも優しいってことなんでしょうか。
 「金の道」の例としては、NEJMなど伝統的ジャーナルが一定期間をおいて論文を無料公開していることやBioMed Centralのような電子ジャーナルが最初から無料公開していることを挙げることができます。「緑の道」には、韓国の家庭医療学会雑誌の例があります。

2010年7月14日水曜日

クスリのリスクを知る3(つ)の法則

抗MRSA薬ザイボックスTMのインタビューフォーム1によると、国内のデータでは、(1)血小板減少の副作用は、100例中19例、(2)味覚倒錯の副作用は0例であった。それぞれの副作用発生率の95%信頼区間はどのくらいだろうか?後者のように分子がゼロのリスクの95%信頼区間を3秒以内に答えることができるようになるのが今日のSBOで、右掲書に紹介されている「3の法則」。

それだけでは、間が持たないので、比率の95%信頼区間について3つの法則(公式)を並べてみた。

番目の法則:正規近似による母比率の信頼区間。(Wald法)

はじめに
本来なら、副作用の有無のようなカテゴリ変数の確率は二項分布に従うので、ClopperとPearsonの方法2のアルゴリズムを利用するのが、原理的には正確である。統計ソフトRの関数binom.testでは、その方法が採用されている。しかし、統計ソフトを使わないと計算が煩雑で、実用的とは言い難い。そこで実際には、nが充分大きいとき、二項分布B(n,p)が正規分布N(np,np(1-p))で近似されることを利用した下記の式が通常の統計学の教科書には紹介されている。
公式
p=s/nのとき、前提条件として、np > 10 かつ n(1 – p) > 10 であることが必要。
95%信頼区間=p±1.96×√(p(1-p)/n)
例題
(1) 0.19±1.96*sqrt(0.19*0.81/100)= 0.190±0.077 ∴ 11.3~26.7%
(2) np=0になるため計算不能
の法則:Agrestiと Coullの方法

はじめに
Agresti とCoull はWald の方法を修正したものを提案した3。「2の法則」というのは、副作用あり・なしのそれぞれに2例ずつ加える計算方法から名づけてみたもので、一般的な呼称ではありません。この方法では、s=0 の場合やs=nであっても信頼区間が計算でき、さらに、原理的には正確なはずのClopperとPearsonの方法よりも精度が高いと報告されています。
公式
p=(s+2)/(n+4)
95%信頼区間=p±1.96×√(p(1-p)/(n+4))
例題
(1) 21/104±1.96*sqrt((21/104)*(83/104)/104)=0.202±0.077 ∴ 12.5~27.9%
(2) 2/104±1.96*sqrt((2/104)*(102/104)/104) =0.019±0.026 ∴ 0~4.5%
3の法則:ゼロ分子のリスクの推定法

はじめに
「2の法則」で計算可能だが、なにせ面倒と思うのは私だけではないらしい。英語圏では、簡単な方法が医学雑誌の記事4、統計学の教科書5、Wikipedia6など広く紹介されている。原理は、(1-p)n=0.05の両辺対数を取って、n×ln(1-p)=ln(0.05)。テーラー展開の第二項以降をネグると、ln(1-p)≈-pなので、np= –ln(0.05) = ln(20) = 2.9957 ≈ 3
公式
上側95%信頼区間=3/n
例題
(1) 分子≠0なので計算不能。
(2) 3/100=0.03 ∴ 0~3.0%
 ちなみに、例題の副作用は、同じインタビューフォームによると、海外データでは2,367例中血小板減少が9例(0.38%)、味覚倒錯が24例(1.01%)だったそうです。薬剤師さんがメーカーに国内データと海外データの違いについて問い合わせて頂いたところ、理由は明らかではないが、下記の3点が考えられるとのことでした。
  1. 国内試験のほうが、高齢者・重症者が多かった。
  2. 国内外で有害事象の報告義務の程度が異なる。
  3. 海外治験が先行していたため、国内試験では骨髄抑制に注目が集まった。
文献
  1. ザイボックスのインタビューフォー厶http://www.info.pmda.go.jp/go/interview/3/400079_6249002F1024_3_1F
  2. Clopper, C.; Pearson, E. S. (1934). "The use of confidence or fiducial limits illustrated in the case of the binomial". Biometrika 26: 404–413.
  3. Alan Agresti, Brent A. Coull Approximate Is Better than "Exact" for Interval Estimation of Binomial Proportions The American Statistician, Vol. 52, No. 2. (1998), pp. 119-126.
  4. Hanley JA, Lippman-Hand A. If nothing goes wrong, is everything all right? Interpreting zero numerators. JAMA. 1983 Apr 1;249(13):1743-5. http://www.medicine.mcgill.ca/epidemiology/hanley/Reprints/If_Nothing_Goes_1983.pdf
  5. Gerald van Belle "Statistical Rules of Thumb" http://www.vanbelle.org/chapters/webchapter2.pdf
  6. Wikipedia英語版 http://en.wikipedia.org/wiki/Rule_of_three_(medicine)

2010年6月12日土曜日

【補遺】ブックマークレット計算器3つ+α

前回投稿記事の補遺として、3つの自作計算器のブックマークレットを公開します。オンラインストーレジサービスのDropBoxのPublicフォルダにおいたファイルと連携させています。必要な計算器をご使用のブラウザのブックマークバーにDrag&Dropしてお使い下さい。但し、動作の確認は、OSはubuntu 10.4、ブラウザはGoogle Chrome 5.0.375.70 betaの環境でしかしておりません。また、間違いがあっても責任は負いかねます。
  • Bayes:事前確率と検査特性から事後確率を計算します。
  • eGFR:年齢とCre値からeGFRを計算します。
  • BMI:身長と体重からBMIを計算します。
 Google Chromeを使用していると、ブックマークを同期することができるので、職場と自宅で環境を揃えたいとき、OSをクリーンインストールするときなど非常に便利です。同じ働きをするものなら、拡張機能を入れるより、ブックマークレットをブックマークしておく方が良いと思う。個人的に使用しているものを紹介します。
    • Post to CiteULike[LINK]:文献共有サービスCiteULikeに表示されている文献を投稿します。
    • IMPORT TO MENDELEY[LINK]:文献管理ソフトMENDELEYに表示されている文献を読み込みます。
    • 英辞郎のブックマークレット[LINK]:選択した語の英訳・和訳を英辞郎で調べます。
    • Gmailで送信![LINK]:選択したテキストをGmailで送信する。

    2010年6月8日火曜日

    検査結果陽性の場合に病気である確率を知る10の方法

    問題
    突然、上腹部が痛いという主訴で60才男性が来院。診察して急性膵炎の検査前確率を20%と推定した。アミラーゼの感度(急性膵炎の患者さんでアミラーゼが上昇する確率)が80%、特異度(急性膵炎でない患者さんでアミラーゼが上昇しない確率)が80%として、アミラーゼ上昇を見た場合、実際に急性膵炎である確率は、次のどれに一番近いでしょう?
    A 25% B 50% C 75%
    方法1 自然頻度を用いる。
     2002年ノーベル経済学賞を受賞したダニエル・カーネマンらの説では、人間の脳は条件付き確率を過つように仕組まれているらしい。実際、右のモンティホール問題があしらわれた「リスク・リテラシーが身につく統計学的思考」という本の中では、法律家や医師という高学歴の人間 でさえも、直感では条件付き確率を誤ってしまうことを実証し、解決策を提言している。時間がない方には、著者による英国医学雑誌への寄稿が参考になる。
     要するに、感度とか特異度とかの分母が異なる確率を排し100人とか1000人とかの切れのよい集団を想定し絶対数で考えましょうということです。そうすると、問題は下のように言い換えられます。
    突発する上腹部痛の100名のうち20名が急性膵炎だとします。これらの急性膵炎の20人のうち16人がアミラーゼが上昇します。急性膵炎でない80人のうち16人でもアミラーゼが上昇します。今、突発する上腹部痛の方がアミラーゼが高かったとして、実際に急性膵炎である確率は?
    方法2 ツリーダイアグラムを用いる。
     上の考え方をマインドマップ風に書き出してみるとすっきりしますね。

                    検査陰性の4名
          急性膵炎の20名 <
                    検査陽性の16名
    100名 <
                      検査陽性の16名
          急性膵炎でない80名 <
                      検査陰性の64名
                       
    方法3 分割表 (Contingency table)を用いる。
     小飼弾氏がブログの記事「直感的な定理の反直観的な帰結」で推奨している方法です。下記のような2×2表を作ってやるというものです。
    TABLE急性膵炎
    非急性膵炎

    アミラーゼ上昇
    16
    16
    32
    アミラーゼ正常
    4
    64
    68

    20
    80
    100

     一般化すると、下図のようになります。矢印の意味は、始点の数値を矢印の方向の小計で割って下さいということです。
    方法4 同心円グラフを用いる。
     イメージ思考が得意な方は、グラフを思い描くのも一つの方法です。

    方法6 ベイズの定理に基づく公式を使う。
     感度は、原因があったときに結果が生じる確率で、今求めたいのは、結果があったときに原因がある「逆確率」。逆確率を得るには、原因の確率を掛けて、結果の確率で割りなさいというのが、ベイズの定理。原因の確率は、有病率。結果の確率は、真陽性の場合と偽陽性の場合の和なので、公式として書けば、下のようになる。


    公式を覚えるのも大変だし、計算が面倒ですね…

    方法7 検査後オッズ=検査前オッズ×尤度比の式を使う。
     そこで役立つのが、「オッズの魔法使い」。競馬をしない方には馴染みが薄いかもしれない。中国語では「発生比」というらしく、あることが起こる場合と起こらない場合の比、勝ち負けの比、表裏の比ということです。ですから、事前確率が20%ならオッズは20/80で0.25となります。
     次に尤度比。尤もらしさの比、疾患のある人において陽性結果がどれだけ出やすいか、つまり真陽性率÷偽陽性率。公式として書いておくと、下式になる。


    これら2つのツールを導入すると、計算自体が簡単で、連続した確率の更新も可能になります。話は逸れるが、0〜1の確率より、0〜∞のオッズのほうが、人間の確率認知に適した表現のような気もしています。例えば、臨床医学の箴言、"to cure sometimes, to relieve often, to comfort always"などは、オッズを用いると「1/2で治し、2/1で和らげ、3/0で慰める」と解釈できるのでした。

    方法8 McGeeの近似を使う。
     確率の増減の近似値は、尤度比を使ってΔP=0.19×lnLRで計算できるらしいです。この方法の弱点は事前確率が0.1〜0.9 の範囲でしか近似しないこと、普通の電卓で計算できないので下表を覚えておかなければならないことです。

    尤度比
    0.1
    0.2
    0.3
    0.4
    0.5
    0.6
    0.7
    0.8
    0.9
    確率の減
    -45
    -30
    -25
    -20
    -15
    -10
    -7
    -5
    -2
    尤度比
    2
    3
    4
    5
    6
    7
    8
    9
    10
    確率の増
    +15
    +20
    +25
    +30
    +35
    +37
    +40
    +42
    +45


    方法9 Faganのノモグラムを使う。
     下のノモグラムをコピーしてラミネート加工して栞として持ち歩くのもありですね。


    方法10 JavaScriptを用いる。

     解法6や解法7の公式をプログラムしておくという裏技。JavaScriptで書いてUSBメモリーに入れとけば、ブラウザさえあれば、OSを問わず使えます。ブラウザがあるなら、"EBM calculator"などをググって使うほうが手っ取り早いのですが、BMIやeGFRの計算などに流用できるので、敢えて拙いスクリプトを上げてみました。
    <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"><html lang="ja">
    <head>
    <meta http-equiv="content-type" content="text/html; charset=UTF-8">
    <link rev="made" href="hoge.hoge@gmail.com">
    <title>感度と特異度で検査前確率を検査後確率に更新する</title>
    <SCRIPT Language="JavaScript">
    function calc(){
    a=eval
    (document.ebm.pre.value);
    b=eval
    (document.ebm.sens.value);
    c=eval
    (document.ebm.spec.value);
    d=Math.round(b*a/(b*a+(100-c)*(100-a))*10000);
    e=Math.round(c*(100-a)/(c*(100-a)+(100-b)*a)*10000);
    document.ebm.ppv.value=d/100;
    document.ebm.npv.value=e/100;
    }
    </SCRIPT>
    </head>
    <body>
    <form method=post name="ebm">
    検査前確率:<input type="text" name="pre" value="" size="10">%<br>
    感度:<input type="text" name="sens" value="" size="10">%<br>
    特異度:<input type="text" name="spec" value="" size="10">%<br>
    <input type=button name=button value="計算" onClick="calc()">
    <input type=reset value="リセット"><br>
    陽性予測値: <input type="text" name="ppv" size="10">%<br>
    陰性予測値: <input type="text" name="npv" size="10">%<br>
    </form>
    </body>
    </html>

    下のように表示されれば、大成功です。

    2010年1月11日月曜日

    無料統計ソフト「R言語」


    【簡単な紹介】
    R言語とは、1984年、AT&Tベル研究所で開発された統計処理言語であるS言語を参考に、ニュージーランドのAuckland大学のRoss IhakaとRobert Gentlemanにより学生の教育を目的に開発された。オープンソースとして開発が継続されているため、世界中の専門家が磨きをかけ、パッケージを追加し、現在では、FDA内部やGoogleでも使用されるに至っています。 Sの先を行くという願いを込めてRと名付けられたそうです。しかし、その短い名称が徒になり、ネットでの関連情報の検索は困難でした。そんな状況を打開するため、Rjpwiki(後述)のような関連情報の集積場所が出来ることとなりました。

    【R本体のインストール】
    1. The Comprehensive R Archive Network のサイトへ行く。
    2. "Download and Install R"の"Windows"をクリック。
    3. "base"をクリック。
    4. "Download R 2.10.1 for Windows"をクリックすると、ダウンロードが開始。
    5. ダウンロードが終了したら、そのファイルをダブルクリックして指示にしたがってインストール。
    【デモ:起動、t検定、ヘルプ、終了】
    • デスクトップにできたショートカットをダブルクリックして起動。
    • 次のスクリプトを実行
    nations<-read.csv("C:/Documents and Settings/foo/デスクトップ/sample.csv")
    asia<-subset(nations, region=="Asia")
    europe<-subset(nations, region=="Europe")
    t.test(asia$area, europe$area)
    • ヘルプ ?foo、help.search("foo")
    • 終了 q()
    【Rcmdrのインストールと実行】
    • R上で、install.packages("Rcmdr") と入力。
    • ダウンロード元を選択して、しばし待つ。
    • R上で、library(Rcmdr) と入力すると、Rcmdrが起動。
    【間奏曲~Rの利点と欠点】

    利点!
    • 無料。ちなみに、JMP 8.0.1 は、176,400円、Dr.SPSS2は102,900円、エクセル統計2008は、41,580円
    • OSを選ばない。Windows、MacOS X、Linuxなど主要なOS版がある。
    • オープンソースなので、バグの修正や統計学の新しい理論の適用が早い。
    欠点? 見方を変えれば利点。解決策も用意されている。
    • リソースが圧倒的に英語→英語の勉強になる。解決策:Rjpwikiの利用、日本語R関連図書
    • コマンドで操作→慣れると、かえって便利。解決策:Rcmdrパッケージ
    【Rcmdrのデモ】
    • データ→データのインポート→テキストファイルまたはクリップボード、URLから…
    • 統計量→平均→独立サンプルt検定…
    【参考図書】
    【参考サイト】