κ統計値の意義と計算法:
インフルエンザを多く診てきて、咽頭後壁に出来る上咽頭から縦に襞状にカーテンのように降りてくるリンパ濾胞の腫大が所見として特異性が高い印象を持っていました。文献検索をしてみましたが、そのような文献は見つけることができず、プチリサーチをしてみた結果が、下記tableです。
κ統計値の応用:
迅速検査陽性
|
迅速検査陰性
|
計
| |
咽頭後壁襞状リンパ濾胞あり
|
3
|
1
|
4
|
咽頭後壁襞状リンパ濾胞なし
|
2
|
4
|
6
|
計
|
5
|
5
|
10
|
迅速検査をGolden Standardとすると、咽頭後壁襞状リンパ濾胞の検査特性は、感度=3/5=0.6、特異度=4/5=0.8となります。これは、迅速検査がある程度正しい場合に、咽頭所見の妥当性(validity)、確度(accuracy)、つまり的中の度合いを示しています。[1]しかし実際には、迅速検査自体が、そんなにあてになる検査ではないので、せいぜいで検査結果の信頼性(reliability)、精度(precision)、つまりブレない度合いを評価するほうが良いと思われます。
実際の計算は、判断の一致率をPo,偶然の一致率をPeとすると、以下の式で表される。[2]
κ統計値=(Po-Pe)/(1-Pe)
例のように、カテゴリー数が陽性と陰性というふうに2つの場合、以下のように比較的簡単に筆算でも計算することができます。Po=実際の一致率=(3+4)/10=0.7
陽性結果が偶然一致する確率=4/10*5/10=0.2
陰性結果が偶然一致する確率=6/10*5/10=0.3
Pe=結果が偶然一致する確率=0.2+0.3=0.5
κ値=(0.7-0.5)/(1-0.5)=0.4
カテゴリー数が多く計算が面倒な場合には、Rなどの統計ソフトを使うのが便利です。fmsbパッケージを使った例の計算の場合のスクリプトを示します。fmsbパッケージは、上掲書で使われた有用な関数をまとめたものです。
> install.packages("fmsb") #fmsbパッケージをインストールしますRを使うと、カテゴリー数が多くなっても計算できること、95%信頼区間まで計算してくれること、Landis and Koch[3]の基準による判定までしてくれるというメリットがあります。
--- このセッションで使うために、CRANのミラーサイトを選んでください ---
URL 'http://cran.md.tsukuba.ac.jp/bin/macosx/leopard/contrib/2.12/fmsb_0.2.tgz' を試しています
Content type 'application/x-gzip' length 78762 bytes (76 Kb)
開かれた URL
==================================================
downloaded 76 Kb
ダウンロードされたパッケージは、以下にあります /var/folders/cb/cbprP5nfG7Ciei1Q9q4QaU+++TI/-Tmp-//RtmpyRYuFO/downloaded_packages
> library(fmsb) #fmsbパッケージの読み込み
> Kappa.test(matrix(c(3,1,2,4),2,2,byrow=T)) #
$Result
Estimate Cohen's kappa statistics and test the null hypothesis
that the extent of agreement is same as random (kappa=0)
data: matrix(c(3, 1, 2, 4), 2, 2, byrow = T)
Z = 1.2649, p-value = 0.1030
95 percent confidence interval:
-0.1680515 0.9680515
sample estimates:
[1] 0.4
$Judgement
[1] "Fair agreement"
>
κ統計値の応用:
κ統計値は前回のSEAでのように身体所見の信頼性を検討する文献などで用いられることが多いのですが、今回は先日完結したドラマERにトリビュートして、ドイツの医師会誌"Deutsche Ärzteblatta"の国際版に発表された救急外来でのトリアージシステムを比較検討した文献[4]を紹介します。以下に見るように、ESIの基準が信頼性が高いようです。その理由は、"ESI Handbook"の図2-1のアルゴリズムを見ると一目瞭然なのですが、「KISSの原則」に則っているということがあるようです。
Manchester Triage Scale (MTS)参考文献
Australasian Triage Scale (ATS)
- 成人患者における4つの解析 (n = 50〜167)で、κ = 0.31〜0.62
Canadian Triage and Acuity Scale (CTAS)
- 成人患者における6つの解析 (n = 20〜3,650)で、κ = 0.25〜0.56
Emergency Severity Index (ESI)
- 成人患者における8つの解析 (n = 50〜32,261)で、κ = 0.68〜0.89
- 小児患者における4つの解析 (n = 54〜1,618)で、κ = 0.51〜0.72
- 成人患者における12の解析(n = 202〜3,172)で、κ = 0.46〜0.91
- 16歳未満の小児患者における1つの解析(n = 150)で、κ = 0.82
[1] Fam Med. 2005 May;37(5):360-3.Understanding interobserver agreement: the kappa statistic.Viera AJ, Garrett JM.
[2] A Coefficient of Agreement for Nominal Scales
Educational and Psychological Measurement April 1960 20: 37-46[3] Landis JR, Koch GG. The measurement of observeragreement for categorical data. Biometrics 1977; 33: 159-74.
[4] Dtsch Arztebl Int. 2010 December; 107(50): 892–898. Modern Triage in the Emergency Department