How can you detect it and does it matter?
Statistical heterogeneity is apparent only after the analysis of the results.統計的不均一性は結果の解析後に明らかになります。 異質性は(フォレストプロットを見ることで)グラフィカルに判断でき、統計的に測定することができます。 カルシウム補給のシステマティックレビューからのフォレストプロットでは2、各試験のエラーバーは要約結果を含んでおり、統計的異質性は問題ではなく、一貫したメッセージであることを示唆している(図22))。
カルシウム補給の骨密度への効果に関するオッズ比に統計的異質性がないことを示すWinzenbergら2からの引用によるForest plot(森グラフ)。 SMD=standardised mean difference
有意な異質性が存在するかどうかを判断するには、異質性のχ2検定におけるP値を調べることである。 P値が高いということは、異質性が重要でないことを示唆しており、先に進んで結果をまとめることができるため、良いニュースです。 異質性の統計的検定はあまり強力ではないので、通常より高いP値(例えば、P>0.1)を判断基準として使用し、とにかく臨床的異質性について考えることが賢明です。
カルシウム補給に関するシステマティックレビューはこのテストに合格し、著者は単純な固定効果モデルを用いて骨密度への効果を正しくまとめている。 このモデルは、すべての試験が同じものを測定しようとしており、平均効果を計算する際にはより大きな試験に多くの影響を与えるべきだと仮定している4
しかし、異質性のχ2検定のP値が低く、著しい異質性を示唆していたらどうだろうか。 どうすればよいのだろうか。 2つのアプローチが可能です。 結果の要約を避けて異質性の理由を探すか、別の方法-ランダム効果モデル-を用いて効果を要約することができます。 異質性の理由としては、臨床的な差異以外に、無作為化の問題、試験の早期終了、相対的ではなく絶対的なリスク測定の使用、出版バイアスなどの方法論的な問題が考えられる。
転倒予防戦略の効果に関する率比(ランダム効果モデル)を示すOliverら3による森林プロット
にもかかわらず、著者らはすべての試験が本質的に同じことを測定しようとしていると考え、結果を要約する価値があることを感じたと述べている。 彼らは、より保守的な95%信頼区間を計算するために異なる式を使用するランダム効果モデルを使用した。 各研究が同じ固定した共通の治療効果を持つと仮定する固定効果モデルとは対照的に、治療の効果はある全体的な平均治療効果の周りで変化すると仮定します4
メタアナリシスによる系統的レビューでは、「この介入の効果は何か、それについてどれくらい確かか」という質問に対してより良い数値の答えを出そうとします。 しかし、この方法の結果を信じる前に、4つの質問(囲み参照)を考えることが有用かもしれない。
考えるべき有用な質問
-
試験を組み合わせるのは本当に良いアイデアだったのか?
-
レビューが意味をなすには臨床的異質性が高すぎないか?
-
フォレストプロットは一貫していますか?
-
統計的検定は異質性が問題であることを示唆しているか。