生態学的誤謬(ecological inference fallacy)とも呼ばれ、疫学において、グループの集計データに基づいて個人について推論する際に生じる推論の誤り。 生態学的研究(集団におけるリスク修飾因子と健康やその他の結果との関係についての観察研究)において、データを集計することにより、ある種の詳細な情報が失われたり、隠されたりすることになる。 統計学的に、相関は個人レベルで評価するよりも集団レベルで評価する方が大きくなる傾向がある。 それにもかかわらず、集計されたデータセットでは、個人に関する詳細が見落とされることがある。 生態学的誤謬のさまざまな例があり、この記事では3つを説明する。
最初の例では、研究者は出生率(外国生まれの人口の割合で表される)と識字率(識字できる人口の割合で表される)の関係を調査したいと考えており、米国の各州の人口に基づいて計算を行ったとする。
別の例では、食事、ライフスタイル、心臓病、脳卒中の関係を調べるための研究で、45歳から59歳の男性のあるコホート(研究グループ)において、25年間の追跡調査の結果、平均入室時血圧と脳卒中死亡率が逆相関であることが判明しました。 この発見は予想に反していた。 その後、個人レベルでの解析が行われ、ほとんどの研究グループにおいて血圧と脳卒中死亡率との間に強い正の相関があることが示された。 このパラドックスの説明は、各コホート内で、脳卒中を経験した人、脳卒中で死亡した人は高血圧の傾向があったということである。 しかし、各コホートの個々の値を平均して相関を計算すると、平均血圧の高いコホートは、単にコホート間の相関の不均一性のために死亡率が小さいことが判明したのかもしれない。
3番目の例では、脂肪の消費が高い国では、脂肪消費の低い国と比べて乳がんによる死亡率が有意に高いことが研究者によって発見された。 これは、観測単位が国である集計データに対する関連付けです。 したがって、食事に脂肪が多く、乳がんの発生率が高い国では、脂肪の多い食品を食べる女性が必ずしも乳がんになりやすいとは言えない。 473>
グループレベルの分析で生まれた生態学的仮説が個人でも正しいかどうかを判断するには、個人レベルのデータを収集する必要があります。 因果関係を推論するためには、集団の不均一性と交絡バイアスを考慮した個人データが必要である
。