Falácia ecológica, também chamada de falácia da inferência ecológica, em epidemiologia, falha no raciocínio que surge quando se faz uma inferência sobre um indivíduo com base em dados agregados de um grupo. Em estudos ecológicos (estudos observacionais das relações entre fatores modificadores de risco e saúde ou outros resultados em populações), a agregação de dados resulta na perda ou ocultação de certos detalhes de informação. Estatisticamente, uma correlação tende a ser maior quando uma associação é avaliada ao nível do grupo do que quando é avaliada ao nível individual. No entanto, os detalhes sobre os indivíduos podem não estar presentes nos conjuntos de dados agregados. Há uma variedade de exemplos de falácia ecológica; três são descritos neste artigo.
No primeiro exemplo, os pesquisadores querem estudar as relações entre natividade (representada pela porcentagem da população nascida no exterior) e alfabetização (representada pela porcentagem da população alfabetizada), com cálculos baseados em populações em vários estados dos EUA. Em tal investigação, as correlações poderiam se tornar sem sentido se os indivíduos nascidos no exterior tendessem a viver em estados onde os nativos são mais alfabetizados.
Em outro exemplo, em um estudo destinado a examinar as relações entre dieta, estilo de vida, doenças cardíacas e acidente vascular cerebral, os pesquisadores descobriram que a pressão arterial média inicial e as taxas de mortalidade por acidente vascular cerebral eram inversamente correlacionadas para certas coortes (grupos de estudo) de homens de 45 a 59 anos de idade com acompanhamento de 25 anos. O achado foi contrário às expectativas. Análises subseqüentes realizadas a nível individual mostraram que a associação entre pressão arterial e mortalidade por acidente vascular cerebral foi fortemente positiva na maioria dos grupos de estudo. A explicação deste paradoxo é que, dentro de cada coorte, os indivíduos que tinham sofrido um acidente vascular cerebral e que tinham morrido de um acidente vascular cerebral tendiam a ter pressão arterial elevada. No entanto, quando os valores individuais em cada coorte foram calculados em média e utilizados para calcular a correlação, as coortes com pressões sanguíneas médias mais elevadas podem ter tido taxas de mortalidade menores simplesmente devido à heterogeneidade de correlações entre as coortes.
Num terceiro exemplo, os investigadores descobriram que as taxas de mortalidade por cancro da mama aumentaram significativamente em países onde o consumo de gordura era elevado quando comparado com países onde o consumo de gordura era baixo. Esta é uma associação para dados agregados em que a unidade de observação é o país. Assim, em países com mais gordura na dieta e maiores taxas de câncer de mama, as mulheres que comem alimentos gordurosos não são necessariamente mais propensas a contrair câncer de mama. Não se pode ter a certeza de que os casos de cancro da mama tenham tido um elevado consumo de gordura.
Para determinar se as hipóteses ecológicas geradas pelas análises em nível de grupo são verdadeiras para os indivíduos, os dados em nível individual devem ser coletados. Para a inferência causal, os dados individuais são necessários para explicar a heterogeneidade da população e o viés confuso.