Falacia ecológica, también llamada falacia de inferencia ecológica, en epidemiología, fallo en el razonamiento que surge cuando se hace una inferencia sobre un individuo basada en datos agregados de un grupo. En los estudios ecológicos (estudios observacionales de las relaciones entre los factores modificadores del riesgo y la salud u otros resultados en las poblaciones), la agregación de datos da lugar a la pérdida u ocultación de ciertos detalles de información. Estadísticamente, una correlación tiende a ser mayor cuando se evalúa una asociación a nivel de grupo que cuando se evalúa a nivel individual. No obstante, en los conjuntos de datos agregados pueden perderse detalles sobre los individuos. Hay varios ejemplos de falacia ecológica; en este artículo se describen tres de ellos.
En el primer ejemplo, los investigadores quieren estudiar las relaciones entre la natividad (representada por el porcentaje de la población que ha nacido en el extranjero) y la alfabetización (representada por el porcentaje de la población que sabe leer y escribir), con cálculos basados en las poblaciones de varios estados de Estados Unidos. En una investigación de este tipo, las correlaciones podrían carecer de sentido si los individuos nacidos en el extranjero tienden a vivir en estados en los que los nativos están más alfabetizados.
En otro ejemplo, en un estudio diseñado para examinar las relaciones entre la dieta, el estilo de vida, las enfermedades cardíacas y los accidentes cerebrovasculares, los investigadores descubrieron que la media de las presiones sanguíneas de entrada y las tasas de mortalidad por accidentes cerebrovasculares estaban inversamente correlacionadas para ciertas cohortes (grupos de estudio) de hombres de 45 a 59 años con un seguimiento de 25 años. El hallazgo fue contrario a lo esperado. Los análisis posteriores realizados a nivel individual mostraron que la asociación entre la presión arterial y la mortalidad por ictus era fuertemente positiva en la mayoría de los grupos de estudio. La explicación de esta paradoja es que, dentro de cada cohorte, los individuos que habían sufrido un ictus y que habían fallecido a causa de él tendían a tener la presión arterial elevada. Sin embargo, cuando se promediaron los valores individuales de cada cohorte y se utilizaron para calcular la correlación, las cohortes con presiones sanguíneas medias más altas pueden haber resultado tener tasas de mortalidad más pequeñas simplemente debido a la heterogeneidad de las correlaciones entre las cohortes.
En un tercer ejemplo, los investigadores descubrieron que las tasas de mortalidad por cáncer de mama aumentaban significativamente en los países en los que el consumo de grasas era elevado en comparación con los países en los que el consumo de grasas era bajo. Se trata de una asociación para datos agregados en la que la unidad de observación es el país. Por lo tanto, en los países con más grasa en la dieta y mayores tasas de cáncer de mama, las mujeres que consumen alimentos grasos no son necesariamente más propensas a padecer cáncer de mama. No se puede asegurar que los casos de cáncer de mama tuvieran una alta ingesta de grasas.
Para determinar si las hipótesis ecológicas generadas por los análisis a nivel de grupo son ciertas para los individuos, se deben recopilar datos a nivel individual. Para la inferencia causal, los datos individuales son necesarios para tener en cuenta la heterogeneidad de la población y el sesgo de confusión.