Błąd ekologiczny, zwany również błędem wnioskowania ekologicznego, w epidemiologii, błąd w rozumowaniu, który powstaje, gdy wnioskowanie jest dokonywane na temat jednostki na podstawie danych zbiorczych dla grupy. W badaniach ekologicznych (badania obserwacyjne zależności pomiędzy czynnikami modyfikującymi ryzyko a zdrowiem lub innymi wynikami w populacjach), agregacja danych powoduje utratę lub ukrycie pewnych szczegółów informacji. Ze statystycznego punktu widzenia korelacja jest zazwyczaj większa, gdy związek jest oceniany na poziomie grupy, niż gdy jest oceniany na poziomie indywidualnym. Niemniej jednak, szczegóły dotyczące jednostek mogą zostać pominięte w zbiorczych zestawach danych. Istnieje wiele przykładów ekologicznego błędu; trzy z nich są opisane w tym artykule.
W pierwszym przykładzie, badacze chcą zbadać związki między natywnością (reprezentowaną przez procent populacji, która jest urodzona za granicą) i umiejętnością czytania i pisania (reprezentowaną przez procent populacji, która potrafi czytać i pisać), z obliczeniami opartymi na populacjach w różnych stanach USA. W takim dochodzeniu, korelacje mogą być pozbawione znaczenia, jeśli osoby urodzone za granicą mają tendencję do życia w stanach, gdzie rodowici są bardziej literat.
W innym przykładzie, w badaniu mającym na celu zbadanie relacji między dietą, stylem życia, choroby serca i udaru mózgu, naukowcy odkryli, że średnie ciśnienie krwi na poziomie początkowym i śmiertelność udaru były odwrotnie skorelowane dla niektórych kohort (grupy badawcze) mężczyzn w wieku 45 do 59 z 25-letniej obserwacji. Odkrycie to było sprzeczne z oczekiwaniami. Kolejne analizy przeprowadzone na poziomie indywidualnym wykazały, że związek między ciśnieniem tętniczym a śmiertelnością z powodu udaru mózgu był silnie dodatni w większości badanych grup. Wyjaśnienie tego paradoksu polega na tym, że w każdej kohorcie osoby, które doświadczyły udaru i które zmarły z powodu udaru, miały tendencję do wysokiego ciśnienia krwi. Jednakże, gdy indywidualne wartości w każdej kohorcie zostały uśrednione i użyte do obliczenia korelacji, kohorty z wyższym średnim ciśnieniem krwi mogły okazać się mieć mniejsze wskaźniki śmiertelności po prostu z powodu heterogeniczności korelacji wśród kohort.
W trzecim przykładzie, badacze odkryli, że wskaźniki zgonów z powodu raka piersi były znacznie zwiększone w krajach, w których spożycie tłuszczu było wysokie w porównaniu z krajami, w których spożycie tłuszczu było niskie. To jest stowarzyszenie dla danych zagregowanych, w których jednostką obserwacji jest kraj. Tak więc w krajach, w których jest więcej tłuszczu w diecie i wyższe wskaźniki zachorowań na raka piersi, kobiety, które jedzą tłuste pokarmy niekoniecznie są bardziej narażone na zachorowanie na raka piersi. Nie można być pewnym, że przypadki raka piersi miały wysokie spożycie tłuszczu.
W celu określenia, czy hipotezy ekologiczne wygenerowane przez analizy na poziomie grupy są prawdziwe dla jednostek, dane na poziomie indywidualnym muszą być zbierane. Dla wnioskowania przyczynowego, dane indywidualne są wymagane w celu uwzględnienia heterogeniczności populacji i uprzedzeń konfundujących.
.