Ecological fallacy, numită și eroare de inferență ecologică, în epidemiologie, eroare de raționament care apare atunci când se face o inferență despre un individ pe baza unor date agregate pentru un grup. În studiile ecologice (studii observaționale ale relațiilor dintre factorii de modificare a riscului și sănătatea sau alte rezultate la nivelul populațiilor), agregarea datelor duce la pierderea sau ascunderea anumitor detalii ale informațiilor. Din punct de vedere statistic, o corelație tinde să fie mai mare atunci când o asociere este evaluată la nivel de grup decât atunci când este evaluată la nivel individual. Cu toate acestea, este posibil ca în seturile de date agregate să se piardă detalii despre indivizi. Există o varietate de exemple de eroare ecologică; trei dintre ele sunt descrise în acest articol.
În primul exemplu, cercetătorii doresc să studieze relațiile dintre nativitate (reprezentată de procentul populației născute în străinătate) și alfabetizare (reprezentată de procentul populației alfabetizate), cu calcule bazate pe populațiile din diferite state americane. Într-o astfel de investigație, corelațiile ar putea fi lipsite de sens dacă indivizii născuți în străinătate tind să trăiască în state în care cei născuți în țară sunt mai alfabetizați.
Într-un alt exemplu, într-un studiu conceput pentru a examina relațiile dintre dietă, stilul de viață, bolile de inimă și accidentele vasculare cerebrale, cercetătorii au descoperit că valorile medii ale tensiunii arteriale la nivel de intrare și ratele de mortalitate prin accident vascular cerebral au fost invers corelate pentru anumite cohorte (grupuri de studiu) de bărbați cu vârste cuprinse între 45 și 59 de ani, cu o monitorizare de 25 de ani. Constatarea a fost contrară așteptărilor. Analizele ulterioare efectuate la nivel individual au arătat că asocierea dintre tensiunea arterială și mortalitatea prin accident vascular cerebral a fost puternic pozitivă în cele mai multe dintre grupurile de studiu. Explicația acestui paradox este că, în cadrul fiecărei cohorte, persoanele care au suferit un accident vascular cerebral și care au decedat în urma unui accident vascular cerebral au avut tendința de a avea o tensiune arterială ridicată. Cu toate acestea, atunci când valorile individuale din fiecare cohortă au fost mediate și folosite pentru a calcula corelația, cohortele cu presiuni arteriale medii mai mari s-ar fi dovedit a avea rate de mortalitate mai mici, pur și simplu din cauza eterogenității corelațiilor dintre cohorte.
Într-un al treilea exemplu, cercetătorii au descoperit că ratele de mortalitate din cauza cancerului de sân au fost semnificativ mai mari în țările în care consumul de grăsimi era ridicat în comparație cu țările în care consumul de grăsimi era scăzut. Aceasta este o asociere pentru date agregate în care unitatea de observație este țara. Astfel, în țările cu mai multe grăsimi în alimentație și cu rate mai mari de cancer de sân, femeile care consumă alimente grase nu au neapărat o probabilitate mai mare de a face cancer de sân. Nu se poate fi sigur că cazurile de cancer de sân au avut un consum ridicat de grăsimi.
Pentru a determina dacă ipotezele ecologice generate de analizele la nivel de grup sunt adevărate pentru indivizi, trebuie colectate date la nivel individual. Pentru inferența cauzală, datele individuale sunt necesare pentru a ține cont de eterogenitatea populației și de prejudecățile de confuzie.
.