Jak ji zjistit a má význam?
Statistická heterogenita se projeví až po analýze výsledků. Heterogenitu lze posoudit graficky (pohledem na lesní graf) a změřit statisticky. Na lesním grafu ze systematického přehledu suplementace vápníkem2 jsou chybové úsečky pro každou studii včetně souhrnného výsledku, což naznačuje, že statistická heterogenita není problém a že jde o konzistentní sdělení (obr. 22).
Lesní graf upravený podle Winzenberga et al2 , který ukazuje absenci statistické heterogenity v poměrech šancí pro účinek suplementace vápníkem na hustotu kostních minerálů. SMD = standardizovaný průměrný rozdíl
Chcete-li určit, zda existuje významná heterogenita, vyhledejte hodnotu P pro χ2 test heterogenity. Vysoká hodnota P je dobrou zprávou, protože naznačuje, že heterogenita je nevýznamná a že lze pokračovat v sumarizaci výsledků. Protože statistické testy heterogenity nejsou příliš silné, je rozumné použít vyšší hodnotu P než obvykle (řekněme P>0,1) jako mezní hodnotu pro rozhodnutí a na klinickou heterogenitu stejně myslet.
Systematický přehled suplementace vápníkem tímto testem prošel a autoři správně shrnuli účinky na hustotu kostí pomocí jednoduchého modelu s fixními efekty. Tento model předpokládá, že všechny studie se snaží měřit totéž a že při výpočtu průměrného účinku by měly mít větší vliv větší studie.4
Ale co když je hodnota P pro χ2 test heterogenity nízká, což naznačuje významnou heterogenitu? Co lze dělat? Jsou možné dva přístupy. Buď se můžeme vyhnout shrnutí výsledku a hledat důvody heterogenity, nebo můžeme shrnout účinky pomocí jiné metody – modelu náhodných efektů. Mezi důvody heterogenity, kromě klinických rozdílů, mohou patřit metodologické problémy, jako jsou problémy s randomizací, předčasné ukončení studií, použití absolutních, nikoli relativních měr rizika a publikační zkreslení.
Autoři systematického přehledu léků používaných k prevenci alergických reakcí způsobených kontrastními látkami zvolili první přístup.1 Lesní grafy naznačují, že obě třídy léků mají rozdílné účinky, zejména v případě kožních reakcí, a hodnota P pro statistický test heterogenity byla významná 0,03. V případě, že se jedná o léky, které se používají k prevenci alergických reakcí způsobených kontrastními látkami, byla hodnota P pro statistický test heterogenity významná. Rozhodli se neshrnovat průměrný účinek a domnívali se, že rozdíl mezi léčebnými postupy je součástí poselství přehledu.
Druhý přístup zvolili autoři přehledu intervencí pro prevenci pádů a zlomenin.3 Lesní graf pro pády v nemocnici ukazuje široký rozptyl výsledků (obr. 33). Některé studie naznačují přínos a jiné naznačují škodlivost mnohostranných intervencí. Autoři uvádějí statistiku I 2, která měří procento variability, jež není způsobeno náhodou. Vysoké procento, jako je zde uvedených 80 %, naznačuje významnou heterogenitu. (Hodnota I 2 <25 % je považována za nízkou.5)
Lesní graf od Olivera et al3 zobrazující poměry četností (model náhodných účinků) pro účinky strategií prevence pádů
Nicméně autoři se domnívali, že všechny studie se snaží měřit v podstatě totéž a že stojí za to shrnout výsledky. Použili model náhodných efektů, který používá jiný vzorec pro výpočet konzervativnějších 95% intervalů spolehlivosti. Předpokládá se, že účinky léčby se pohybují kolem určitého celkového průměrného účinku léčby, na rozdíl od modelu fixních účinků, u kterého se předpokládá, že každá studie má stejný fixní společný účinek léčby.4
Systematické přehledy s metaanalýzou se snaží poskytnout lepší číselné odpovědi na otázky „jaký je účinek této intervence a jak jsme si tím jisti?“. Než však uvěříme výsledkům této metody, mohlo by být užitečné zvážit čtyři otázky (viz rámeček).
Užitečné otázky ke zvážení
-
Bylo skutečně dobrým nápadem kombinovat studie?
-
Je klinická heterogenita příliš velká na to, aby měl přehled smysl?
-
Vypadají lesní grafy konzistentně?
-
Naznačují statistické testy, že heterogenita je problém?