¿Cómo se puede detectar y es importante?
La heterogeneidad estadística es evidente sólo después del análisis de los resultados. La heterogeneidad puede juzgarse gráficamente (observando el diagrama de bosque) y medirse estadísticamente. En un gráfico de bosque de la revisión sistemática de la suplementación con calcio2 , las barras de error de cada ensayo incluyen el resultado resumido, lo que sugiere que la heterogeneidad estadística no es un problema y que el mensaje es consistente (fig. 22).
Diagrama de bosque adaptado de Winzenberg et al2 que muestra la ausencia de heterogeneidad estadística en las odds ratio para el efecto de la suplementación con calcio sobre la densidad mineral ósea. DME=diferencia de medias estandarizada
Para determinar si existe una heterogeneidad significativa, busque el valor P de la prueba de χ2 de heterogeneidad. Un valor P alto es una buena noticia porque sugiere que la heterogeneidad es insignificante y que se puede seguir adelante y resumir los resultados. Dado que las pruebas estadísticas de heterogeneidad no son muy potentes, es sensato utilizar un valor P más alto de lo habitual (digamos, P>0,1) como punto de corte para tomar una decisión y pensar en la heterogeneidad clínica de todos modos.
La revisión sistemática de los suplementos de calcio pasa la prueba, y los autores han resumido correctamente los efectos sobre la densidad ósea utilizando un modelo simple de efectos fijos. Este modelo asume que todos los ensayos intentan medir lo mismo y que se debe dar más influencia a los ensayos más grandes cuando se calcula un efecto medio.4
¿Pero qué pasa si el valor P de la prueba de χ2 de heterogeneidad es bajo, lo que sugiere una heterogeneidad significativa? ¿Qué se puede hacer? Hay dos enfoques posibles. Podemos evitar resumir el resultado y buscar las razones de la heterogeneidad, o podemos resumir los efectos utilizando otro método: el modelo de efectos aleatorios. Las razones de la heterogeneidad, aparte de las diferencias clínicas, podrían incluir cuestiones metodológicas como problemas con la aleatorización, la finalización temprana de los ensayos, el uso de medidas de riesgo absolutas en lugar de relativas y el sesgo de publicación.
Los autores de la revisión sistemática de los medicamentos utilizados para prevenir las reacciones alérgicas causadas por los medios de contraste adoptaron el primer enfoque.1 Los gráficos de bosque sugieren que las dos clases de fármacos tienen efectos diferentes, en particular para las reacciones cutáneas, y el valor P para la prueba estadística de heterogeneidad fue significativo en 0,03. Decidieron no resumir un efecto medio y consideraron que la diferencia entre los tratamientos formaba parte del mensaje de la revisión.
Los autores de la revisión de las intervenciones para prevenir las caídas y las fracturas adoptaron el segundo enfoque.3 El diagrama de bosque para las caídas en el hospital muestra una gran dispersión de resultados (fig. 33). Algunos ensayos sugieren beneficios y otros sugieren perjuicios de las intervenciones multifacéticas. Los autores presentan la estadística I 2, que mide el porcentaje de variación que no se debe al azar. Un porcentaje alto, como el 80% visto aquí, sugiere una importante heterogeneidad. (Un valor de I 2 de <25% se considera bajo.5)
Diagrama de bosque de Oliver et al3 que muestra los cocientes de tasas (modelo de efectos aleatorios) para los efectos de las estrategias de prevención de caídas
No obstante, los autores consideraron que todos los ensayos intentaban medir esencialmente lo mismo y que merecía la pena resumir los resultados. Utilizaron el modelo de efectos aleatorios, que utiliza una fórmula diferente para calcular intervalos de confianza del 95% más conservadores. Se supone que los efectos del tratamiento varían en torno a algún efecto medio global del tratamiento, a diferencia de un modelo de efectos fijos, en el que se supone que cada estudio tiene el mismo efecto de tratamiento común fijo.4
Las revisiones sistemáticas con un meta-análisis intentan proporcionar mejores respuestas numéricas a las preguntas, «¿cuál es el efecto de esta intervención y cuán seguros estamos de ello?» Pero antes de creer en los resultados de este método, puede ser útil considerar cuatro preguntas (ver cuadro).
Preguntas útiles a considerar
-
¿Fue realmente una buena idea combinar los ensayos?
-
¿Hay demasiada heterogeneidad clínica para que la revisión tenga sentido?
-
¿Los gráficos de bosque parecen consistentes?
-
¿Sugieren las pruebas estadísticas que la heterogeneidad es un problema?