Klinisch onderzoek in de fysiotherapie is van fundamenteel belang om nieuwe kennis te genereren en onze therapieën te valideren. De evaluatie van onderzoeksresultaten is van cruciaal belang voor de klinische besluitvorming en om te voldoen aan de principes van evidence based-practice. Statistische significantietesten domineren de manier waarop onderzoekers hun resultaten rapporteren en hun significantie evalueren.1, 2 Deze benadering wordt vaak gebruikt om het belang en de generaliseerbaarheid van onderzoeksresultaten te bepalen en om het effect van een interventie in gezondheidsonderzoek aan te tonen. Deze benadering is echter beperkt bruikbaar voor clinici en besluitvormers die proberen de best mogelijke behandeling aan patiënten aan te bieden.
Statistische significantie is gebaseerd op het testen van hypothesen (d.w.z. nulhypothese versus alternatieve hypothese).3 De beslissing om de nulhypothese te aanvaarden of te verwerpen is gebaseerd op vooraf bepaalde waarschijnlijkheidsniveaus (d.w.z. p < 0,05 of 0,01) die worden gebruikt om de sterkte van het bewijs tegen de nulhypothese te testen.4 De dichotome keuze die uit de hypothesetestprocedure naar voren komt (d.w.z. nulhypothese verworpen of aanvaard) geeft geen inzicht of de resultaten van de studie belangrijk zijn voor verschillende belanghebbenden, zoals patiënten, clinici en besluitvormers.5, 6
Statistische significantie verzekert niet dat de resultaten klinisch relevant zijn. Het gebruik van significantietests voor de nulhypothese bepaalt immers zelden het praktische belang of de klinische relevantie van bevindingen.1, 7 Bovendien kan statistische significantie ook misleidende resultaten voor de klinische gemeenschap opleveren, aangezien een statistisch verschil tussen groepen kan worden gevonden als de steekproefgrootte groot was en/of als de variabiliteit tussen proefpersonen klein was, ook al was het verschil tussen groepen klein om door de patiënten of clinici als klinisch belangrijk te worden beschouwd.5 Dit werd geïllustreerd in een van onze studies, waar een verschil tussen proefpersonen met TMD en gezonde controles op hoofd- en cervicale houding statistisch significant was, maar dat verschil bedroeg slechts 3,3°, wat volgens elke clinicus die op dit gebied werkzaam is, niet klinisch relevant zou zijn, aangezien clinici over het algemeen klinische observatie of in sommige gevallen foto’s gebruiken om de houding te beoordelen en het onwaarschijnlijk is dat deze beoordeling het mogelijk zou maken om consistent zo’n klein verschil te detecteren.
Gezien de beperkingen van statistische significantie, is het voor de fysiotherapiepraktijk relevant dat resultaten van klinisch onderzoek worden geanalyseerd met in het achterhoofd de klinische relevantie van de resultaten. De vraag of een patiënt op een zinvolle manier verbeterd is, is van fundamenteel belang om de klinische besluitvorming over het behandelmanagement te verbeteren. Aangezien clinici geïnteresseerd zijn in de vraag of de interventie al dan niet een effect heeft gehad op klinische uitkomsten en ook in de omvang van dat effect, lijkt het uitsluitend afgaan op statistische significantie om conclusies te trekken over de relevantie van resultaten beperkt en onvoldoende.
Klinische relevantie (ook bekend als klinische significantie) geeft aan of de resultaten van een onderzoek al dan niet zinvol zijn voor verschillende belanghebbenden.7 Een klinisch relevante interventie is een interventie waarvan de effecten groot genoeg zijn om de bijbehorende kosten, ongemakken en schade de moeite waard te maken.8 Klinische relevantie vergemakkelijkt het begrip en de interpretatie van resultaten voor clinici. In de fysiotherapie is de beoordeling hiervan een populaire methode geworden om te helpen bij de overdracht van kennis naar de klinische praktijk.1, 7, 9
Er zijn verschillende methodologieën ontwikkeld in een poging om de klinische significantie van een interventie te bepalen. De meest gangbare methoden zijn de “distribution-based methods” en de “anchor-based methods”. De berekening van de effectgrootte (ES), de minimaal aantoonbare verandering (MDC)/verschil (MDD)10 en de standaardfout van de meting (SEM) zijn voorbeelden van de op verdeling gebaseerde methoden.1, 7 Bij de op ankers gebaseerde methoden wordt het perspectief van de cliënt gebruikt met behulp van een anker, gewoonlijk het gebruik van de Global Rating Scale of Change (GRSC)2 om het minimaal belangrijke verschil (MID) te bepalen. Onderzoekers en clinici die geïnteresseerd zijn in deze methoden worden aangemoedigd om Jaeschke e.a.,2 Armijo-Olivo e.a.,7 Musselman,1 evenals De Vet e.a.,10 te raadplegen voor een volledige beschrijving.
Onderzoekers die klinische trials uitvoeren op het gebied van fysiotherapie hebben de verplichting om de klinische relevantie van de resultaten te rapporteren aan de klinische gemeenschap om zich te houden aan de principes van evidence based practice. Dit zal helpen om bewijsmateriaal op een nuttige en begrijpelijke manier te verspreiden voor eindgebruikers zoals patiënten, clinici in de gezondheidszorg, en beleidsmakers/beslissers. De informatie van “p”-waarden is onvoldoende om aan deze eisen te voldoen en omdat het onvoldoende en beperkte informatie biedt, moesten klinische onderzoekers de klinische relevantie van hun resultaten presenteren om drukbezette clinici te helpen met de interpretatie en gemakkelijke opname van onderzoeksresultaten in de klinische praktijk.