NETWORK META ANALYSIS
Systematiske oversigter og metaanalyser af randomiserede kontrollerede forsøg (RCT’er) ligger øverst i hierarkiet af evidensbaseret medicin og er vigtige redskaber til at belyse effektiviteten af interventioner. Du kan se en video om, hvordan man vurderer en systematisk gennemgang og metaanalyse.
Formålene med en metaanalyse er:
- At løse modstridende konklusioner ved at undersøge kvalitet, forsøgspersoner og interventioner
- At øge effekten for vigtige endepunkter og subgruppeanalyser. Dette er især vigtigt for kliniske forsøg, da mange randomiserede kontrollerede forsøg har små stikprøvestørrelser, der ikke gør det muligt at drage endelige konklusioner om en positiv eller negativ effekt af interventionen.
- For at skærpe grænserne for effektstørrelsen i tilfælde af positive
undersøgelser, da en metaanalyse kommer tættere på den sande effektstørrelse i populationen, efterhånden som stikprøvestørrelsen øges. (Øger præcisionen) - For at besvare nye spørgsmål og udvikle nye hypoteser
Chalmers, der var medvirkende til udviklingen af metaanalyser, fremhævede i 1988 betydningen af metaanalyser, som senere førte til en ændring af praksis i retning af antikoagulation hos patienter med akut MI.
Et eksempel på en stærkt positiv effekt i en meta-analyse er brugen af intravenøs streptokinase til patienter med akut myokardieinfarkt. Livsbesparelsen var blevet påvist i små undersøgelser i mindst fem år, før den blev bekræftet af den meget store undersøgelse kendt som GISSI.
Det er også interessant, at intravenøs streptokinase sjældent anvendes i USA i modsætning til lidokain. Jeg formoder, at årsagen er, at lægerne ikke bryder sig om at se deres patienter bløde, og de kan godt lide at se arytmier forsvinde som følge af noget, de har gjort.
De er ikke i stand til at bemærke, at de i førstnævnte tilfælde redder livet på en til to ekstra patienter ud af hver 100, der indlægges for et akut myokardieinfarkt, og at de i sidstnævnte tilfælde muligvis mister en eller to patienter. Den enkelte behandler kan ikke mærke denne form for reduktion eller forøgelse af dødsraten. Det er altså metaanalysens nytteværdi. (Chalmers, 1988)
Network Meta-Analysis (NMA) og Multiple Treatment Comparisons (MTC) of RCT’s
NMA’s og MTC’s er blevet indført for at lette indirekte sammenligninger af flere interventioner, som ikke er blevet undersøgt i head to head-undersøgelser.
De er nyttige af følgende grunde:
- Giver mulighed for at visualisere en større mængde evidens
- Giver mulighed for at estimere den relative effektivitet blandt alle interventioner
- Giver mulighed for at rangordne interventionerne
NMA’er er dog baseret på visse antagelser, som bør tages i betragtning ved fortolkningen af resultaterne.
- Antagelse om lighed – Forsøgene i NMA’en bør være ens (ikke statistisk signifikant forskellige) med hensyn til undersøgelsespopulation, design, effektmål og effektmodifikatorer (patient- og undersøgelseskarakteristika, f.eks. varighed af opfølgning, alder, sygdomsgrad, tilbagefald osv.).
- Homogenitetsantagelse – Der bør ikke være nogen relevant heterogenitet mellem forsøgsresultaterne i parvise sammenligninger.
- Konsistens- og transitivitetsantagelser – Der må ikke være nogen relevant uoverensstemmelse eller inkonsekvens mellem direkte og indirekte evidens.
HVEM OG HVAD BLEV UNDERSØGT?
Søgestrategi
Søgestrategien omfattede dobbeltblindede randomiserede kontrollerede forsøg, som blev identificeret i elektroniske databaser ved hjælp af følgende søgeord: depress, dysthmi, adjustment disorder, mood disorder, affective disorder eller affektive symptomer.
De elektroniske databasesøgninger blev suppleret med manuelle søgninger (f.eks. i ClinicalTrials.gov) efter offentliggjorte, ikke-offentliggjorte og igangværende RCT’er i internationale forsøgsregistre, websteder for lægemiddelgodkendelsesorganer og vigtige videnskabelige tidsskrifter på området.
Forskerne kontaktede alle de medicinalvirksomheder, der markedsfører antidepressiva, og bad om supplerende upublicerede oplysninger om både før- og eftermarkedsføringsundersøgelser med særlig fokus på andengenerationsantidepressiva.
De kontaktede også undersøgelsesforfattere og lægemiddelproducenter for at supplere ufuldstændige rapporter i de originale artikler eller tilvejebringe data for upublicerede undersøgelser.
Overstående søgestrategi blev anvendt for at reducere risikoen for publikationsbias, som er en betydelig kilde til bias i metaanalyser.
Seks investigatorer udvalgte uafhængigt studier og vurderede risikoen for bias. (Minimerer informationsbias)
Alle andengenerations antidepressiva, som i øjeblikket er godkendt i USA, Europa og Japan, blev inkluderet:
- Atypiske – Agomelatin, bupropion og mirtazapin
- SSRI – Citalopram, escitalopram, fluoxetin, fluvoxamin, paroxetin, sertralin og vilazodon
- SNRI – Desvenlafaxin, duloxetin, levomilnacipran, milnacipran, venlafaxin og vortioxetin
- NARI – Reboxetin
- SARI – Trazodon og nefazodon
- Tricykliske – Amitriptylin og clomipramin
Ved mere om ovenstående antidepressiva.
Undersøgelsens formål
Denne systematiske gennemgang og netværksmetaanalyse havde til formål at evaluere effektiviteten og acceptabiliteten af individuelle lægemidler og sammenligne dem med placebo eller et andet aktivt antidepressivt middel til behandling af svær depressiv lidelse.
- Primære resultater
- Responsraten blev målt ved antallet af patienter, der havde en ≥50% reduktion i en standardiseret observatør-ratingskala
- Acceptabilitet blev målt ved andelen af patienter, der ophørte
- Sekundære resultater
- Endpoint depressionsscore
- Udgivelsesprocent
- Andelen af patienter, der afbrød på grund af bivirkninger
Dataanalyse
Et sammenfattende odds ratio er et almindeligt anvendt indeks til at bestemme størrelsen af effekten af sygdomsrisiko i epidemiologiske undersøgelser.
En odds ratio-værdi ledsages ofte af en tilsvarende kvalitativ deskriptor som f.eks. den standardiserede middelforskel (SMD) for at give læseren mulighed for at forstå styrken af den beregnede association
For yderligere at sætte dette i sammenhæng er SMD (eller Cohen’s d) den effektberegning, der giver størrelsen af effekten mellem to grupper.
SMD-værdier og effektstørrelse
- 0,2 – lille
- 0,5 – middel
- 0,8 – stor
HVAD ER FUNDENE?
Mellem 1979 og 2016 blev 522 (421 offentliggjorte kliniske forsøg, 86 ikke-publicerede forsøg og 15 personlige meddelelser) dobbeltblindede RCT’er inkluderet i denne meta-analyse. I alt blev 116 477 patienter inkluderet. Patienterne havde en gennemsnitsalder på 44 år, og 62,3 % var kvinder.
Effektivitet
Bredden af linjerne er proportional med antallet af gennemførte undersøgelser, der sammenligner de to behandlinger. Fluoxetin og paroxetin har de fleste undersøgelser sammenlignet med placebo. Størrelsen af cirklerne afspejler antallet af deltagere i forsøgene. Således har placebo det højeste antal deltagere i forsøg.
Antidepressiva rangordning for effektivitet
- Alle antidepressiva viste sig at være mere effektive end placebo med et sammenfattende odds ratio (CI), der varierede fra 2,13 (1,89-2,4) til 1.37 (1,16-1,63) for henholdsvis amitriptylin til reboxetin.
- Agomelatin, amitriptylin, escitalopram, mirtazapin, paroxetin, venlafaxin og vortioxetin havde et sammenfattende odds ratio på 1,19 til 1,96 og blev vurderet som de mest effektive i forhold til andre midler.
- Fluoxetin, fluvoxamin, reboxetin og trazodon blev på den anden side vurderet som de mindst effektive med et sammenfattende odds ratio, der varierede fra 0,51 til 0,84.
Læringsmål og fortolkning:
- Et odds ratio på 1 indikerer ingen forskel mellem behandling og sammenligningsmiddel.
- Dermed vil et odds ratio på 1,10 betyde en 10 % større sandsynlighed for effekt for behandling vs. komparator.
- Et odds ratio på 2,13 til fordel for behandling vil betyde, at der er 113 % større sandsynlighed for respons med behandling end med komparator. (Forenklet sagt fordobler behandlingen oddset for respons)
Vidensinterval (CI)
- Vidensinterval er et interval, inden for hvilket den sande effektstørrelse ligger.
- Sådan er et 95% CI på 1.89-2,4 betyder, at man kan være 95 % sikker på, at den sande effektstørrelse ligger mellem 1,89 og 2,4.
- Dette er et statistisk signifikant resultat, da intervallet ikke krydser værdien for ingen effekt, som er 1.
Lær mere om Odds ratio og konfidensintervaller.
Acceptabilitet
Antidepressiva rangordning for acceptabilitet
- Agomelatin og fluoxetin havde færre frafald, som det fremgår af et sammenfattende odds ratio (CI) på 0,84 (0,72-0,97) og 0,88 (0,80-0,97) og 0,88 (0,80-0.96), mens clomipramin havde de fleste rapporterede frafald (1,30 (1,01-1,68)).
- Agomelatin, citalopram, escitalopram, fluoxetin, sertralin og vortioxetin havde et sammenfattende odds ratio fra 0,43 til 0,0.77 og blev vurderet som mere acceptable end andre midler.
- Amitriptylin, clomipramin, duloxetin, fluvoxamin, reboxetin, trazodon og venlafaxin havde de højeste frafaldsrater med et sammenfattende odds ratio på 1.30 til 2,32.
Læringspunkter og fortolkning:
- Et odds ratio på 0,84 i forhold til frafald indikerer en reduceret risiko for frafald med lægemidlet.
- Denne reducerede risiko kan kvantificeres ved hjælp af formlen (Risikoreduktion = 1- Odds ratio) = 1-0,84 = 0,16, hvilket svarer til en 16 % reduceret risiko for frafald med lægemidlet sammenlignet med placebo.
Resultater fra head to head-undersøgelser
- Agomelatin, amitriptylin, escitalopram, mirtazapin, paroxetin, venlafaxin, og vortioxetin var mere effektive end andre antidepressiva (OR’er varierede mellem 1-19 og 1-96), mens fluoxetin, fluvoxamin, reboxetin og trazodon var blandt de mindst effektive lægemidler (OR’er varierede mellem 0-51 og 0-84).
- Med hensyn til acceptabilitet var agomelatin, citalopram, escitalopram, fluoxetin, sertralin og vortioxetin mere tolerable end andre antidepressiva (OR’er på mellem 0-43 og 0-77), mens amitriptylin, clomipramin, duloxetin, fluvoxamin, reboxetin, trazodon og venlafaxin var de antidepressiva, der var forbundet med de højeste frafaldsrater.
STYRKER OG BEGRÆNSNINGER
Styrker:
- Gennemgående og mest omfattende undersøgelse til dato, der sammenlignede 21 antidepressiva med placebo med 117000 patienter
- Søgning efter offentliggjort og ikke-publiceret evidens blev foretaget
- Flere resultater blev undersøgt ud over effekt, f.f.eks. remission, ændring i humørsymptomer, modificerende virkninger såsom sponsorering, doseringsskema, nyhedseffekter osv.
- De head-to-head-undersøgelser blev syntetiseret separat for at informere den kliniske praksis
Begrænsninger:
1.Effektstørrelserne var mindre i nyere og større placebokontrollerede forsøg end i ældre og mindre forsøg, hvilket kan være en indikator for bias.
De estimerede forskelle mellem lægemidlerne var mindre i placebokontrollerede forsøg end i head-to-head-undersøgelser. Der er flere mulige forklaringer, da mange faktorer er blevet forbundet med højere placebo-responsrater, såsom randomiseringsforholdet og forventningen om at modtage en aktiv behandling, den terapeutiske indstilling eller hyppigheden af undersøgelsesbesøg.
I vores datasæt fandt vi, at responset på det samme antidepressivum i gennemsnit var mindre, og at der var større sandsynlighed for frafald i placebokontrollerede forsøg end i head-to-head-undersøgelser. For det samme lægemiddel og den samme sandsynlighed for at modtage placebo var større frafald af alle årsager desuden forbundet med et lavere respons på behandlingen. Anvendelsen af LOCF-metoden (last observation carried forward) til imputering af manglende udfaldsdata kan have påvirket estimaterne af behandlingseffekten.
Depressive symptomer har tendens til at blive spontant bedre med tiden, og dette fænomen bidrager til den høje procentdel af placebo-respondere i antidepressive forsøg. Patienter, der tilfældigt er tildelt det aktive lægemiddel i et dobbeltblindet, placebokontrolleret forsøg, kan forlade studierne tidligere end i head-to-head-undersøgelser, fordi de kan have mistanke om, at de er blevet tildelt placebogruppen i stedet for interventionsgruppen.
Antidepressiva har normalt først fuld virkning efter flere ugers behandling; derfor har deltagere, der er faldet ud tidligere, tendens til at have dårligere responser end dem, der forbliver i behandling, hvilket overføres til slutningen af forsøget ved LOCF-analysen. Det endelige resultat kan være en undervurdering af den virkelige effekt af det aktive lægemiddel.
2.Risiko for bias:
Da de enkelte forsøg er randomiserede kontrollerede forsøg (RCT’er), omfatter de kritiske kilder til bias :
- Indeadækvat procedure for skjul af allokering (selektionsbias)
- svag generering af tilfældige sekvenser (confounding bias)
- Indeadækvat blinding (målebias)
- Attrition bias
- Selektiv rapportering af resultater af kliniske forsøg. Turner et al. viste, at selektiv rapportering af forsøg med antidepressiva har negative konsekvenser for forskere, forsøgsdeltagere, sundhedspersonale og patienter.
9% (46 forsøg) blev vurderet til at have en høj risiko for bias
73% (380 forsøg) blev vurderet til at have en moderat risiko for bias
18% (96 forsøg) blev vurderet til at have en lav risiko for bias
Tidligere forskning har vist, at lægemiddelsponsorerede forsøg er ca. fem gange mere tilbøjelige til at rapportere positive resultater.
I denne NMA blev det rapporteret, at lægemiddelvirksomheder sponsorerede 78 % af de citerede undersøgelser. Finansiering fra industrien var imidlertid ikke forbundet med væsentlige forskelle med hensyn til svar- eller frafaldsprocenter.
3. Undersøgerne var ikke i stand til at evaluere potentielt vigtige kliniske og demografiske modifikatorer af behandlingsrespons på individuelt patientniveau, såsom alder, køn, symptomernes sværhedsgrad eller sygdomsvarighed.
4. Patienter med behandlingsresistent og psykotisk depression og med samtidig alvorlig medicinsk sygdom blev ekskluderet, og derfor kan undersøgelsens resultater ikke anvendes på disse kliniske grupper.
5. Klinisk relevante resultater som f.eks. global funktion blev ikke kvantificeret.
6. De inkluderede forsøg er af kort varighed, hvorfor resultaterne vedrørende effekt og bivirkninger ikke kan ekstrapoleres til længere tidsrammer.
7. Der kan stadig forekomme publikationsbias på trods af forsøgene på at indhente al offentliggjort og upubliceret evidens, da en betydelig mængde oplysninger ikke er tilgængelige for offentligheden.
8. Multiple publikationsbias kan heller ikke definitivt udelukkes.
DET STORE BILLEDE
Denne NMA repræsenterer den største og mest omfattende evaluering af effektiviteten og acceptabiliteten af antidepressiva til akut behandling af depression.
Undersøget viser, at alle antidepressiva som gruppe er mere effektive end placebo hos voksne med svær depressiv lidelse, og de sammenfattende effektstørrelser var beskedne (0.30).
Resultaterne af effekt og acceptabilitet kan dog ikke generaliseres til individuelle kliniske undergrupper såsom behandlingsresistent depression, psykotisk depression eller personer med co-morbide alvorlige sygdomme.
STAR*D-forsøget har tidligere vist, at kun 1/3 af patienterne reagerer efter indledende antidepressiv behandling med depressive midler, og at behandlingsresistens ikke er ualmindeligt.
Dertil kommer, at der er betydelig heterogenitet i virkningsmekanismerne for AD’er, hvilket har indflydelse på effektivitet og tolerabilitet.
Det er derfor afgørende for klinikere at “matche” antidepressiva med de respektive kliniske karakteristika og tilstræbe at minimere bivirkninger ved at vedtage en model for fælles beslutningstagning.
De følgende artikler bør læses i forbindelse med denne NMA for at informere om bedste kliniske praksis: Virkningsmekanismen for de 21 antidepressiva i denne undersøgelse og RANZCP’s retningslinjer for håndtering af depression.