Psykoterapiforskning: Ubehagelige sannheter og fremtidige muligheter

  • En revidert utgave av denne teksten ble publisert som kronikk i Morgenbladet 18.10.2013 under tittelen «Terapeutiske enhjørninger».

Forestill deg at du blir alvorlig syk. Hvilke spørsmål ville du stilt legen din? Personlig ville jeg først og fremst ønsket å vite om det finnes effektiv behandling. Og hvis så, hvor godt virker behandlingen jeg blir tilbudt sammenlignet med andre behandlingstilnærminger? Har behandlingen vist effekt for pasienter med de samme karakteristikkene som meg selv og hvordan virker behandlingen? Som psykolog burde jeg kunne besvare disse spørsmålene fra pasienter med psykiske lidelser. Men kan jeg det?

Å stille spørsmål ved om psykoterapi har effekt kan virke meningsløst. Klart psykoterapi har effekt! De fleste leg- og fagfolk vil være enige med Anders Danielsen Lie som i essayet «Færre piller, flere samtaler!» i Morgenbladet slår fast at «flere hundre studier har vist at psykoterapi har effekt». Men selv Sigmund Freud, psykoanalysens grunnlegger og således den moderne psykoterapiens stamfar, var åpen for at psykoterapeutisk behandling ikke har så god effekt som man skulle ønske. I 1937 skrev han at

«[v]i bør ikke bli overrasket om det viser seg at forskjellen mellom en person som ikke har blitt analysert og en person som har blitt analysert ikke er så gjennomgripende som vi ønsker og forventer, og som vi påstår/hevder at den er.» (min oversettelse)

Velkontrollerte og godt utførte kliniske behandlingsstudier er den beste metoden vi har for å etablere effektiv behandling, både medikamentell og psykologisk, for psykisk sykdom. I all forskning er metodisk kvalitet essensielt og det er viktig å være klar over at en betydelig andel av psykoterapiforskningen er kjennetegnet av metodiske svakheter (Cuijpers, van Straten, Bohlmeijer, Hollon, & Andersson, 2010; Gerber et al., 2011; Institute of Medicine, 2008; Thoma, McKay, Gerber, Milrod, & Kocsis, 2012). Psykoterapiforskning gir estimat på den faktiske eller sanne behandlingseffekten. Kvaliteten på disse estimatene, og således i hvilken grad vi kan stole på dem, avhenger av den metodiske kvaliteten til behandlingsstudiene (Moher et al., 2010; Schulz, Chalmers, Hayes, & Altman, 1995; Wood et al., 2008). Jo bedre metodisk kvalitet, jo mer kan vi stole på behandlingsresultatene.

For å illustrere denne problemstillingen kan jeg vise til et eksempel. I over et tiår anbefalte man kvinner å benytte østrogenbehandling basert på epidemiologiske observasjonsstudier som fant at østrogenbehandling var forbundet med mindre risiko for hjerte- og karlidelser. Man observerte altså at det var en negativ korrelasjon mellom østrogenbehandling og risiko for hjerte- og karlidelser. Etter hvert gjennomførte man randomiserte kontrollerte behandlingsstudier av østrogenbehandling og fant overraskende at denne behandlingen ikke beskytter mot, men faktisk kanskje øker faren for, hjerte- og karlidelser. Den spuriøse korrelasjonen mellom østrogenbehandling og lavere risiko for hjerte- og karlidelser man fant i observasjonsstudiene skyldes konfunderende tredjevariabler. Fordi man ikke tok høyde for forskningens metodiske svakheter gav man i tiår altså behandlingsanbefalinger som gjorde mer skade enn gavn.

Effekten av psykoterapi. I 2010 publiserte to av verdens fremste depresjonsforskere, den nederlandske psykologen Pim Cuijpers og den amerikanske psykologen Steven Hollon, i lag med en rekke kollegaer en meta-analyse som undersøkte hvordan psykoterapistudiers metodiske kvalitet påvirker estimatet av behandlingseffekt ved depresjon (Cuijpers, van Straten, et al., 2010). Forskerne identifiserte totalt 115 randomiserte kontrollerte studier som undersøkte effekten av psykoterapi for depresjon. Cuijpers og kollegaer sjekket så hvor mange av studiene som tilfredsstilte åtte helt grunnleggende metodiske kvalitetskriterier, som f.eks. at randomiseringen gjøres av en uavhengig instans og at psykologene som utreder pasientene etter behandling ikke vet hvilken behandlingsbetingelse pasientene har vært i. Av alle de 115 psykoterapistudiene var det bare 11 studier som tilfredsstilte alle de åtte kriteriene. I samsvar med annen forskning viser dette at de langt fleste psykoterapistudier har en lav metodisk kvalitet, noe som innebærer at vi må tolke estimatene av behandlingseffekt fra psykoterapistudier forsiktig og kritisk.

Forskerne sammenlignet effektstørrelsene, et uttrykk for behandlingens effekt, mellom de studiene som ikke tilfredsstilte kvalitetskriteriene og studiene som tilfredsstilte disse kvalitetskriteriene. Psykoterapistudiene med lav metodisk kvalitet fant en effektstørrelse på d = 0.74. Dette tilsvarer at man må behandle mellom 2 og 3 deprimerte pasienter med psykoterapi for at en pasient skal bli bedre. Når man så på effektstørrelsen fra de studiene med god metodisk kvalitet, altså de studiene hvis estimat av behandlingseffekt vi kan feste mest lit til, var imidlertid bildet ganske annerledes. Kvalitetsstudiene fant en effektstørrelse på d = 0.22, noe som tilsvarer at man må behandle over 8 pasienter for et en pasient skal respondere på psykoterapi for depresjon. Konklusjonen er at psykoterapistudier med dårlig metodisk kvalitet overestimerer effekten av psykoterapi, og at effekten av psykoterapi for depresjon er betydelig dårligere enn tidligere antatt.

Tilsvarende gjennomførte den prestisjetunge amerikanske forskningsinstitusjonen Institute of Medicine i 2008 (Institute of Medicine, 2008) en systematisk litteraturgjennomgang av alle behandlingsstudier av posttraumatisk stresslidelse (PTSD), en alvorlig og ofte kronisk psykisk lidelse. Denne gjennomgangen var motivert av behovet for å tilby krigsveteraner fra Irak og Afghanistan som hadde utviklet PTSD effektiv psykisk helsehjelp. Resultatet fra gjennomgangen var nedslående. Til tross for at det finnes en rekke psykologiske og medikamentelle behandlingstiltak som er antatt effektive i behandling av PTSD, fant Institute of Medicine at for nesten samtlige behandlingsmodaliteter er forskningen av en så dårlig metodisk kvalitet at man ikke med rimelig grad av sikkerhet kan stole på resultatene fra forskningen. Med andre ord; til tross for en mengde behandlingsforskning på PTSD, kan vi ikke med rimelig grad av sikkerhet fastslå om de fleste behandlingsmodaliteter faktisk har effekt grunnet dårlig forskningsmetodikk. Unntaket var såkalt eksponeringsterapi, hvor Institute of Medicine konkluderte med at det finnes nok metodisk stringent og rigorøs forskning til at en kan stole på at behandlingsformen har ønsket effekt.

En rekke andre utfordringer og svakheter ved psykoterapiforskning bidrar til betydelig usikkerhet i hvor sikre estimatene av behandlingseffekten av psykologisk behandling er. Slike svakheter er for eksempel publikasjonsskjevhet (Cuijpers, Smit, Bohlmeijer, Hollon, & Andersson, 2010; Ioannidis, 2012); fleksibilitet i innsamling og analyse av data, spesielt i fravær av data og forskningsprotokoller som ikke er offentlig tilgjengelig (Simmons, Nelson, & Simonsohn, 2011); lav statistisk styrke, som er en risikofaktor for både falske-negative og falske-positive forskningsfunn, samt oppblåste effektstørrelser (Button et al., 2013; Ioannidis, 2008, 2012; Maxwell, 2004); og manglende replikasjon (Ioannidis, 2012; Makel, Plucker, & Hegarty, 2012).

Har alle behandlingsformer lik effekt? Et av de mest kontroversielle temaene i psykoterapiforskningen er om alle behandlingsformer har like god effekt. Grovt sett deler psykologer seg i to leire i denne debatten; de som mener at all behandling har lik effekt, og på den andre siden de som mener at enkelte terapimetoder har bedre effekt enn andre. På sett og vis er denne uforsonlige debatten fôret av et kunnskapsvakuum.

Med få unntak har vi foreløpig begrenset forskningsbasert kunnskap til å påstå at noen psykoterapimetoder har bedre effekt enn andre. De fleste studier som sammenligner strukturerte og manualiserte behandlingstilnærminger finner små eller ingen forskjeller i behandlingseffekt.

Samtidig er det viktig å være klar over at det i all behandlingsforskning er vesentlig å skille mellom studier hvis hypotese er at en behandlingsform er bedre enn andre (på fagspråket kalt «superiority» studier), og studier hvis hypotese er at ulike terapimetoder ikke er dårligere enn andre og har lik effekt (på fagspråket kalt «noninferiority» eller «equivalence» studier; Leon, 2011; Piaggio, Elbourne, Pocock, Evans, & Altman, 2012). Den store majoriteten psykoterapistudier er designet som superior studier og det er en vanlig misforståelse at resultater fra slike studier som viser ingen signifikant forskjell mellom ulike terapimetoder impliserer at metodene har lik effekt. Det stemmer ikke, og evidens for lik effekt mellom ulike psykoterapimetoder kan bare komme fra metodisk adekvate ekvivalensstudier. Fraværet av metodisk adekvate ekvivalensstudier innebærer at vi ennå ikke har forskning som tilfredsstiller metodiske kriterier for å konkludere med at ulike psykoterapimetoder har lik eller ekvivalent effekt.

Skreddersydd behandling. Innen deler av den somatiske helsetjenesten kan den raske utviklingen innen bioteknologi gi nye muligheter for presis diagnostikk og behandling, såkalt personlig skreddersydd medisin. Også når det kommer til psykologisk behandling snakkes det i store ord om at man kan skreddersy behandling til den individuelle pasient. Ikke sjeldent hører man intetsigende honnørfraser som at «skreddersøm er bedre enn masseproduserte dresser fra Dressmann». For å kunne gi personlig skreddersydd behandling trenger vi kunnskap om såkalte moderatorer for behandlingseffekt; for hvem og under hvilke omstendigheter psykoterapi har effekt. Når det gjelder psykiske lidelser har vi imidlertid ikke tilstrekkelig vitenskapelig basert kunnskap om moderatorer for behandlingseffekt, noe som medfører at vi ikke kan tilby skreddersydd behandling, selv om det ofte påberopes (Cuijpers et al., 2012; Simon & Perlis, 2010). Det vi vet er at pasienter som mottar behandling for psykiske lidelser varierer vidt i hvordan de responderer på spesifikk behandling – noen blir friske eller mye bedre, noen blir moderat bedre, mens en betydelig andel ikke responderer på behandlingen i det hele tatt og noen pasienter risikerer å bli dårligere. Denne variabiliteten/variansen er imidlertid i stor grad upredikerbar, og vi har ennå ikke kunnskap til å kunne predikere hvem som vil bli bedre av en bestemt behandling og hvem som ikke vil bli det. Antakelsen om personlig skreddersydd psykoterapi er altså, i det minste rent vitenskapelig sett, foreløpig en myte.

Virkningsmekanismer i psykoterapi. En av de vanligste mytene når det gjelder psykologisk behandling, er at vi kjenner til virkningsmekanismene som forårsaker bedring. Vi har imidlertid ennå ikke har rigorøs og stringent forskningsbasert kunnskap om hvorfor eller hvordan psykoterapi fører til endring (Crits-Christoph, Gibbons, & Mukherjee, 2013; Kazdin, 2006, 2007, 2009; Kazdin & Nock, 2003; Kraemer, Wilson, Fairburn, & Agras, 2002; Murphy, Cooper, Hollon, & Fairburn, 2009; Nock, 2007). Som psykologstudent lærte jeg at den terapeutiske alliansen har vist seg å være den viktigste virkningsmekanismen i psykologisk behandling. Den store majoriteten studier som undersøker alliansens betydning for utfall av psykoterapi har imidlertid korrelasjonelt design hvor man blant annet ikke kontrollerer for potensielle konfunderende tredjevariabler og temporal relasjon.

En skal være forsiktig med å basere kliniske retningslinjer/anbefalinger på korrelasjonell forskning. Som nevnt innledningsvis, basert på korrelasjonell observasjonsforskning trodde man at østrogenbehandling førte til mindre risiko for hjerte- og karlidelser. På samme måte kan korrelasjonelle studier som viser at enkelte variabler, som for eksempel allianse, er forbundet med bedre utfall av psykoterapi, være feilaktige og villedende.

Behandlingsforskning gjennomført ved Modum Bad som har et metodisk design som gjør at man mer stringent og rigorøst kan undersøke såkalte mediatorer eller virkningsmekanismer for behandlingsutfall, viser for eksempel at ved psykologisk behandling for sosial fobi har den terapeutiske alliansen en fasiliterende, men ikke kausal, rolle for behandlingsutfall (Hoffart, Borge, Sexton, Clark, & Wampold, 2012; Hoffart et al., 2013). Det er altså ikke slik at vi med sikkerhet kan slå fast at alliansen er den viktigste kurative ingrediensen i psykoterapi. Det finnes dessverre foreløpig altfor lite forskning av en høy nok metodisk kvalitet til at vi kan påberope oss å vite virkningsmekanismene i psykoterapi. All den tid vi har begrenset kunnskap om virkningsmekanismer i psykoterapi bør vi være forsiktige med å vektlegge enkelte terapikomponenter på bekostning av andre.

Djevelen i detaljene. Når det kommer til psykoterapiforskning er djevelen i detaljene, og til tross for over seks tiår med forskning er fremdeles fagfeltet på sett og vis i større grad preget av hva vi ikke vet, enn av hva vi faktisk vet. Det er kanskje en ubehagelig sannhet at psykoterapi har dårligere effekt enn det vi ofte liker å påstå, at vi ikke kan forutse hvem som vil eller ikke vil respondere på behandling og skreddersy behandlingen deretter, eller at vi ikke kjenner virkningsmekanismene i den behandlingen vi tilbyr. Hvis vi skal snu disse ubehagelige sannhetene til fremtidige muligheter for bedre psykologisk behandling, trenger vi mer og bedre psykoterapiforskning.

 

Referanser

Button, K. S., Ioannidis, J. P., Mokrysz, C., Nosek, B. A., Flint, J., Robinson, E. S., & Munafo, M. R. (2013). Power failure: why small sample size undermines the reliability of neuroscience. Nature Reviews Neuroscience, 10(10).

Crits-Christoph, P., Gibbons, M. B. C., & Mukherjee, D. (2013). Psychotherapy process-outcome research. In M. J. Lambert (Ed.), Bergin and Garfield’s Handbook of Psychotherapy and Behavior Change (6th ed., pp. 298-340). London: John Wiley & Sons Inc.

Cuijpers, P., Reynolds, C. F., 3rd, Donker, T., Li, J., Andersson, G., & Beekman, A. (2012). Personalized treatment of adult depression: medication, psychotherapy, or both? A systematic review. Depression and Anxiety, 29(10), 855-864. doi: 10.1002/da.21985

Cuijpers, P., Smit, F., Bohlmeijer, E., Hollon, S. D., & Andersson, G. (2010). Efficacy of cognitive–behavioural therapy and other psychological treatments for adult depression: meta-analytic study of publication bias. The British Journal of Psychiatry, 196(3), 173-178. doi: 10.1192/bjp.bp.109.066001

Cuijpers, P., van Straten, A., Bohlmeijer, E., Hollon, S. D., & Andersson, G. (2010). The effects of psychotherapy for adult depression are overestimated: A meta-analysis of study quality and effect size. Psychological Medicine: A Journal of Research in Psychiatry and the Allied Sciences, 40(2), 211-223. doi: 10.1017/s0033291709006114

Gerber, A. J., Kocsis, J. H., Milrod, B. L., Roose, S. P., Barber, J. P., Thase, M. E., . . . Leon, A. C. (2011). A quality-based review of randomized controlled trials of psychodynamic psychotherapy. The American Journal of Psychiatry, 168(1), 19-28. doi: 10.1176/appi.ajp.2010.08060843

Hoffart, A., Borge, F.-M., Sexton, H., Clark, D. M., & Wampold, B. E. (2012). Psychotherapy for social phobia: How do alliance and cognitive process interact to produce outcome? Psychotherapy Research, 22(1), 82-94. doi: 10.1080/10503307.2011.626806

Hoffart, A., Johnson, S. U., Langkaas, T. F., Hedley, L. M., Hvidsten, M., & Rasmussen, A. (2013). Betydningen av spesifikke faktorer i behandling av angstlidelser. In G. Kvale, O. E. Havik, E. R. Heiervang, T. Tangen & B. S. M. Haugland (Eds.), Hvordan sikre angstpasienter kunnskapsbasert behandling? (pp. 127-137). Oslo: Universitetsforlaget.

Institute of Medicine. (2008). Treatment of posttraumatic stress disorder: An assessment of the evidence. Washington, D.C.: The National Academies Press.

Ioannidis, J. P. A. (2008). Why most discovered true associations are inflated. Epidemiology, 19(5), 640-648 610.1097/EDE.1090b1013e31818131e31818137.

Ioannidis, J. P. A. (2012). Why science is not necessarily self-correcting. Perspectives on Psychological Science, 7(6), 645-654. doi: 10.1177/1745691612464056

Kazdin, A. E. (2006). Mechanisms of change in psychotherapy: Advances, breakthroughs, and cutting-edge research (do not yet exist). In R. R. Bootzin & P. E. McKnight (Eds.), Strengthening research methodology: Psychological measurement and evaluation (pp. 77-101). Washington, DC, US: American Psychological Association.

Kazdin, A. E. (2007). Mediators and mechanisms of change in psychotherapy research. Annual Review of Clinical Psychology, 3, 1-27. doi: 10.1146/annurev.clinpsy.3.022806.091432

Kazdin, A. E. (2009). Understanding how and why psychotherapy leads to change. Psychotherapy Research, 19(4-5), 418-428. doi: 10.1080/10503300802448899

Kazdin, A. E., & Nock, M. K. (2003). Delineating mechanisms of change in child and adolescent therapy: methodological issues and research recommendations. Journal of Child Psychology and Psychiatry, 44(8), 1116-1129. doi: 10.1111/1469-7610.00195

Kraemer, H. C., Wilson, G. T., Fairburn, C. G., & Agras, W. S. (2002). Mediators and moderators of treatment effects in randomized clinical trials. Archives of General Psychiatry, 59(10), 877-883. doi: 10.1001/archpsyc.59.10.877

Leon, A. G. (2011). Comparative effectiveness clinical trials in psychiatry: Superiority, noninferiority, and the role of active comparators. Journal of Clinical Psychiatry, 72(10), 1344-1349. doi: 10.4088/JCP.10m06089whi

Makel, M. C., Plucker, J. A., & Hegarty, B. (2012). Replications in Psychology Research: How Often Do They Really Occur? Perspectives on Psychological Science, 7(6), 537-542. doi: 10.1177/1745691612460688

Maxwell, S. E. (2004). The persistence of underpowered studies in psychological research: Causes, consequences, and remedies. Psychological Methods, 9(2), 147-163. doi: 10.1037/1082-989x.9.2.147

Moher, D., Hopewell, S., Schulz, K. F., Montori, V., Gøtzsche, P. C., Devereaux, P. J., . . . Altman, D. G. (2010). CONSORT 2010 Explanation and Elaboration: updated guidelines for reporting parallel group randomised trials. British Medical Journal, 340, c869. doi: 10.1136/bmj.c869

Murphy, R., Cooper, Z., Hollon, S. D., & Fairburn, C. G. (2009). How do psychological treatments work? Investigating mediators of change. Behaviour Research and Therapy, 47(1), 1-5. doi: 10.1016/j.brat.2008.10.001

Nock, M. K. (2007). Conceptual and design essentials for evaluating mechanisms of change. Alcoholism: Clinical and Experimental Research, 31(Suppl 3), 4S-12S.

Piaggio, G., Elbourne, D. R., Pocock, S. J., Evans, S. J., & Altman, D. G. (2012). Reporting of noninferiority and equivalence randomized trials: extension of the CONSORT 2010 statement. JAMA, 308(24), 2594-2604. doi: 10.1001/jama.2012.878021487502 [pii]

Schulz, K. F., Chalmers, I., Hayes, R. J., & Altman, D. G. (1995). Empirical evidence of bias: Dimensions of methodological quality associated with estimates of treatment effects in controlled trials. JAMA: Journal of the American Medical Association, 273(5), 408-412. doi: 10.1001/jama.1995.03520290060030

Simmons, J. P., Nelson, L. D., & Simonsohn, U. (2011). False-positive psychology: Undisclosed flexibility in data collection and analysis allows presenting anything as significant. Psychological Science, 22(11), 1359-1366. doi: 10.1177/0956797611417632

Simon, G. E., & Perlis, R. H. (2010). Personalized medicine for depression: Can we match patients with treatments? The American Journal of Psychiatry, 167(12), 1445-1455. doi: 10.1176/appi.ajp.2010.09111680

Thoma, N. C., McKay, D., Gerber, A. J., Milrod, B. L., & Kocsis, J. H. (2012). A quality-based review of randomized controlled trials of cognitive-behavioral therapy for depression: An assessment and metaregression. The American Journal of Psychiatry, 169(1), 22-30. doi: 10.1176/appi.ajp.2011.11030433

Wood, L., Egger, M., Gluud, L. L., Schulz, K. F., Jüni, P., Altman, D. G., . . . Sterne, J. A. C. (2008). Empirical evidence of bias in treatment effect estimates in controlled trials with different interventions and outcomes: meta-epidemiological study. British Medical Journal, 336(7644), 601-605. doi: 10.1136/bmj.39465.451748.AD