Mikä masennuksen mittaamisessa mättää?
Masennus on selkeästi tutkituimpia mielenterveyshäiriöitä ja tieteellisten artikkeleiden julkaisumäärien perusteella koko tiedemaailman suosituimpia tutkimuskohteita. Alan tutkimus tuntuu kuitenkin etenevän melko hitaasti suhteessa kiinnostuksen määrään. Tutkijat eivät esimerkiksi ole löytäneet biologisia ennustetekijöitä, jotka olisivat niin johdonmukaisesti yhteydessä masennukseen, että niistä olisi hyötyä asiakastyössä. Samoin sekä psykoterapeuttisen että lääkkeisiin perustuvan hoidon tuloksissa olisi edelleen paljon parantamisen varaa.
Leidenin yliopiston apulaisprofessori Eiko Fried ja hänen kollegansa esittävät Nature Reviews Psychology -lehdessä julkaistussa katsausartikkelissaan, että alan kehitystä hidastaa osaltaan se, että mittaamme masennusta väärillä menetelmillä. Masennustutkimusta ovat pitkään dominoineet samat kyselylomakkeet. Monet näistä asiakastyössäkin käytetyistä mittareista, kuten Beckin depressioasteikko (BDI), kehitettiin alun perin vuosikymmeniä sitten, mutta ne ovat säilyttäneet asemansa tähän päivään asti.
Friedin ja kollegoiden mukaan yksinomaan näihin mittareihin nojaaminen esimerkiksi masennuslääkkeiden vaikutuksia tai masennuksen geneettisiä riskitekijöitä arvioivissa tutkimuksissa on vähintäänkin kyseenalaista.
Monta eri masennusta
Validiteetilla viitataan siihen, mittaako valittu mittari sitä ominaisuutta tai ilmiötä, jota sillä halutaan mitata. Masennuskyselyiden tulisi tavoittaa kattavasti masennuksen eri ominaispiirteet. Toisaalta kyselyn sisällön pitäisi liittyä nimenomaan masennukseen, eikä sohia suuntiin, joilla ei ole masennuksen kannalta merkitystä.
Masennuksen tutkimukseen yleisimmin käytettyjen kyselyiden oirelistaukset ovat yllättävän vaihtelevia. Fried ja hänen kollegansa kävivät artikkelissaan läpi seitsemän yleisesti käytetyn kyselylomakkeen mittaamat oireet. He havaitsivat isoja eroja kyselyiden välillä: vain 60 prosenttia oireista mainittiin useammassa kuin yhdessä lomakkeessa. Kyselyiden sisältö poikkesi myös monilta osin DSM-5 järjestelmässä esitetyistä masennuksen diagnostisista kriteereistä.
Eri kyselyt saattavatkin mitata ”erilaisia masennuksia”. Vaikka kyselyt on kehitetty nimellisesti saman ilmiön arvioimiseen, ne määrittelevät masennuksen eri tavoin. Tästä kertoo Friedin ja kollegoiden mukaan myös se, että kyselyiden väliset korrelaatiot vaihtelevat ja voivat toisinaan jäädä melko vaatimattomiksi. Eri kyselyillä saatuja tuloksia rinnastetaan kuitenkin masennustutkimuksissa suoraan toisiinsa sillä ajatuksella, että ne mittaavat samaa asiaa.
Mustavalkoinen ja yksiulotteinen kuva masennuksesta
Toinen tapa arvioida validiteettia on katsoa, ovatko kyselylomakkeella saadut tulokset linjassa sen kehittäneiden tutkijoiden teorioiden kanssa: korreloivatko kyselyn osiot keskenään taustateorian esittämällä tavalla? Tällaista arviointia vaikeuttaa se, että monissa kyselyissä väittämien valintaa tai pisteytystä ei ole perusteltu millään tietyllä teorialla.
Se, ettei kyselyä suoraan yhdistetä teoriaan, ei kuitenkaan tarkoita sitä, ettei taustalta löytyisi teoreettisia oletuksia. Fried kritisoi kollegoineen muun muassa sitä, että tutkimuksissa masennusta arvioidaan kyselyillä usein kategorisesti: tutkijat katsovat ylittyykö tietty pistemäärä, joka vaaditaan masennuksen toteamiseen. Samaan aikaan tutkimusnäyttö osoittaa kuitenkin selvästi, että masennusoireista on kyse jatkumosta.
Videohaastattelussa Eiko Fried kertoo tämän ristiriidan herättäneen hänen huomionsa jo tutkijanuran alkumetreillä. Hän vierasti tutkimuksia, joissa pyrittiin esimerkiksi selvittämään masennuksen geneettistä taustaa kategorisesta näkökulmasta, jossa henkilö on joko ”masentunut” tai ”terve”.
– Jos on koskaan tehnyt töitä masennusdiagnoosin saaneiden kanssa, tietää, että he eroavat toisistaan aika paljon. Minua ihmetytti, että tutkijat pelkistävät näin monimutkaisen ilmiön kahdeksi kategoriaksi.
Masennuskyselyihin on sisäänrakennettu oletus siitä, että kyse olisi yksiulotteisesta ilmiöstä, jota voidaan kuvata yksittäisellä pistemäärällä.
Toinen oletus monien kyselyiden taustalla on, että masennus voidaan hahmottaa yksiulotteisena ilmiönä. Jokaisen väittämän ajatellaan mittaavan samaa ilmiötä: kaikki kyselyn osiot ovat yhtä tärkeitä, ja yhteispistemäärä summaa mielekkäällä tavalla masennuksen vaikeusasteen.
Tutkimuksissa on kuitenkin havaittu, että BDI:n kaltaisten kyselyiden eri osiot eivät välttämättä kuvaakaan samaa yhtenäistä ilmiötä. Yhden ulottuvuuden sijaan kysely voikin mitata jopa puolta tusinaa eri ulottuvuutta. Lisäksi se, kuinka monta ulottuvuutta masennuksesta löydetään, näyttäisi vaihtelevan käytetystä mittarista, tutkittavasta joukosta sekä masennuksen vaikeusasteesta riippuen. Se, mitä ajattelemme masennuksena, voikin olla joukko erilaisia häiriöitä.
Se, mitä ajattelemme masennuksena, voikin olla joukko erilaisia häiriöitä.
Yhtä kyseenalainen on kyselyiden pisteytyksessä usein toistuva oletus, että kyselyn kaikki väittämät olisivat yhtä tärkeitä. Jotkin masennusoireet vaikeuttavat yksilön elämää enemmän kuin toiset: mielialaoireiden vaikutus toimintakykyyn voi olla eri luokkaa kuin liikaunisuuden. Eri oireiden taustalta voi myös lyötyä erilaisia syntymekanismeja.
Teoriat testiin
Fried ja kollegat korostavat artikkelissaan, että masennuksen mittausmenetelmien kehittäminen edellyttää näiden menetelmien taustaoletusten tiedostamista. Masennuskyselyihin sisäänrakennettu oletus siitä, että kyse on yksiulotteisesta ilmiöstä, jota voidaan kuvata yksittäisellä pistemäärällä, on tästä hyvä esimerkki. Ajatuksena tuntuu olevan, että eri masennusoireiden taustalla vaikuttaa lopulta aina yksi ja sama selitys. Tutkimustieto ei tue tätä käsitystä, mutta kyselylomakkeiden näennäinen teoriattomuus on voinut johtaa siihen, ettei kyselyiden taustaoletuksia ole osattu riittävästi kyseenalaistaa.
Jotta masennuksen arvioinnissa voisi tapahtua aitoa kehitystä, tulisi tutkijoiden tiedostaa ja ilmaista selkeästi se, millaisiin teoreettisiin oletuksiin heidän käyttämänsä mittausmenetelmät perustuvat. Tutkimuksen eteneminen edellyttää aina vuorovaikutusta teorian ja mittareiden välillä: teoria ohjaa mittausmenetelmien kehitystä, ja uusilla menetelmillä saatu tieto taas auttaa meitä kehittämään teorioitamme – sekä hylkäämään teoriat, joita tutkimusnäyttö ei tue.
Ajatuksena tuntuu olevan, että eri masennusoireiden taustalla vaikuttaa lopulta aina yksi ja sama selitys. Tutkimustieto ei tue tätä käsitystä.
Fried edustaa itse systeemisteoreettista näkökulmaa, jossa masennus nähdään yksittäisen syyn aiheuttaman häiriön sijaan useiden eri tekijöiden välisten syyseuraussuhteiden muodostamana systeeminä. Systeemin ymmärtäminen – masennuksen mittaaminen – edellyttää ensinnäkin sen osien tuntemista. Fried korostaa, ettei tämä saisi jäädä vain oireiden listaamiseen.
– Persoonallisuus, ihmissuhteet, elämän merkityksellisyys, fyysinen toimintakyky… Kaikki nämä tekijät ovat osa kokonaisuutta. Oireet ovat tärkeä osa systeemiä, mutta ne eivät yksinään määritä sitä, voiko ihminen hyvin vai ei.
Systeemin osasten kartoittamisen lisäksi tulee ymmärtää, kuinka nämä osaset vaikuttavat toisiinsa. Masennuksen oireita ei tässä lähestymistavassa nähdä vain piilevän häiriön erilaisina ilmentyminä, vaan kukin oire voi itsessään vaikuttaa toisiin oireisiin. Masentunut mieliala voi altistaa uniongelmille.
Nämä huomiot voivat tuntua itsestään selviltä, mutta ne sivutetaan usein siinä, kuinka masennusta käytännössä mitataan. Eri masennusoireiden sekä muiden yksilön ja ympäristön piirteiden välisen dynamiikan hahmottaminen voisi esimerkiksi onnistua paremmin henkilön tilannetta pitkin päivää mittaavilla älypuhelinsovelluksilla kuin staattisilla kyselylomakkeilla.
Eiko Fried uskoo, että kokonaisvaltaisempi, ”systeeminen” näkökulma tulee usein asiakastyössä mukaan luonnostaan, esimerkiksi käyttäytymisanalyysin kaltaisten menetelmien muodossa. Sama kokonaisvaltaisuus jää kuitenkin herkästi toteutumatta tieteellisissä tutkimusprojekteissa. Tämä voi johtaa ristiriitaisiin tutkimustuloksiin ja jarruttaa alan kehitystä. Todellisuutta yksinkertaistavat diagnoosit eivät Friedin mielestä ole itsessään ongelma. Kyse on siitä, kuinka niitä käytetään.
– Ei diagnoosin tavoitteenakaan ole kuvata ”totuutta”, vaan tarjota karkea tiivistelmä. Ongelmana on se, että tutkijat keskittyvät nyt tutkimuksissaan ensisijaisesti diagnooseihin, vaikkei esimerkiksi masennusdiagnoosi ole kovin hyödyllinen kategoria yksilön tilanteen ymmärtämisen kannalta.
Lähteet
- Fried, E. I., Flake, J. K., & Robinaugh, D. J. (2022). Revisiting the theoretical and methodological foundations of depression measurement. Nature Reviews Psychology. https://doi.org/10.1038/s44159-022-00050-2
- Fried, E. I., & Nesse, R. M. (2015). Depression sum-scores don’t add up: Why analyzing specific depression symptoms is essential. BMC Medicine, 13(1). https://doi.org/10.1186/s12916-015-0325-4
- Fried, E. I., van Borkulo, C. D., Epskamp, S., Schoevers, R. A., Tuerlinckx, F., & Borsboom, D. (2016). Measuring depression over time . . . Or not? Lack of unidimensionality and longitudinal measurement invariance in four common rating scales of depression. Psychological Assessment, 28(11), 1354–1367. https://doi.org/10.1037/pas0000275