SYNSPUNKT
Løvstad/Kumar: Mange psykologiske tester i arbeidslivet er tulletesting kokt på syltynn suppe
Fortsatt brukes testbatterier i norsk arbeidsliv som er like relevante, pålitelige og valide som de «testene» som for flere år siden florerte på sosiale medier. Du vet, de der man kunne få vite hvem man var i «Game of Thrones» eller «The Simpsons».
Jakob Sverre Løvstad, er CTO i Seema, sivilingeniør og cand.psychol. Manav Rihel Kumar, er CEO i Seema, krigsskoleutdannet og master fra LSE.
SYNSPUNKT. Med unntak av underholdningsverdien, tror vi de færreste tok med seg disse karakteristikkene inn i jobbsituasjoner eller lot dem definere egen identitet i særlig grad.
Dette er kanskje litt vel krasse ord, men det er da også fordi det er svært betenkelig og lite konstruktivt at tid og penger brukes på en type testing som er syltynn suppe i et vitenskapelig perspektiv.
Ikke minst er det, for oss som jobber med mangfold, en viktig fanesak fordi personlighet, kognitive evner og jobbrelevant kunnskap er noe som skjærer på tvers av demografiske faktorer som religion, kroppstype, legning, etnisitet osv. Der de demografiske faktorene kan påvirke hvorvidt vi trives og presterer på arbeidsplassen, forteller de øvrige faktorene mye om vårt underliggende potensial for å yte. Da er selvsagt forutsetningen for sistnevnte at de testes riktig. Ellers er vi like langt.
Kategoriseringsproblemet
Alle tester som følger logikken om at man tilhører en bestemt kategori eller har binære egenskaper, er på en reise bort fra eksisterende psykologisk forskning. Det førstnevnte, altså kategori, er tester som påstår at folk er «blå, grønne, gule» eller lignende.
Sistnevnte, altså binær logikk, er tester der man kan være «enten ekstrovert eller introvert» eller «enten tenkende eller følende», eksempelvis. Psykologiske fenomener følger i all hovedsak statistiske fordelinger hvor man er noe i større eller mindre grad. I noen tilfeller, som ved psykiatrisk diagnostikk, har man i praksis satt en terskel for fenomener hvor man tildeler en diagnose.
Men generelt i sammenhenger hvor man ønsker å se på individers karakteristikker, er det alltid en gradsforskjell, ikke skarpe skillelinjer. Folk er eksempelvis spredt på en introvert-ekstrovert-skala hvor man har alt fra de som knapt sier et ord til de som setter pris på en del kontakt (de aller fleste) til de som knapt kan leve uten å stadig prate med folk. Og innen intelligens har vi alt fra de som ikke skjønner hvordan et dørhåndtak fungerer til de som nesten regner differensialligninger i hodet. Og da virkelig alt imellom!
Men tester som kommer trekkende med ymse bokser er i all hovedsak verdt å styre unna.
Sammenheng med øvrig relatert forskning
Et annet problem med mange tester, er at de simpelthen henger i løse luften. Om man skal måle ulike sider av et menneske, må man kunne begrunne at disse fenomenene faktisk gir mening opp mot evolusjonspsykologi, nevropsykologi og så videre. I et pattedyr som lever i hierarkiske stammesamfunn, som mennesket i utgangspunktet er, vil det være en del trekk som gir god mening å snakke om. Mennesker vil i varierende grad være åpne for nye erfaringer, noe som påvirker hvem som sannsynligvis holder seg til normer og tradisjoner – mens andre vil gå og finne ut av nye ting og utfordre. Noen er veldig smarte og kan klekke ut løsninger på vanskelige problemer, mens andre kanskje passer til enklere oppgaver som for å få maskineriet til å gå rundt. Noen er kanskje mer dominante og søker å styre, mens andre er mer underkastende for autoriteter og passer til å være følgere. Og så videre.
Andre fenomener, som om man er intuitiv versus tenkende, gir svært lite mening å måle.
Tester som påstår å måle fenomener som ikke lar seg gjenfinne i øvrig forskning rundt menneskets funksjoner, vil de facto ikke ha noen relevans.
Tester som kommer trekkende med ymse bokser er i all hovedsak verdt å styre unna
Prediksjon av atferd
En test er, i psykologisk forstand, ment å kunne kartlegge atferden til mennesker. Det vil si at hvis man finner ut at noen er særlig smart på «logisk intelligens», bør det også være mulig å bekrefte når vedkommende skal lære seg matematikk eller fysikk. Eller, hvis noen er testet til å være særlig pliktoppfyllende, bør det være ganske synlig at vedkommende leverer oppgavene sine i tide og at vedkommende kommer tidsnok til møter.
Her er det viktig å presisere at alle tester adresserer folks tendenser på tvers av situasjoner. Så man kan aldri avgjøre om noen er skikkelig logisk smart ut ifra å se på en enkelt matteprøve, eller om vedkommende er ekstrovert ut ifra oppførsel på en enkelt fest. Men over tid skal man tydelig se konsekvensene av det man har målt.
Også her er det mange rare ting som benyttes i arbeidslivet som grunnleggende sett bare er å droppe fordi: «So what?». Om man ikke har forskning på at det fører til noe man er opptatt av, så er det helt meningsløst. En test må ha sammenheng med jobbkravene til stillingen.
Et annet problem med mange tester, er at de simpelthen henger i løse luften
Stabilitet
Når man måler personlighetstrekk, ligger det i sakens natur at vi ønsker å måle noe vi tenker er stabilt/varig ved individer – i kontrast til situasjonsbetingede årsaker til at man gjør som man gjør. Derfor må man sikre det man på fagspråket kaller «test-retest reliabilitet», altså at en test viser det samme om en person som får den flere ganger og over tid. Om man viser seg å være svært ekstrovert ved første gjennomføring, skal man ikke plutselig virke kjempeintrovert en stund etterpå.
Dette er da også en grunnleggende problemstilling med flere av testene som brukes per i dag: De er simpelthen volatile; man kan tilhøre én kategori eller fremstilling i uke 1, og en annen i uke 8. Det er naturlig nok noe som gjør bruken av testen meningsløs i en jobbsetting.
Hvorfor roter vi?
Det er ikke fordi folk er kollektivt dumme eller kjipe at det brukes mye rart av tester der ute. Men menneskehjernen liker veldig godt å kategorisere – og det er noe den skal kunne veldig godt for å sikre artens overlevelse. Men samtidig gjør det at vi ofte har et overslag i å gå rundt å kategorisere der statistikken og forskningen er langt mer nyansert. Og hva gjelder prediksjon og det faglige, så er det ikke til å stikke under en stol at det er få med omfattende psykometrisk utdanning og høy statistisk kompetanse der «ute i felten». Så da er det også lett at kunnskapen rett og slett ikke finnes der den trengs, noe som igjen fører til at det er lett å bli solgt testteknisk slangeolje.
Noen av disse testene tar litt tid. Men alternativet er å teste noe som ikke har noe å si
Tips fremover
Det er lurt når man skal drive med testing av ansatte og ledere at man tar seg tid til å søke litt rundt på Google Scholar eller svipper innom universitetsbiblioteket. Alle anerkjente testbatterier har gjerne drøssevis av vitenskapelige artikler som beskriver alt fra språknormering i forskjellige land til studier med mange tusener, tidvis hundretusener, av deltagere som viser hva de målte fenomenene har av reelle konsekvenser. Gode eksempler her er NEO-PI (gjerne kjent som «femfaktormodellen» eller «Big Five»), «Wechsler Adult Intelligence Scale» (WAIS; mest brukt klinisk, men også helt topp i arbeid), «Intelligence Structure Test» (IST; normeres til norsk befolkning i skrivende stund), «Raven's Progressive Matrices» (RPM; kulturuavhengig intelligenstest brukt av blant annet Mensa, som tester såkalt fluid intelligens) med flere.
Det eneste som en del kan finne avskrekkende, forståelig nok, er at noen av disse testene tar litt tid. Men alternativet er å teste noe som ikke har noe å si. Så det å bruke tid og penger på en papirøvelse virker mye verre enn å sette av litt mer ressurser for noe som faktisk har en betydning for organisasjonen, og individet som skal prestere i stillingen.
Nylige artikler
Norge, EU og Storbritannia enige om fiskeriavtale
EUs beslag av russiske midler: De Wever alene mot Kommisjonen – men vinner hjemme i Belgia
Økt oppmerksomhet uten politisk betydning
Monument-syndrom og offentlige bevilgninger
Så mange ledere er det i kommunen der du bor
Mest leste artikler
Regjeringen skroter lovfestet betalt ferie fra første arbeidsår: Akademikernes leder Lise Lyngsnes Randeberg er skuffet
Magne Lerø: Trump og EU: Forvirring rundt fredsplanen for Ukraina
Forsvarsmekanismer på arbeidsplassen: Hvordan ledere og ansatte lurer seg selv
Indre Namdal tester ny fastlegemodell: Kommunalt oppgavefellesskap i fokus
Vegard Einan i NHO Service og Handel: LOs søksmål om deltid truer den norske arbeidsmodellen