Akquiescence and Social Desirability: Psychometric Bogeymen

Bogeyman på barnesengen

En annen (og mindre kjent) hobgoblin som angivelig ødelegger personlighetstestens gyldighet, er fremmende svarskjevhet (noen ganger kalt ja-si). Acquiescence refererer til tendensen til å være enig med alle personlighetsgjenstander, uavhengig av innholdet i varen. Hvis skjevhetens svarskjevhet fungerer, er det lett å se hvordan dette ville ugyldiggjøre resultatene av en test. I stedet for selektivt å godkjenne uttalelser som faktisk gjelder dem, ervillende respondenter samvittighetsfullt enige i alle uttalelser, og unnlater derfor å beskrive deres særegne personlighet kjennetegn.

Etter over 30 år i personlighetsbransjen, tenker jeg normalt ikke så mye på psykometriske svindlere som sosial ønske om skjevhet og frisk respons. Jeg ble tross alt lært på forskerskolen at forskere som Jack Block (Utfordringen for responssett, 1965) og Leonard Rorer "Myten om den store responsstilen," Psykologisk Bulletin(1965) for lenge siden lagt ryktet om respons forspenning bogeymen til ro. De som fortsetter å tro på svarfordeler i dag, er som barn som holder seg til irrasjonell frykt for monstre.

IPIP-NEO

Det eneste problemet med den originale IPIP-NEO er at den er lang. Veldig lang. Med 300 varer er den enda lengre enn den 240-varers NEO PI-R den var basert på. Derfor konstruerte jeg en kortere versjon ved å identifisere 120 av de originale 300 elementene som virket i stand til å representere de fem brede domenene og 30 fasettene uten mye frafall i pålitelighet. Anmelderne og redaktøren for manuskriptet mitt trodde at denne kortere beholdningen, som jeg kaller IPIP-NEO-120, hadde godt potensiale, men de hadde et alvorlig forbehold: Jeg hadde ikke gjort en innsats for å identifisere like mange positivt formulerte og negativt formulerte elementer for alle 30 fasetter. For eksempel hadde angstfasett-skalaen alle positivt formulerte elementer, der enighet representerer tilstedeværelsen av angst: "Bekymre deg om ting." "Frykt for det verste. "" Jeg er redd for mange ting. "Og" Få stresset lett ut. "Jeg kunne ha tatt med ord med negativt ord fra den opprinnelige IPIP-NEO som" Er ikke lett plaget av ting. "og" Am avslappet mesteparten av tiden. "men det gjorde jeg ikke. (Grunnen til at jeg ikke gjorde det, var fordi jeg var mer opptatt av å lage skalaer med høyest grad av intern-konsistens-pålitelighet.)

Rotter er enig med fremmende respons skjevhet

Heldigvis ga redaktøren og anmelderne meg en ut. De foreslo en prosedyre for å undersøke hvorvidt fremmende responsforskjell pluss ubalanse mellom positivt og negativt formulerte elementer påvirket IPIP-NEO-120 negativt. Hvis du er interessert i de tekniske detaljene i prosedyren, kan du finne en beskrivelse i vedlegget til en artikkel av Soto, John, Gosling og Potter, publisert i 2008 i Journal of Personality and Social Psychology (Vol. 94, pp. 718-737). Men i utgangspunktet innebærer prosedyren å opprette en Acquiescence Index (AI), et mål på individenes tendenser til akseptabel respons skjevhet, og deretter se om å korrigere for AI gir høyere gyldighetskoeffisienter og en tydeligere faktorstruktur.

Så jeg fulgte prosedyren og gjett hva? IPIP-NEO-120 skalaer som, når de ble scoret normalt, hadde korrelert betydelig med relevant bekjentskap rangeringer, klarte nå ikke å korrelere med rangeringene da score ble justert for frisk svar partiskhet. Og gjennomsnittlig faktorkongruens mellom IPIP-NEO-120 og foreldre NEO PI-R var 0,93 da skalaer ble scoret normalt; etter korreksjon for friskhet, falt gjennomsnittlig kongruens til 0,70. Kort sagt, korrigering for fremmende respons skjevhet redusert gyldigheten av IPIP-NEO-120 score. Konklusjonen min? Skjevhet i faglig respons er en psykometrisk bogeyman. Som ethvert imaginært monster blir det best ignorert.

Jente holder maske

Prinsippets bekymring fra de som tar sosial ønskeverdighet alvorlig er at noen mennesker bryr seg mer om å lage et godt inntrykk på en personlighetstest enn om objektivt å beskrive deres faktiske tanker, følelser og atferd. Ulike forskere har forskjellige meninger om hvor mange som er berørt av denne skjevheten. En av de opprinnelige teoretikerne om sosial ønskelighet, Allen Edwards, var glad i å påpeke hyppigheten av avtalen med personlighetsgjenstander korrelert med 0,80 eller mer med de uavhengige rangerte sosiale ønskene til varene, noe som kan innebære at for alle sannsynligheten for å være enig med en vare ble nesten helt bestemt av gjenstandens sosiale ønskelighet.

Likevel anerkjenner de fleste forskere sosial ønske om skjevhet som en variabel av individuelle forskjeller, med noen sterkt påvirket av den og andre mindre. Edwards selv opprettet en sosial ønskelig skala fra MMPI-elementer for å måle forskjeller i skjevheten. Et annet mye brukt mål for sosial ønskeverdighet er Marlowe-Crowne Social Desirability Scale. Mens Edwards-skalaen er tungt lastet med psykopatologi, refererer Marlowe-Crowne-artiklene til uvanlig, men sosialt ønskelig atferd. Nok et kjent tiltak er Good Impression skalaen fra California Psychological Inventory. Denne skalaen ble opprettet ved å få en gruppe av personer til å svare på et sett med elementer to ganger - først når de vanligvis ville, og deretter med instruksjoner om å svare som om de prøvde å skape et så gunstig inntrykk som mulig. Elementer som ble svart på forskjellig mellom de to anledningene, ble skalaen God inntrykk. Endelig er den mest sofistikerte innsatsen for å måle sosial ønske i dag et sett med skalaer forfatter Del Paulhus, kalt Balanced Inventory of Deseful Responding (BIDR). BIDR inneholder to skalaer, en for å vurdere utilsiktede tendenser til å presentere en overdrevet positiv bilde av seg selv, og et sekund for å vurdere forsettlige, bevisste tendenser til å skape en positiv inntrykk. Paulhus beskriver sitt mål så vel som Edwards Social Desirability Scale, Marlowe-Crowne og Good Impression i en 1991 bokkapittel.

Som du ser, har det vært en betydelig mengde undersøkelser de siste 50 årene om skjevhet i sosiale ønsker. Mange forskere tar fremdeles samfunnsønskelig skjevhet som en alvorlig trussel mot gyldigheten av personlighetsskala. Ofte når et nytt personlighetstiltak blir introdusert, vil folk ønske å vite hvor sterkt skalaen korrelerer med et av de nevnte målene for sosial ønskeevne. Hvis korrelasjonen er for høy, vil forskere si at skalaen er "forurenset" av sosial ønskelighet, noe som betyr at respondentene kanskje svarer med tanke på ønskeligheten i stedet for innholdet i elementer.

Fem faktorer for personlighet som bestemmer arbeidsytelsen

Nå har du hørt bekymringene fra forskere og utøvere om skjevhet i sosiale ønsker. Hvis du ikke hadde tenkt på dette problemet før, kan du være enig i at denne skjevheten representerer en alvorlig trussel mot gyldigheten av personlighetspoeng. Og du bør i det minste vurdere mulighet at en slik trussel eksisterer fordi det er rimelig å tenke på samfunnsønskelig skjevhet som en potensiell trussel. Det er lett å forestille seg jobbsøkere som svarer på spørsmål på måter de tror vil få dem til å se ut som den typen personer som vil bli ansatt, i stedet for den typen de er. Og hva ville hindre dem i å gjøre dette?

La meg nå ta opp noen punkter som kan få deg til å tenke deg om to ganger om potensialet for partisk respons faktisk oppstår i virkelige testsituasjoner. (Jeg vil ikke diskutere kunstige laboratorieinnstillinger, hvor det er lett å oppnå kunstige resultater.) La oss begynne med den situasjonen der mange psykologer tror at folk mest sannsynlig ville skjevt svarene sine på en sosialt ønskelig måte: personell valg. Her er spørsmålet jeg vil stille: når jobbsøkere deltar i et ansikt-til-ansikt-intervju, svarer de på intervjueren spørsmål med sløv, uinteressert, objektiv ærlighet, eller prøver de å skreddersy svarene sine på måter de tror vil få dem til å se ut god? Det er klart alle intervjuobjekter med minst et sosialt modik intelligens vil prøve å se bra ut. Så det virkelige spørsmålet er ikke om jobbsøkere prøver å skape et godt inntrykk på personlighetstester (selvfølgelig de er), men om svarene deres er mer eller mindre gyldige enn svarene fra en jobbsøker i et ansikt til ansikt-intervju.

De som bekymrer seg for sosial ønske om skjevhet på testen, kan spekulere i at det er lettere å si usanne ting på en personlighetstest fordi i et liveintervju kan intervjueren sammenligne søkerens verbale og ikke-verbale oppførsel for å bestemme hvor sannferdig søkeren er å være. Men det er bare spekulasjoner. Man kan like gjerne anty at det kan være fokus for intervjuerens få spisse spørsmål føre til at en søker blir enda mer opptatt av å si hva han eller hun mener intervjueren ønsker å gjøre høre. På den annen side, når du tar en personlighetsinventar (spesielt en lang) er det så mange spørsmål å svare på at det å prøve å finne ut det "ønskelige" svaret blir tyngende. Det er mye lettere å følge automatiske reaksjoner, som gjenspeiler de vanlige (dvs. typiske, gyldige) personlighetstendensene dine.

Det kan være lurt å vurdere muligheten for at det å svare på elementer i en personlighetsbeholdning ikke er så forskjellig fra å snakke med mennesker i hverdagen. Når vi samhandler med mennesker i hverdagen, er vårt hovedmål vanligvis ikke å kommunisere lister over objektive, vitenskapelige fakta om oss selv. I stedet prøver vi å oppnå en rekke mellommenneskelige mål som å underholde andre, slik at de vil like oss, imponere potensielle romantiske partnere, fremkalle hjelp når vi føler oss svake eller uvel, overbeviser konkurrenter om at vi er smartere eller tøffere enn de er, og så videre. En persons "personlighet" representerer hans eller hennes vanlige, typiske strategier - både verbale og ikke verbale - for å forfølge mål som er viktige for personen. I flere tiår har jeg antydet at svar på personlighetsartikler er en utvidelse av en persons vanlige mellommenneskelige stil, ikke en løsrevet, uinteressert, objektiv rapportering av atferd. Her er en tidlig artikkel om emnet; her er en nyere.

Emosjonelle personligheter

Konklusjonen jeg har trukket om sosial ønskelighet er at folk varierer mye i den sosiale ønskeligheten i hverdagen deres atferd, og disse forskjellene har en tendens til å gjenspeiles tilsvarende i den sosiale ønskeligheten av deres svar på personlighet elementer. (Det kan være unntak fra dette, diskutert intelligent av Del Paulhus i avsnittet Future Research Instructions i hans bokkapittel.) Dette betyr at hvis vi prøver å fjerne sosial ønske statistisk, vil vi redusere gyldigheten av personlighetspoeng, og det er nøyaktig hva McCrae og Costa (1983) funnet. Akkurat som når jeg fjernet fremmende svarskjevhet fra IPIP-NEO-120. Erverv og sosial ønske? Bogeymen.

Bogeymen og natteskrekk