测量性格——性格心理学三 — 广州市慧苑心理咨询有限公司

由于特征即不是可以看见的物体，亦不是某个具体的动作，而是个人的一些特质，研究者们的中心问题是如何测量它们。

首先，他们得弄清楚自己要测量的倒底是什么东西。早期的性格研究者选择了一大批直觉上非常明显的特征，比如内向，自制和自足。可是，不久，他们就放开了眼界，把别的许多东西也纳入进来加以考虑了，这样一来，庞大的数量使这个领域迅速变得一团混乱了。

因为，有太多的可能。勤奋工作的奥尔波特和一位同事曾数过字典中专指不同人类行为或者品质的词，总数达18000之多。并非所有的词都指特征：有些是观察者对另一个人的反应，而非那个人的特征（“令人敬佩”，“讨厌”），有些只指一时的状态，而非长期的特征（“局促不安”，“魂飞胆丧”），有些只是比喻（“活龙活现”，“多产的”）。尽管如此，仍然剩下4000－5O00个词是专指特征的。

有好几百种已经通过各种各样的方式进行过探索，这些方法从主观印象到实验室的试验，从心理分析解释到行为学数据。一些主要的方法如下所示：

个人材料和史料：信件，回忆录，自传，日记等诸如此类的东西里面，都有大量有关受试者性格的信息，当然也有错误信息，因为一个准备让别人来阅读的自我描述，肯定会表现出一个经过装扮的自我而非赤裸的真实。（佩皮斯的日记里面有大量放荡淫逸的段落和无耻的想法，那是准备给他自己看的，而且全都用密码写的。）对一些著名人物有名的诠释都是以个人材料为基础写的，可是，口味和理论一代一代有所不同，同样的材料会形成有关写作者非常不同的形象。以这样一些材料为基础而作的性格分析有时候是非常好的文学作品，而鲜有符合科学的。

面谈：这也许是最常用的性格评估方法，可也是效率最低的一种。一些就业面试官员，大学入学考试的主管和心理分析学家，他们可以在与接受面试者的谈话中得出很多有关一个人的信息，可其他一些人就不一定。研究证明，哪怕是有经验的面试者们，他们对同一个人可能会得到相当不同的评价。另外，面试可以得出一些描述和解释，可并不能得出可计量的特征测量结果。这种面试最适合于辨别一个人有否明显的精神或者情感障碍，但是，在正常人当中，它作为收集一个人的个人资料、态度、回顾和其它一些细节是最为有用的，这些情况会有助于理解以其它一些方法收集到的有关这个人的更为客观的数据。

由观察者定级：研究者经常请某个人的朋友或者熟人来评定他或者她的若干具体特征。为求准确故，研究者会让被提问的人在某种特征的尺度表上定一个级别，这个尺度表从0－5，或者0－10不等——基本上就是托马西乌斯1692年的搞法。可这个方法有许多困难之处。定级的人有他们自己的定级风格（有些人避免极端，另一些人却非常喜欢走极端），受试者在不同的时候对同一个问题有不同的回答，定级还受到“光圈效应”的影响（一位在某种特征上定级定得高的受试者，倾向于在别的特征上也定出高级别）。

那么，总的来说，定级的办法被认为即不是非常可靠，也不是特别有效。（可靠的方法一次又一次地得出相同的结果，有效的方法测量到的正好就是要测量的东西。）可是，在某些情况下，定级办法是即有效又可靠的。著名的特征心理学研究者雷蒙德·卡特尔就依靠这种方法来进行他的工作，他只采用定级者亲眼在很长的一段时间里（可能的话，在一年的时间里），并在许多情境下看到受试者后得出的数据，而且每次只就一种特征定级，以避免光圈效应。这样的前提会改善可靠性和有效性，但又使这种方法极为昂贵，无法承担费用，也极费时间，而且除了在一个人口相当固定而且彼此看得见的院所里以外，其它的地方简直就无法进行。

问卷：这是目前最为通用的性格评估工具。如我们所见，这种方法很快扩展到超越了简单的自我评估范围，而成了准客观的技巧，比如提供现实生活情形，并问受试者在这些情境中最有可能的行为方式。其它早期的测试继续提出一些有关受试者的态度和感觉的问题，而不是可能的行为，不过，其措词的办法使受试者难以美化自我形象，如在“个人资料问卷”里一样。大多数问卷有“是／不是”或者“正确／错误”选择作为可能的答案，可有一些也包括了像“不知道”这类的中间答案。

心理学家斯塔克·哈塞维和精神病学家J·C·麦金雷都是明尼苏达大学的教授，他们在30年代设计的、著名的“明尼苏达多级问卷”（ M M PI）就属于后一种类型。它里面有550句话，其中包括：

我大部分时间是很快乐的。

我喜欢社交聚会就是为了跟别人处在一起。

我很显然缺乏自信心。

我认为自己口碑不好。

受试者针对每个问题回答“是，”“不是，”或者“？”（不肯定）。这些问题归类分成十个级别，可以测定忧郁、压抑、歇斯底里、精神错乱、失常、男女异位、偏执、神经衰弱、精神分裂症、轻躁狂和社交内向。这些名字给人一种印象，即是说M M PI主要关心的是精神疾病，它的确也能测量精神疾病，可同样也能检测出正常的性格。比如，那些对“我大部分时间是很快乐的”和这个级别里的大部分其它问题都回答“不是”的人，就被称为是精明、心存戒备和处心积虑的人。那些对“我喜欢社交聚会就是为了跟别人处在一起”和相关问题回答“是”的人，就被定为会社交、活泼和有雄心的人，而那些回答“不是”的人就被认为是谦逊、害羞和自我躲闪的人。

这些解释不是以直觉或者常识为基础，而是建立在经验证据之上的。在设计M M PI的时候，哈塞维和麦金雷把一大批问题拿到精神病院或者有精神毛病的人那里去试，再用同样的问题来问访问他们的正常人，然后把能区分两类人群的问题留下来用作问卷。比如，用作压抑尺度的问题由受压抑和不受压抑的两类人作出不同的回答。

尽管M M PI在过去的半个世纪当中是使用得最为广泛的性格问卷，它也有自己的局限和错误。举一个例子来说，问卷很长。再举一例，许多受试者感到，其中的许多项目如果诚实地去回答的话会过于直露，太令人不安（“很糟的词，经常是可怕的一些词会来到我的脑海里，而且挥之不去，”“我受到同一性别的人的强烈吸引。”）。另外，其它一些项目很明显就是针对病理学方面而来的，让正常的人也显得十分可笑或者觉得受到了侮辱。

1949年，一小组性格心理学家得到了洛克菲勒基金的一笔款子，用来在贝克莱的加州大学建立一个新的研究机构，即性格评估及研究所。它原来的宗旨——它的目标后来扩大了些——是要研究出更好的性格评估方法，而在过去的40年里，它已经设计出了数量庞大的研究方法和新的心理学测试办法。可是，最为知名和使用得最为广泛，而且使用至今的一种，就是加利福尼亚心理问卷（CPI），它在这个组织成立的头两年就完成了。

CPI是该所研究员及贝克莱的教授哈里森·高夫博士的工作成果，他决心使用适合正常人的材料来改善M M PI。他收集了1000个问题作为原始材料，有些是从M M PI里面抽出来的，其它一些是他自己和同事们编写的。在助手和同事的帮助下，他测试了这些项目，先在80名研究生中试，再找医学院的80名高年级学生试，在接下来的几年中，总共有13000多不同年龄和不同社会经济地位的男性和女性接受了测试。为了评估这些项目的有效性，或者说评估这些问题所引出的答案的有效性，高夫和他的同事们让一位作为样板的受试人由他的朋友们来定级，然后把定级的结果与受试者自己的答案进行对比，把一些不可信的东西剔除出去。

最后的CPI定稿包括480个项目（1987年版里有462个），比如：

人们常常对我期望过多。

我要坐下来放松一下也很难。

我喜欢聚会，喜欢社交活动。

受试者根据每句话回答“是的，”“不是的”，这些答案会在从自制和自我接受到自我控制和人定这15个性格特征中得出一些分数来（CPI最新的版本里有28个级别。它们可以检测一个人的自制力、保持身份的能力、待人接物的能力、社交表现力、自我接受力、独立性、入定、责任心、社会责任感、自我控制、好印象、社区精神、安宁、耐心、经由服从而取得成就、经由独立而取得成就、智力效率、心理学上的清醒意识、灵活程度、超脱程度、是否喜欢常规、具体化、管理潜力、工作倾向、焦虑程度和三种检测男女异位心理的指标）。从各个方面来说，销售也好，其它语种的翻译情况也好（28种语言，包括克罗迪亚语，印地语和塔加拉族语），还是一些心理学部门和培训项目的领袖人物对它的高度评论也好，都是名列前茅的，它在今天还在使用中的心理学测试方法中处于前10名，也许是前3名的位置，哪怕它问世已经40年了。

许多其它的心理学测试法所提供的问题答案比M M PI或者CPI更广泛，下面有三个例子：

大多数警察待人的确是十分友善的。

（在你同意或不同意的级别数字上画一个圈）

（完全不同意）－3 －2 －1 0 1 2 3（非常赞同）

堕入情网的麻烦比它的价值多。

（在最适合你的感觉的地方打一个对号）

（从未）（很少）（有时候）（经常）（总是）

我对别人的愤怒一般是：

（在最能说明你自己的地方打上打号）

（稍有点）（比一般小）（中等）（比一般大）（很强）

按这种定级方式作出的回答得出了比“YES－NO”反应更为准确的态度和感觉检测。

在过去的许多年里，心理学家们设计了成百套性格问卷，研究机构和商业出版机构加以出版。有些代表很好的科学实践，还有一些却不是如此，可是，每种设计都是极好的商业财富。例如，CPI的销售数字，它的指南书，5本可重复使用的测试册子，50张答案卷和其它一些项目，尽管还是个秘密，但按高夫博士的说法，“应该是相当大的”。

投影测试：从上世纪30年代早期开始，越来越多的心理学家接受了心理分析的理论，认为无意识过程是性格的主要决定因素，而且，对不起戈登·奥尔波特先生，他们还寻找到很多检测的办法，用以测验这些过程以及由过程引发的特征。最为可行的办法是给受试者提供一些模棱两可的刺激——很模糊或者暗示性的图形或者图画——再请他或者她来描述这些图形。一般来说，作出的回答会显露出他们的一部分或者全部无意识的幻想、恐惧、期望和动机。

这样的测试中，最为有名的一个是在许多年以前——约在1912至1922年之间，由一位瑞士精神病学家赫尔曼·罗斯察设计出来的。他弄出了若干墨迹，请病人说出每个墨迹看起来像什么。通过许多年的实验以后，他把这种测试减少到了10种墨迹，有些是黑白的，有些是彩色的。进行罗斯察测试时，测试者把一张卡片显示给受试者看，再问他或她这个墨迹可能是什么东西或者让人想起什么，把答案写下来。所有的卡片都显示完毕以后，把答案评上分。打分需要仔细的培训，还要用到手册，其评分的一些标准是，受试者对整个墨迹或者一部分墨迹作出反应，墨迹的哪一部分受到了注意，答案是针对墨迹本身还是其背景。这里有几个与这种测试近似的（原罗斯察墨迹不允许复制）墨迹，还有一些对典型的反应作出的解释。

上世纪30年代，罗斯察测试法在美国的心理学家当中极受欢迎而且广泛使用。在几十年的时间当中，它一直是临床心理学博士论文用得最多的论题，有成千上万的研究论文是论述它的，可最终的裁决是说什么的都有。一些人发现所做的解释可靠也有效，另一些人却不这么想。然而，它总还是临床心理学家和精神病学家使用得最为广泛的测试法之一。

另一种有名的投影测试法是主题统觉测试（TAT），是由心理学家亨利·默里和一名助手克里斯蒂安娜·摩根创制的。生相高贵的默里在内心里却受着某个魔鬼的驱使，他在经历了很长一个痛苦的旅程之后才找到自我。他先是学历史的，经过了医学培训，成为外科专家，然后又花了5年时间学生理化学。他还在研究阶段就去苏黎世拜访了荣格，并在与他一起的三个星期的每一天和每一个漫长的周末里参加心理治疗。如他所说的，在这个“爆炸性的体验当中”，他“成了一位再生者”。他治好了到目前为止一直没有治好的口吃毛病，并对心理学产生了浓厚的兴趣。他转而学习这门学问，成了一位心理分析学家，最后在哈佛心理临床所找到了自己作为一位有心理分析倾向的研究人员。他与奥尔波特进行过短期合作，可是，那之后，他对性格抱的心理动力学观点使他们，按照奥尔波特的说法，“处于一种友好的分离状态下”。默里对性格研究最有意义的贡献，在于他和约20多位心理学家花3年时间进行的临床研究项目。他们深入研究了51位按评估技术分成类别的、大学年纪的成人的性格特征，分类的技术包括深层面谈，挫折测试（如根本不可能取胜的拼字游戏），实验者说出一些挑斗性的词，如“骗子”，“同性恋”等时受试者手指的颤抖，还有投影测试。在投影测试中，TAT法是最说明问题的一种。

实施默里和摩根于1935年为研究该项目而开发的TAT法时，测试者让受试者看19张黑白图片，图片里在进行什么事情或者为什么进行什么事情一点也不知道，但要求他为每张图片编一个故事出来，每个故事花约5分钟的时间，可以任由想象力自***由发挥。对这些故事进行的心理学解释，在很大程度上依赖于一个由项目研究小组编制的、由35条性格“需要”或者动机而组成的单子，其中有获取成就的需要，自制的需要，还有秩序的需要和成为别人的救星的需要。

默里和摩根在一项描述他们的TAT开发的报告中，印了好几张图片作为样板。在一张图片中，有一位中年妇女向着左边的侧影，在她的旁边近靠观察者的地方，有一位穿戴整齐的年轻男人稍稍背对着她，他的头稍稍有些下垂，脸上略有皱眉的表情。（只有靠这些描述了，该测式法目前的出版人不允许复制这些图片。）默里和摩根说，下面这个故事，是一位受试者根据这幅图片编的：

母亲和孩子幸福地生活着。她没有丈夫。她的儿子是她惟一的支持。可这个孩子交上了坏朋友，并作为从犯参与了集体抢劫活动。他被发现了，并判了5年监禁。该图片表现他与母亲告别的场景。母亲很伤心，为他感到羞耻。孩子也感到非常羞耻。他因为自己给母亲造成的伤害而担心，担心的程度超过了他对自己要进监狱的担心。

这孩子（故事还在继续）因为表现好而出狱了，可他母亲已经去世，他堕入了爱河可又回到了犯罪的行列，他又回到监狱里去了，他出狱的时候已经成了一位老人，他的余生在忏悔与潦倒中度过。

默里和摩根解释这个故事时说，它表明讲故事者感觉到了外部的坏影响对一个人的行为产生的控制，它还显示出了好几种深层的需要，其中有（对其母亲的）供养，获取金钱和自我贬低。默里和摩根说，这个例子说明了TAT的特别价值：

本测试所依据的事实世所公认：当一个人解释一个含义模糊的社会情境时，他很容易像他所关注的现象一样暴露出他自己的性格来。他完全倾心于解释那个客观的现象，变得非常天真，没有意识到他自己，也没有想到别人正在仔细地看他，这样一来，他也就变得毫无戒备，没有平日那么有警惕性……受试者暴露出了自己内心深处的一些幻想而丝毫没有察觉。

尽管TAT法有其价值，可用起来还是相当麻烦，一些人讲出长篇大论的一系列故事来，得出了大量的信息，可另一些人又无话可说，什么信息也没有。尽管如此，它证明还是一种可靠也有效的工具，可以用来检测性格特征，而且证明还据有预测的威力。1952年参加了TAT测试的57位哈佛毕业生，在他们到了30左右的年龄时，又对他们进行了事隔15年后的研究。在1952年的测试中显示出有较高的私密动机的人，他们在婚姻、工作和其它有相互关系的领域里适应的程度也高得多。TAT已经使用好多年了，虽然没有罗斯察氏的测试法使用频率高，而且也引发了许多类似的测试。在最近的几十年时间里，有大量的投影测试法产生出来，许多目前还在使用中。它们包括布莱基法，这是一套有关一只小狗的图片故事（小孩子为每一张图片编一个故事）；有词汇联想法（在一些测试中，受试者在听到或者读到一个词时，把来到脑海里的第一个词提出来，在另外一些测试中，受试者用给定的词造一个句子），完成句子法（“但愿我母亲……”，“最烦我的一件事是……”等等），有图画测试法（有一种是这样的，受试者被要求画一座房子，一棵树，还有一个人。图画用心理动力学进行分析，例如，一棵死树，暗示情感空洞，树叶很多的表示活力，尖尖的树暗示攻击性。）

行为取样或者操行测试：在这类的评估中，一位经过培训的心理学家在特定情形下观察某人，并检测或给他或她的行为定级。观察者通过单向镜观察孩子们在教室里一起完成某个项目，玩耍或者面对一个设计好的刺激所产生的反应，如从隔壁教室里传来的呼救声。或者，这位看不见的观察者也可以看着一组人在特定的情境下的表现，如在试图解决某个需要合作的问题时。

在另一种形式的操作测试中，心理学家与某人面对面，让他或者她进入一个很麻烦或者很压抑的情境里，再按他最终的行为来定级。第二次大战中，空军飞行员候选人培训就经过了一组测试，其中一个是，受试者要在一根管子里面捏住一根很细的金属棒（只要一碰上管子，灯就亮一次），而进行测试的人会说一些令人不快或者吓唬人的话，甚或突然在他旁边大吼一声。

也是在二战期间，战略服务处选拔秘密服务人员到一个与外面隔绝的地方经过三天的连续考试。除了接受常规的面试和完成问卷以外，这些人还要面对一系列困难的任务：在没有任何适当说明材料的情况下搭一座军营，攀登一堵高墙，趟过一条溪流，抵抗酒精的作用保持清醒头脑。心理学家们给他们的领导能力、抵抗压力和挫折的能力等等定级。这些方法听起来很不错，可是，小组的成员们在最后的报告中都承认，他们几乎没有收到海外回来的反馈，因此也丝毫不清楚他们自己的评估倒底有多么准确，多么有用处。不管怎么说，作为一种测试个人性格的办法，这种方法造价太高，很难实施，对于普通用途来说要求也太高。（贝克莱性格评估及研究所最初的宗旨是要进一步开发并测试战略服务处的评估方法。这个目标后来被放弃了。）

还设计了更为实际的一些操作测试法，可是，由于大部分都要求每位受试者都有一个测试人，而且许多测试还必须在实验室里进行，这也不适应学校、工厂、临床和机构以及军队当中的大型性格测试应用。有几个例子列在这里：

——受试者得通过四道印制的迷宫，每道只花15秒的时间，不能让铅笔轨迹碰到迷宫的边缘。如果成功，就说明该人有决断力。

——受试者按正常方法大声地念一篇故事，然后倒过来念；所费时间的差距越大，受试者比较僵硬和不灵活的可能性就越大。

——一组受试者参加一个对某个有争议话题的态度测试，每个人都私下里被告知他或者她的观点与大多数人的不同。（出于测试的目的，这不一定就是事实。）再过一会儿之后，受试者再接受测试，一个人对其声明的态度改变的程度，被用来检测他或者她对于求同压力或者按某些说法是对于适应性压力的抵抗能力。