超普通心理学/心理学研究法
本章节将以常见的五种心理学研究法:个案研究法、实验法、观察法、相关法、调查法,分别讨论其优缺点与研究时的注意事项,并举出这些方法在生活中运用的例子,让读者能够了解心理学在社会上的应用与价值。另外,本章也提供最新及本土学界的研究供参考。
心理学研究又分为质性取向与量化取向。质性取向的心理学研究,意指以田野调查、访谈法等方式取得的资料来进行研究;量化取向的心理学研究,则是指以统计方法或数学模型所得出的资料来进行研究。在今日的心理学中,两者间的差异已不再由研究主题决定,而是由研究方法决定。
心理学研究的目的
编辑心理学的研究包括基础研究和应用研究。
研究名称 | 重视的方向 | 研究方式 | 例子 |
---|---|---|---|
基础研究(basic research) | 重视理论性 | 科学性的探讨,为获得关于现象或可观察事实的基本原理,进行实验性或理论性的研究,终用于解释、预测和控制行为。 | 1. 什么样的因素会导致忧郁症? 2. 什么样的因素可能会导致暴力行为? |
应用研究(applied research) | 重视实用性 | 将心理学建立的原理和方法加以实践,来克服其他领域中实际的问题,以提升人类生活品质为目标。 | 1. 调查怎么样的治疗方式对减轻忧郁症最有效 2. 调查怎么样的计划可以减少学生在学校的暴力行为 |
尽管不同领域的心理学研究对象不尽相同,但其目的都可被归类为对心理与行为作出描述、解释、预测、控制。(于心理学绪论中有详细介绍过)
心理学研究的原则
编辑研究心理学的方法众多,然其主要遵守下列五大基本原则:
原则名称 | 强调 | 注意方向 |
---|---|---|
客观性原则 | 以客观观察,不主观臆测 | 外部条件、客观指标、严谨态度、数据透明性 |
发展性原则 | 重视研究对象的变化性 | 阶段性发展、纵横向对比 |
系统性原则 | 重视各个因素的相互作用的关系 | 其他因素对事情本身的连带影响 |
教育性原则 | 重视研究方法对受试者的影响 | 不影响受试者身心,是否有教育意义 |
专业原则 | 遵守心理学专业人员伦理准则 | 人道尊严与社会福祉,隐私与保密,道德与法律,文化与使命,诚信与负责,专业与坚持 |
- 客观性原则
- 心理学研究必须真实地反映心理现象的本来面貌。人的心理是客观现实的反映,一切心理活动都是由内外部刺激引发的,并通过一系列生理变化在外部活动中表现出来。研究人的心理,就是要从这些可以观察到或能够进行检查的活动中研究。研究者在进行心理学研究时,应该客观地考察、揭示现象的本质,而非以主观臆测,如此才能得到可靠的心理事实。因此,为了贯彻客观性原则,研究者需严格控制外部条件、确认所要研究的心理现象的客观指标、抱持严谨的态度并提供完整的数据集和分析脚本,以便其他研究者能够进行重复研究和验证,才得以如实地得出结论。
- 发展性原则
- 心理学研究应从心理发展史、意识发展、个性心理发展以及环境和教育条件的变化等方面,揭示人的心理发展规律。研究者遵循发展性原则,即是将人的心理活动看成是一个个阶段性变化的过程,在不同年龄阶段研究个体的心理发展。过程中进行纵向研究,能追踪同一组个体的心理变化,了解其发展过程中的动态变化;采用横向研究,对不同年龄组的个体进行比较,以了解不同发展阶段的差异。在研究发展中的心理活动时,不仅要求阐明受试者已经形成的心理品质,还要求阐明那些即刻产生、正处于形成状态的新的心理品质。
- 系统性原则
- 心理学研究应从发展变化和相互联系的角度考察心理现象,而非孤立、静止地研究。任何事物都有可能有所联系,且发展变化快速,人的心理现象也不例外。在研究某一心理现象时,需考虑其他心理现象的影响,从整体系统的角度进行分析与综合。心理与意识虽然都是很复杂的现象,但可以借由剖析将其分解为各种形式,以进行专门的考察研究,而后通过整合将其看成有机联系的整体加以理解。在研究某一种心理形式与现实条件的依存关系时,也可以分别地考察某一条件在其中所起的作用,而后将其揭示的各种规律加以综合运用。
- 教育性原则
- 要求研究者在选择心理学研究方法时,要考虑所使用的方法对受试者的身心是否产生不良的影响。尤其是当受试者的身心仍在发展阶段时,他们的认知能力较弱,容易受到影响或模仿。有些心理学研究可能就需要涉及一些情绪或压力等不适感受,这些研究对于理解心理现象和提高心理健康有重要意义。因此,在某些情况下,需在保护受试者并衡量其可接受范围的前提下,进行一定程度的挑战性研究,以推动心理学领域的发展。
- 专业原则
- 心理学研究过程中需严格遵守专业伦理准则,确保研究对参与者及社会的利益。研究设计与执行必须符合法律及专业团体的道德准则。心理学研究应尊重参与者的尊严与福祉。规划研究时,研究者应先评估该计划是否合乎“道德”,是否会危害参与者的生理和心理状态。若有顾虑,研究者应先向相关专家请教,以保障参与者的权益和知情权。
心理学研究的变数
编辑变项(Varible):被用以表示一个值给定集合(通常指函数的定义域)中不确定元素的数值。研究方法学者 Kerlinger, F.N.认为“变项就是能产生不同数值的特质。” 而心理学研究中一般需要分析三种类型的基本变数,分别为机体变数(Organic variable)、刺激变数(Stimulus variable)、反应变数(Response variable),心理学研究的目的在于了解这些变数与引起这些变数的各种因素如何产生联系,通过对这三项变数相互关系的研究,来揭示心理活动的规律和机制。
变数名称 说明 举例 机体变数 人和动物被试者都存在着个别差异 如遗传、发育、动机、智力及人格等方面的差异 刺激变数 影响机体反应的种种环境因素 如外界的声音、光线、生活和工作条件、学习环境以及他人的言语、动作、态度等的变化 反应变数 由刺激引起机体行为上的变化 如反应的速度、次数、正确性、强度等方面的差异
变项量测
编辑许多心理学研究涉及心理属性(Attribute/Property)的排序或比较。量测(Measurement)是一量化过程,根据物件属性赋予对应数值(numerical value),而量尺值(scale value)即所分派之数值(Patrick Suppes & Joseph L. Zinnes, 1963),也就是一种函数转换:“f(x)=y,f(物件属性特征)=数字”。 当心理学朝科学的方向发展,量测由心理属性构成的变项为关键的步骤,且大部分的心理实验推论来自于量化后的数字资料之统计、检定。量化后,数字系统能提供共同的语言,处理二元运算相较于属性或是物件本身要来的单纯方便许多。
变项数值化的争议
编辑- 物理学界的质疑:社会学(特别是心理学)是否算是科学?
- 1920 年代,英国物理学家侃伯(Norman R. Campbell)等人发起论战。他们认为基本物理属性之所以能够被测量,是因为具有单位量尺首尾相接的“串接”(Consatenation)操作特性,而心理变项量测不具“串接”特性,故无法执行二元运算及其他衍生运算。
- 数理心理学家的反驳与共连量测概念
- 主张“串接”并非心理属性能否进行科学测量的单一判断标准。
- 他们借由公设法探讨其他可行的变相量测方法,其中之一为加成性共连量测(Additive conjoint measurement)的建构。
- 以下举例来解释此概念:
- 假设我们想量测主观的“舒适度”属性,并借由两独立变项(湿度与温度)的量测,可系统性的操弄二变项而得到一系列的舒适度排序资料,且背后有可对应的心理量尺。在某些公设条件下,湿度与温度两变项载舒适度层面的量测皆属于间距量尺,舒适度可借由两变项的量尺加成得到。
- 应用上,展望理论(Prospect theory)即是基于此共连量测概念为其公式所含之量尺科学化基础。
- 心理物理学家的反驳
- 史提芬斯(Staley S. Stevens)等人反对这种从物理学界跨过来的类比方式。
- 他们认为,心理学有自成一套的独特量测规范,其科学性无须遵循或是模仿物理科学的量尺法则。其量尺法则会在下方进行更进一步的叙述。
量尺类型
编辑心理物理学家史提芬斯(Stanley S. Stevens)将量尺分为四种主要类型,分别为名目(nominal)量尺、次序(ordinal)量尺(或顺序量尺)、间距(interval)量尺(或区间量尺)与比率(ratio)量尺。此四种量尺的关键差异在于所允许的变数转换(admissible transformation)不同。
量尺种类 说明 举例 名目量尺 将数字当类别或名称使用,以区分或标示变项的身份,此量尺值并无大小的意义 如三位候选人的号码 1、2、3 仅作为标签用途 次序量尺 除了标签作用外,还保有次序之分,但没有间距或比率关系 如你对三位候选人甲、乙、丙的喜好程度为甲>乙>丙,为表达次序我们可以用 f(甲)= 10、f(乙)= 5、f(丙)= 1 表示而得 10 > 5 > 1,在此例中数字只是用来表示次序大小,而未被用来考虑单位数字间的间距 间距量尺 除了保有次序量尺的特性,亦有数字间距相等的性质,因此间距量尺可以做间隔距离的比较。而间距量尺没有绝对的零值,故无比率的特性。 如温度、智力商数等。10 ℃、20 ℃、30 ℃ 他们之间都差 10 ℃,但并不会说 20 ℃ 是 10 ℃ 的两倍。 比率量尺 除了具有间距量尺的特性,并有绝对零值,故可以进行比率或倍数的比较 基本物理刺激的量测如长度、重量皆有此性质,心理学常用的反应时间亦属于此类
变项量化的意义性(meaningfulness)
编辑心理学十分仰赖量尺数值的大小比较及统计推论,以支持或拒绝其研究议题之假设。即便不论及心理变项量化议题而只是平均数计算之类的系统,其推论也要小心。常见迷思为例,某“甲研究所”有400位男性申请及200位女性申请,而“乙研究所”有150位男性申请及450位女性申请,录取人数为200位男性及300位女性。简单运算可知此二研究所之男女录取率皆相同(甲研究所:1/2,乙研究所:1/3);但加总两系所资料再做平均却得男性录取率为250/550,而女性录取率为250/650,有违性别平等之嫌。实际上,应使用加重平均来正确计算总体的录取率,以避免误解。量尺数值排序比较的陈述(statement),在经由此量尺的变数转换后,是否仍保有原陈述的真实性。例如,有时会听到气象预报员预测“明天的温度将比今天上升20%”,这句陈述严格而言是无科学意义的,因为温度的尺度并非比率尺度,除非使用绝对零度作为基准的开氏温度(Kelvin),否则此陈述之真实性可因温度尺度的选择不同而被违反。
研究程序
编辑任何一门研究都必须经过明确的研究程序进行,以科学方法设计实验,才能得到可信的结果。除了要确定两件事的关联性,更要确认两者的因果关系,让其中的关键变数被完整地呈现出来。心理学这门科学使用科学方法,并透过实征研究验证理念。实征研究注重证据,借由观察及搜集资料来验证理论。心理学的研究程序主要可以分成下面几个步骤:
- 收集资料、确认研究问题:思考研究目的和可行性,明确定义出所要研究的范围
- 文献回顾:阅读相关专书论文,找出与研究问题相关之其他研究文献
- 提出假设 :提出一个可被验证或推翻,且能够被进行测试的论述
- 设计研究方法进行控制测试:针对假设以选择适合的研究法,在不同的组别安排不同的自变项
- 收集、分析数据:将数据进行统计分析,利用数学方法排除噪声造成的误差,找出自变项与应变项之间的关联性
- 得到结论:透过数据分析结果验证实验是否支持假设
- 发表理论:接受他人提出的疑问并解释自己的论述
- 重复验证:累积重复成功的证据,使理论更加稳固
而接下来我们再逐项细讲:
收集资料、确认研究问题
编辑在开始研究之前,研究者须先收集足够的资料并回顾现有研究。若已经有其他人做过类似研究,可以参考研究方法、使用其假设或结果。接着思考研究目的和可行性,将大问题缩小,明确定义出所要研究的范围。
研究问题的功能
编辑- 有方向性与连贯性的组织计划
- 划定计划的界线与范围
- 让研究者聚焦问题
- 提供撰写计划的架构
- 指出所需要搜集的资料
研究问题的好坏
编辑好的问题(较合适问题) | 语意清楚、与文献或架构契合、提供未来其他研究方向 |
坏的问题(较不合适问题) | 语意不清、与文献或架构脱钩、一次问太多问题、问人尽皆知的问题、具诱导性的问题、双重否定的问题 |
无法被回答的问题 | 纯粹道德或哲学的问题、非当代科学可以处理的问题 |
引用格式
编辑在不同的领域,引用格式都各有不同,例如在教育学、心理学、科学领域是采用美国心理学会(American Psychological Association, APA)提出的APA格式;人文与社会科学领域则适用美国现代语言学会(Modern Language Association, MLA)提出的MLA格式;商业、历史学及美术的引用则是使用芝加哥格式(Chicago style)。下文将对心理学适用的 APA 标准做简略的介绍。
- 正文内引
- 同时引用一位作者的多篇文章时,依照年份先后排列,并用逗号做为区隔。
- 例如:吴俐君(2002, 2021)
- 引用多笔参考文献时,中文使用笔画排序;英文与使用字母顺序。中文在前英文在后,引用之间采用分号做为区隔。
- 例如:(丁一, 2014; 龙飞鹏, 2001)
- (Abelton, 2019; Zaffini, 2000)
- (丁一, 2014; Abelton, 2019)
- 当引用单篇文献作者有两位或以下,引用时所有作者均须列出。作者之间以逗号分隔。
- 当引用单篇文献有三到五位作者,第一次引用时所有作者仍然均须列出,但第二次以后便只须列出第一位作者。
- 例如:(丁一等人, 2002)
- (Abelton et al., 2000)
- 当引用单篇文献作者有六位以上,第一次引用以及后续都只需要列出第一位作者。
- 例如:(第一作者丁一等人, 2002)
- (Abelton et al., 2000)
- 当引用团体作者时,第一次引用须列出全名及缩写,第二次可以只写出缩写。
- 例如:(American Psychological Association[APA], 2019)
- (APA, 2019)
- 文末参考文献
- 格式:作者(年份)。书名。出版地:出版者。
- 例:丁一(2002)。如何帮鳄鱼做直肠镜检查。台北:兽兽出版社。
文献回顾
编辑研究者需要通过阅读相关书刊、搜寻专书和论文等资料,找出与研究主题相关的其他文献。文献回顾的主要目的是为自己的研究提供合理的理论支持,避免重复他人已经完成的研究工作或是他人已经发现的错误。这一过程有助于研究者找到适当的方法论,选择合适的资料,并确立自己研究的方法。因此,文献回顾对于研究者来说,是制定和确立研究方法的重要程序。
提出假设
编辑关于生活可能发生的事件,提出一个可被验证或推翻,且能够进行测试的论述,被称为“假设”。在实验之前须先提出假设的目的有两个,首先是为了简化大海捞针的几率,其次是为了有具体的衡量标准,以判断此次实验的效度与信度。为了精确量测试这些假设,必须针对实验中的各项因素清楚地定义其测量的方法,用是非、数据表达来结果,这就是操作型定义。假设必须是一个清楚的陈述,预测自变项如何影响应变项的结果。此外,假设不能是单纯陈述价值判断,或是不可能发生的事件的论述。
下列以“多喝水使老人心平气和”为例证,协助读者了解操作型定义的理念:
- 老人的操作型定义:我们无法测试全世界上的所有老人,因此,我们对“老人的操作型定义”,可能为“社区大学内某班高于 65 岁的人”。
- 多喝水的操作型定义:我们可以界定为“每日喝 30 度温水 2700 毫升”为“多喝水的定义”。
- 心平气和的操作型定义:我们可以以“五点量尺”李克特量表来评估老人心平气和的程度。
设计研究方法进行控制测试
编辑针对假设选择适合的研究法,在不同的组别安排不同的自变项。其中,接受假设情境的组别称为“实验组”,未受特殊情境的组别称为“控制组”,作为与实验组比较的参照物。心理学的研究法十分多元,例如:个案研究法、观察法、 调查法、实验法、相关法、测验法以及其他方法。必须注意的是遗漏变数可能会造成的影响,理想的做法可以利用随机分派,借由任意地分派样本到不同组别中,减少该因素造成的影响。而社会心理学家用来测量变因最常使用的分类方法有两种:自我报告与观察法。
收集、分析数据
编辑由于我们的实验结果是可量测的,因此可以将数据进行统计分析,利用数学方法排除噪声造成的误差,找出自变项与应变项之间的关联性。而假设检定为统计学上用来做显著性检验的方法。
统计学中的假设检定和型一与型二误差(Type 1 and Type 2 error)可以对心理学的研究提供帮助。
- 设立假设
- 将想验证的结论设为对立假设 ,欲推翻、否定的结论设为虚无假设 。
- 将他人的主张、宣称做为虚无假设 ,亦即假定他人的主张是真实的,而怀疑的可能结论设为对立假设 。
- 将错误的推翻会招致较严重后果的结论设为虚无假设 ,而相对后果较轻微的设为对立假设 。
- 应用到心理学的统计与实验时,通常将欲证的结论设为对立假设 ,欲否定的结论设为虚无假设 。对立假设 与虚无假设 为互斥的关系,因此当我们推论发生虚无假设 的机会很小时,我们就推论对立假设 很可能正确。相反的,若是检定结果为虚无假设 的可能性较大,并不代表虚无假设 是事实,而是代表没有足够证据推翻对立假设 。
- 型一与型二误差
- 型一误差(Type 1 Error)为在虚无假设 为真时,经检定拒绝虚无假设 。也会被写作显著水平(significance level of test)。
- 型一误差的几率为α,表示为
α=P(拒绝H0|H0为真)
- 型二误差(Type 2 Error)为在虚无假设 为假、对立假设 为真时,无法拒绝虚无假设 。
- 型二误差的几率以β表示,表示为
β=P(II)=P(不拒绝H0|H0为假)
整理后如下表:
H0为真 H1为真 不拒绝 H0 正确决策(1-α) 型二误差(β) 拒绝 H0 型一误差(α) 正确决策(1-β)
- 举例而言,若今天国防部会依据雷达观察数据判断是否有共机侵台、并发送警报,则可能因为型一与型二误差的存在而导致以下结果:
- :一切良好,只是发生偶然干扰
- :有敌机来袭
为真 为真 不拒绝 正确决策(没有敌机来袭) 型二误差(β),疏忽而未放警报 拒绝 型一误差(α),错放警报 正确决策(共机绕台)
因而从以上可以知道,在不同应用场景,可以选择型一误差与型二误差的其中一个作为衡量。举例来说: 在工厂判断是否有不良品时,比起多花一些成本检查产品,更不愿意将不良品出货。因而会想降低“将不良品判断为良品”的几率(型二误差),而非降低“将良品判断为不良品”的几率(型一误差),因而我们会以型二误差作为目标式。
- 显著水平(significance level)指的是样本统计量与母体参数假设值之间的误差达到一定程度的概率阈值。在统计检定中,当样本数据达到显著水平的要求时,我们可以判定母体参数的假设值(通常是虚无假设,Null Hypothesis)应该是错的。显著水平通常用希腊字母α表示,常见的值有0.05、0.01等。
- 虽然我们永远无法确定推论结果的绝对正确性,但我们知道,即使虚无假设是正确的,我们拒绝它的概率(即犯了型I错误的概率)也不会大于我们所设定的显著水平。因此,显著水平也被称为检定人员所能容忍的型I错误的最大概率。
- 例如,当我们设定显著水平α = 0.05时,这意味着我们可以接受有5%的机会犯型I错误,即在虚无假设实际为真时错误地拒绝它。这种设定在实际应用中很常见。例如,在医学研究中,当检验某种药物是否有效时,研究人员可能设定α = 0.05。这意味着,如果药物实际上无效,那么在5%的情况下,研究结果可能会错误地显示药物有效。
- 资料净化(data cleaning)
- 资料净化是从记录集、数据库表或数据库中检测和纠正(或删除)损坏或不准确的记录的过程,是指辨识数据的不完整、不正确、不准确或不相关部分,然后替换、修改、或删除脏数据或粗数据。资料净化可以与数据加工工具互动执行,也可以通过指令码进行批次处理。
- 清洗后,一个数据集应该与系统中其他类似的数据集保持一致。 检测到或删除的不一致可能最初是由用户输入错误、传输或储存中的损坏或不同储存中类似实体的不同数据字典定义引起的。 数据清理与数据确认(data validation)的不同之处在于,数据确认几乎总是意味着数据在输入时被系统拒绝,并在输入时执行,而不是执行于批次数据。
- 资料净化不仅能更正错误,同样加强来自各个单独资讯系统不同数据间的一致性。专门的资料净化软件能够自动检测数据档案,更正错误数据,并用全企业一致的格式整合数据。
- p值(p-value):是指当虚无假设 为真时,统计的样本及其他相同极端样本出现的几率。p值越小,代表越有信心拒绝虚无假设 。在p值小于0.05的状况,通常被认为有强烈的统计显著性可以拒绝虚无假设。
得到结论
编辑经过分析之后,便可以知道这个实验是否支持假设。若数据支持便可接受该假设,反之则驳斥该假设。
发表理论
编辑研究的结果时常会被发表到专业期刊和研讨会,并接受同业的检验,在科学社群中互相讨论,接受他人提出的疑问并解释自己的论述。若无法回复疑问与攻击,或被找出研究的缺漏之处,就会被淘汰出局,回到先前的步骤重复进行实验。理论是指一种经过组织化的信条,被用来解释我们所观察到的现象,通常受到三个准则来检核:简易性、广泛性及概括性。我们通常希望依靠更精确的“最少的理论”,来陈列出有限、特定的观点来解决人们为何会有某行为、并为此行为做精准的预测,且可以被实际的研究者所研究。
重复验证
编辑最后,实验会经由不断的重复加以验证,若其他研究者也能得到相同的结果,借着测试假设来得知结果,能带给这个结论更多支持,使理论更加稳固。累积重复成功的证据是科学社群自我修正的方法,而且这是最可能达致其目标,寻求真相的方法。
心理研究法种类
编辑整理
编辑- 个案研究法 (Case Study)
- 观察法 (Observational Method)
- 调查法 (Survey Method)
- 实验法 (Experimental Method)
- 相关法 (Correlational Method)
- 测验法 (Test Method)
- 心理测验法
- 焦点群体法 (Focus group Method)
- 德怀术 (Delphi Method)
- 经验总结法 (为教育心理学常使用之方法)
- 大数据研究法
个案研究法(Case Study)
编辑个案研究是以个人、团体或机构之状态或行为,或这些相关因素之间的关系为对象进行更深入的研究,借由多方面的资料搜集及分析讨论,期待能发现其内隐的特质或规律,最后再以逻辑性导向的思考过程,寻找解决问题的方法。
优势:
- 资料幅度大、层次深,使研究者得以提出有效且具体的解决办法。
- 由于其主要为研究少数个体,让研究者相对容易聚焦于某些目标,并深入探索,最后找出真相。
- 此研究法不需要操作和实验,适合运用于知识过程中的分类探索、形成假设阶段。
劣势:
- 归因于研究本身具有主观性且样本小,还缺乏个案变项的控制能力,从而限制了研究者将结果广泛推论到其他个案的可能性。(所谓主观性,乃因个案研究法是以经验为主的调查法,导致不同观察者所得出的结论可能会有所出入。)
- 选样不易,资料不一定具有代表性。如误以某偶发问题而做概括的结论,则难免以偏概全之弊。
个案研究会透过搜集的资料而成个案历史,若搜集的资料仅有一个人所记录的,例如传记,因为是用回忆法,可能会造成曲解或误失,甚至会面临文案隐恶扬善的风险,也容易被记录者的主观所影响。因此不该仅以传记这类型的纪录为资料来源。
心理学家在进行个体研究时,多重且深入的资料来源可以形成更全面、深入的理解,资料来源常用的有文件(documentations)、档案记录(archival records)、访谈(interviews)、直接观察(direct observation)、参与观察(participant observation)、人工制品(physical artifact)。
- 文件:如信件、备忘录、公报、会议记录、报纸、简报等等,有助于了解个案的社会、历史、环境脉络。
- 档案纪录:包括日常记录、组织记录、地方图表、地图等等,精确度相较于文件来的更高。
- 访谈:目的为协助研究者得以获得只有口头表达才能获得的经验与观点、补充文件、档案纪录缺乏的资料、有助于研究者与研究对象对话、扩展问题的层次等等。访谈类型分为开放式访谈、焦点访谈、结构访谈等等。
- 直接观察:直接观察为观察研究对象的现象或是情境,例如在会议、示威活动、工厂运作、班级活动等等中观察,又依据是否会将成果写出观察报告分为正式观察与非正式观察。
5.参与观察
参与观察为研究者参与欲观察的事件之中,学者Patton(1990)认为应不断协调参与程度才是能搜集更有意义的资料的方法,而学者陈向明(2002)则认为参与观察中,观察者和被观察者一起生活,对于被观察者有更具体的认识,可以更深入了解被观察者的行为意义。
6.人工制品
如工具、艺术品、技术发明等等,可以让研究者了解文化的内涵、技术、发明、艺术等等。
而资料搜集也应遵守几项原则: 1.多方搜集资料 搜集到的资料可能有些许的偏颇、错误,会有非常多影响研究的“变数”,所以需要依赖不同来源的证据,利用三角校正法,如果资料结果一致,就有机会发展理论刍型,并进行资料搜集与分析。 2.建立个案研究数据库 从许多个案的资料搜集整理,一方面当作资料校正的根据、一方面提供研究者更多参考资料 3.保持搜集到的证据与研究问题间的关连 研究者应保持原始资料方便后续归纳,并使资料与研究问题持续具有关联性,以免研究偏颇。
个案历史也可能是根据纵贯式的研究而来。纵贯式的研究,是对个体或团体长时间的追踪、定期评估并探讨研究对象在不同时期的演变。所以,个案历史也是研究者根据个人的计划,进行实际观察所构建而成的。
观察法(Observational Method)
编辑观察法是在自然情境或预先设置的情境中,对于被观察者的言行举止,进行有系统性的观察,从而了解其心理活动的产生与发展规律。其透过人类感官运用科学的方法,探究一些行为或事件,并对观察结果做系统化的分析,以及解释其意义。科学的观察具有目的性、计划性、系统性和可重复性。常见的观察方法有:
- 核对清单法
- 级别量表法
- 记叙性描述
根据研究目的,研究者直接进行观察并记录个体或族群的行为活动或表现,从中去分析与解释发现的相关问题。研究对象多半是难以表达自己心思意念的族群,例如:动物、婴幼儿、儿童或精神病患等。观察法也常使用在机构或组织运作中,以及对员工绩效的评估。要注意的是,观察法只能证明两个变因之间有无“相关性”,无法推导出任何因果关系,也因此若要厘清不同变因之间的因果关系,仍须透过实验法,且观察法通常只能观察到行为和自然的物理过程,无法从中了解被观察者的动机、态度、想法以及情感,并且观察法仅限于公开的行为,因此此行为的代表性至关重要。
观察法广泛适用于了解某人的心理过程、状态 、个性等,它是教育过程中,教师了解学生心理最主要的方法。例如:教师透过观察学生在各方面日常生活的表现,可以了解学生的感知、记忆、想像、思维等心理过程以及兴趣、性格、能力等心理特征。此外,观察法不仅限于观察行为,还包括了解其他一切有关的材料,例如:日记、回忆录等等。因此,观察法有直接观察和间接观察之分。根据研究的需要与时间,还可区分为长期观察与定期观察。最后,根据观察的内容,可分为全面观察与重点观察。全面观察会观察受试者的全部心理表现,重点观察会选择某些方面的心理活动进行观察。
运用观察法时,观察者和被观察者之间的关系有两种方式:
- 参与观察者:观察者是被观察者活动中的一个成员。
- 非参与观察者:观察者不参与被观察者的活动。原则上被观察者不能发现自己的活动被他人观察,否则容易使被观察者产生异于正常情况下的行为,即所谓“霍桑效应”,进而导致观察结果发生偏差或错误。
优点:
- 具有及时性的优点,并能够捕捉到正在发生的现象与意料之外的素材。
- 受客观环境影响,不便在实验室中进行者只能用观察法。
- 与调查法相较,事先准备好的表格及问题,并不能道出受调查者全部生活或欲知事项,观察法可补其不足。
- 在自然状态下的观察,能够获得更为生动、真实的资料。
缺点:
- 因观察者的个别差异与主观意识,容易产生观察偏差或错误。
- 真正要观察的事往往可遇而不可求,有时只好事后访问。
- 人类社会有许多现象不适宜或不可能直接观察。
- 若欲观察的事项太复杂,仅能得知其行为表现,并不能完全了解被观察者的思想意志。
- 不适合用在大面积、低人口密度的区域。
- 所需的时间成本较高。
- 仅能观察表面上的行为
- 受观察对象限制,像一些秘密团伙则不易观察
- 无法确实了解被观察者的动机、想法、情感
依照向度又可将观察法细分为:
- 自然观察法(Naturalistic observation)
- 研究者在自然环境中直接对研究对象进行观察、纪录,和分析解释以获得某种心理原则或行为准则。自然观察法是较传统的方法,其优点在于它可以通过观察直接获得第一手资料。缺点则是观察将受到观察者的主观判断及分析能力所影响,而且往往研究员想观察的现象是可遇不可求,其不确定因素较大。
- 但相对的,自然观察法较容易实施且成本也较低,故在开始做严谨的实验研究或相关研究以前,可先以自然观察法研究来挖掘有关的变项,提供预备的知识,以免后来做实验研究时知识短缺不足。
- 设计观察法
- 设计观察法是指调查机构事先设计模拟一种场景,调查员在一个已经设计好的并接近自然的环境中观察被调查对象的行为和举止。所设定的场景越接近自然,被观察者的行为就越接近真实。
- 掩饰观察法
- 众所周知,如果被观察人知道自己被观察,其行为可能会有所不同,观察的结果也就不同,调查所获得的数据也会出现偏差。掩饰观察法就是在不为被观察人、物、或者事件所知的情况下监视他们的行为过程。
- 机器观察法
- 在某些情况下,用机器观察取代人员观察是可能的甚至是所希望的。在一些特定的环境中,机器可能比人员更便宜、更精确和更容易完成工作。
- 结构性观察法
- 指研究者创造出一个情境,并观察参与者被此情境引导出的特别行为。例如,学者想研究关于火灾发生时人们应对的反应,他只需要一个紧急火灾广播便可以模拟出一个特殊的现场,在进行结构性观察之前需先提出假设,并列出欲观察项目的清单。
调查法(Survey Method)
编辑有些问题无法直接观察研究,因此研究者透过各种形式的调查方式借此询问、纪录、研究受访者的态度及反应。调查法以大众所关心的问题为范畴,透过严格抽样设计选择具代表性的样本,预先拟定问题收集目标对象的意见,是一种透过抽样原理与技术追求一般性事实的研究法,而调查结果非常依赖受访者回答的品质和态度。
- 主要种类可分为“普查”和“抽样”:
- 普查:针对调查母体中的每个元素进行资料的搜集,因此资料较为齐全,同时分析之结果也较接近事实真相;但耗费成本较高,因必须有缜密的事前计划,在实施过程中也需要动员大量人力,所以并非所有的研究者皆能实现普查;此外,若缺乏适当的管理、追踪、考核,则会因受访者良莠不齐而容易产生资料品质不均。
- 抽样:从调查母体中抽出一部分的元素进行资料的搜集。因此调查内容相对较为深入,同时不须耗费大量的人力、金钱及时间。在执行上容易管理且确实,但因样本仅为全体之局部,必须进行统计推论。在事前计划中,抽样方法与样本数在决定上易有困难,而造成后续估计的误差问题。
- 调查的实施方式:
- 问卷法(Questionnaire Method):多以问卷的形式进行,提出一系列问题。 优点是能够同时调查较为快速且有效率。缺点是很难控制填写者的回答状况以及对题目设计的理解与否,同时取样上也可能产生偏差,例如:在网络社群上发布问卷导致取样的族群有所偏差,如年龄或是背景相似。因此在问卷设计上需特别留意设计的严谨性,同时在取样上也要注意合理性。相较于访问法,问卷法较为省时省力,但是没办法获得较深入的资讯。同时亦需要考量问卷回收率,如何提升回收率以利于后续分析。
- 访问法(Interview Survey):通常采面对面、一对一的方式进行,实施成本较高。但缺点在于,访问结果样本数不够时,可能产生结果过于一致,将有参考性不足的问题。与问卷法相比较耗时、费力,在执行上难度较高,且不适合做量化的统计分析,但是可以取得较深入的资讯,并且较能了解受访者的想法,弥补问卷调查的不足。
我们可以利用调查法来获得政治倾向、消费偏好、 健康看护需求等易取得的资料。一次正确的调查必须事先拟妥问卷、训练晤谈者、慎重选择样本、保证研究样本的反应者能够代表研究的母群体,并用正确的方法来分析及报告资料,以便能正确地阐释结果。由于调查法是以样本行为的特征来推论母体行为特征,所以调查法也称做抽样调查。
调查法的优点是能以有限的案例得到大量受访者的资料。但其价值只有在受访者诚实报告的时候才存在,而使用问卷时用语清楚、表达明确与否都会影响受访者的回答,因此在制作问卷时,应使受试者均能清楚了解访问内容,避免使用过多艰难字句或双重否定等。此外,抽取的样本是否能够代表母群体也是相当重要的议题。
前一个段落提到问卷设计时,需要留意语句上需要清楚易懂,问卷格式的“设计与编排”也是影响受试者填答的重要因素。 除了问卷设计需要方便受试者阅读之外,常见的问卷设计方法有两种。
条件式问题(Contingency Questions)
- 使用时机:只适合部分受访者,不适用于其他人。受访者是否需要回答下一个问题,取决于上一个问题的回答。
- 编排方式
- 问题:内缩、独立方框
- 子母题:以箭头连结
- 用()说明填答的下一步
- 范例:你现在有吃槟榔吗?
- 是 (停止作答)
- 否 ↴(第二题)
- 戒除吃槟榔的习惯多久了?
- 一个月
- 三个月
- 半年
- 半年以上
- 戒除吃槟榔的习惯多久了?
- 优点:可以筛选适合的受试者,较经济的方式。
- 缺点:填答方式相对复杂。
矩阵式问项(Matrix Questions)
- 使用时机:相同答案的问项,例:题项皆使用李克特氏量尺。
- 编排方式
- 问题:通常至于列
- 答案:通常至于栏
- 勾逐题圈选对应的分数
- 范例:
- 你对现任总统的满意度相当满意? 同意 1 2 3 4 5 不同意
- 你对前任总统的满意度相当满意? 同意 1 2 3 4 5 不同意
- 优点:快速地完成一组问题,方便浏览先前回答作为后面回答的参考。
- 缺点:忽略题项最适合的填答方式,助长“同一反应倾向(response set)”。
实验法(Experimental Method)
编辑实验法的重点在于对实验情境的高度控制,以便我们对感兴趣的因素加以操弄,进而找出两变数间的关系。科学家会操控其中一个变项 X 使它变动,观察变项 X 的改变对于另一个变项 Y 所造成的影响。例如:睡眠时间与工作效率又有什么样的关系?若是以前述的例子来说,睡眠时间是变项 X ,那么工作效率即是变项 Y 。建立实验假说,也就是对于特定因素所产生之结果的预测,有助于厘清不同变项的因果关系。
名词介绍
编辑- 相关系数(correlation coefficient)
- 在统计上,时常使用皮尔森积动差相关系数来衡量两个变量之间的相关程度。相关的大小以相关系数(r)来表现。当 r 值大于零是正相关,等于零是无相关,小于零是负相关;|r|< 0.4 为低度线性相关,0.4≤|r|< 0.7 之间为显著线性相关,0.7≤|r|< 1 之间为高度线性相关。相关实务研究上,相关性设计比真正实验设计或准实验设计还要容易被执行。但是,经验不足的研究者容易被变项间的相关度所误导,进而误认为两者间有其因果关系。
- 决定系数(Coefficient of determination)
- 又称判定系数(以R2或r2表示),与相关系数(r)的涵义不太相同,在统计上用于衡量自变数X对应变数Y的解释程度,也可以说是模型的拟合程度。范围在介于0和1之间,决定系数愈接近1代表模型的可信度愈高、解释效果愈好。
- 自变项(Independent variable)、应变项(Dependent variables)
- 实验目的为找出一个变项 X 的变化如何会对另一个变项 Y 造成影响,那么 X 就是实验中的自变项,而 Y 为实验中的应变项。故自变项为实验者自行控制的变因,而应变项则是自变项改变后所产生相应变化的项目。
- 另外也需要考虑控制变量,也就是其他可能影响实验结果的变量。通常我们无法找到与控制全部的因素,所以实验上一定会有误差,因此要尽可能降低错误,才能有客观的实验结果。
- 实验组(treatment group)与控制组(control group)
- 在实验中,通常会将受试者分成两个或以上不同的组别,不同组别之间在自变项的部分有着不一样的处理,分别称其为实验组与控制组,两者之间以实验目的做出区别。有了控制组与实验组进行对照,就可能了解自变项究竟会对应变项造成什么样的影响。
- 在进行实验时,实验组与控制组两者,除了自变项之外的条件皆要维持一样,或至少要尽可能地相似。若以数学函数的方式来解释的话,可以这么理解,设有一多变数函数 ,若是我们想要找出 和 的关系,就必须要固定其他的变数 , ,...;那么“自变项”就是选取的不同 值,而“应变项”就是获得的不同函数值 。
- 外在变项(exogenous variable)与干扰变项(confounding variable)
- 如同先前提到,实验时必须确保实验组与控制组除了自变项以外,其余条件皆要相同,然而这在实际情况中几乎不可能达成。在Stanley Schachter的实验中,实验者不可能找到两组年龄、肤色、头发长度、学历、家庭、性格、智商、内涵等条件完全一样的人,尽管如此,有些变因事实上几乎不会影响实验结果。因此科学家会特别注意几个可能会影响结果的变项,让实验组和操作组在这方面尽可能的相同。先前提到的双胞胎实验便是如此,即使同卵双胞胎拥有 100%相同的基因,也不会拥有完全相同的成长历程,因此无可避免表观遗传学所造成的基因调控端误差,而实验者仍尽可能减少基因造成误差,并讨论这些误差可能对实验结果造成何种影响。
- 外在变项的一个常见的例子就是抽烟(自变项)会致癌(应变项),但是吃烧烤物(外在变项)也会致癌,所以在进行实验时会尽量将这些影响排除掉;否则两个变项同时存在时,将无法确认到底是哪个变项影响结果。干扰变项也可以举一个简单的例子,假如有人要调查穿短裤的人数比例(自变项)与冰激凌销量(应变项)之间的关系,实际上,冰激凌销量与气温也有关系,然而天气热时穿短裤的人亦会增加,因此气温便是这个实验中的干扰变项。
- 外在变项时常造成实验的失败,因此科学家和心理学家需仔细思考并尽量排除掉该变项的影响。使用随机分配为一种降低外在变项影响的方式,也就是每一个受试者会有相同的几率分到任意一组。如此一来,实验组和操控组的受试者的所有条件,在平均而言会接近一致,如此在进行实验时,结果的真实与正确性即大幅提升。
实验设计方法
编辑进行实验设计时,依据受试者接受一种或多种实验处理,可分为受试者间设计(或称独立组设计:independent-groups design)、以及受试者内设计;依据受试者的分组方式,还可分为随机组设计、配对组设计。实验设计需考量受试者的招募、实验成本、或最小化实验次数等等,选择适合的实验方法。
- 受试者间设计(Between-subjects design):将所有受试者分组,一组给予一种处理,每组的处理方式皆不同。
- 受试者配对设计(Matched subjects design) :每个测试使用单独的一个实验组,每个实验组内每位受试者与另一组中具等效的受试者进行配对。
- 受试者内设计(within-subjects design):不将受试者分组,对于同一批受试者施予多种实验处理。
- 混合设计(mixed design):当实验中有一个以上的变项时,针对不同变相采用受试者间设计或受试者内设计。
- 随机组设计(random-groups design):将受试者随机分派到不同的组,在统计学上期待受试者平均的分布。
- 配对组设计(matched-groups design):将受试对象按某些特征或条件配成对,然后分别把每对中的两个受试对象随机分配到不同处理组。
- 自然组配对(natural-groups design):进行配对的条件为自然的特征。
- 受试者间设计(Between-subjects design)
- 意指实验中所有受试者将进行分组,每一组仅实施一种实验操作,且每一组的实验操作皆不同。此方法的优点是较为简单且安全,因为受试者只会在其分派到的组别做某一个特定实验,可以有效减少实验操作而产生的变项。然而,此方法对于不同组之间的差异十分敏感,因此除了招募受试者可能较为困难且关键,也需透过谨慎的方法进行分组,以减少组间差异。
- 在某些情况下,只能采用受试者间设计,不可使同一批受试者接受所有实验处理,像是要量测不同环境下受试者完成一份试题所需要的时间时,受试者便可能因为熟能生巧而使后来的测验时间缩短,导致实验错误。另外,进行多变项实验时,使用受试者间设计也较为适合、简便。
- 受试者配对设计(Matched subjects design)
- 意指每位受试者或每个自变项仅接受一个层次测试,且在另一组有等效配对对象,统计方法为相依样本 T 检定。使用此设计的优点是可将受试者变项,如性别、年龄、阶级、教育程度、智力、性格倾向等影响减至最低,缺点是配对不易。以一项比较两种新的阅读教学方法的研究为例,研究人员想要比较两种方法,近代和现在的教学方法,并选择两组儿童,根据他们上次阅读理解测试的结果将两组儿童配对。若研究人员想测试另一种方法,则必须再找到三个可比较的孩子来比较三组。受试者配对设计也可以同时配对多个变量,例如在规律运动是否能改善疗养院居民心血管健康之研究中,研究者可以配对受试者的年龄和性别。
- 受试者内设计(Within-subjects design)
- 意指受试者将不会被分组,而是利用同一组受试者接受所有的实验操作。此方法最显著的好处,是可以排除绝大多数的个体变异,使得受试者招募条件简单。然而,此方法较为复杂且不安全,因为同个受试者经过前面的实验操作后,可能影响后来实验的表现,虽然可透过延长两个实验间的时间,使实验的顺序或彼此的影响的程度降低,或改变不同受试者之间实验的进行顺序,进行对称式的实验,在实验设计与数据分析时仍需特别谨慎。
- 以探讨老师的表现与学生暴力倾向的实验为例,由于实验与个体本身的个性息息相关,找到两组条件相当的受试者将十分困难,若采用受试者内设计,即可有效解决。然而,若时序较早的实验中,老师展现了暴力倾向,影响受试者的个性,即使在后来的实验中,老师被要求不能展现暴力倾向,前面实验所造成的影响却可能还存在着,使实验结果出现偏差。
- 多个自变项
- 有时候科学家也会选择使用多个自变项来进行实验,而其中一个好处就是看到这两个变项会不会交互影响。举例来说,若要探讨温度(自变项一)与打字速度(应变项一)的关系,不妨再加入一个屏幕亮度(自变项二),那么实验者可能会发现只有当屏幕很亮时,温度才会对打字速度造成影响,如此我们可以发现两个自变项的交互关系。(自变项:温度、屏幕亮度;应变项:打字速度)
- 多个应变项
- 在一个实验中,结果可能不只含有一个变项,科学家也常透过同时观察多个不同应变项,来获得更全面的资料。以上述探讨温度(自变项一)与打字速度的关系的实验来说,实验者可能除了打字速度(应变项一)外,同时也会记录受试者拼音的正确性(应变项二),以得出温度对于打字“表现”的影响。‘自变项:温度;应变项:打字速度、拼音正确性’
测量与统计
编辑实验法不外乎也是遵循着先前所提到的研究程序,当要研究一个心理学议题时,会先观察现象、搜集资料、形成假说并设计一个可行的实验,而在进行实验时一个最重要的部分便是“测量”。
测量是一套将变项数值化的方法。在心理学研究中,有时实验者可以使用物理方法直接进行量测,例如药剂的投放量、受试者的血压、心跳等数值;然而有些变项难以使用仪器量测的,例如受试者对一个外在刺激感到疼痛的程度,由于感受是一种抽象的东西,实验者往往需要透过一些系统化的手法将此变项量化,而一种常见的方法是 5 点量表,或称李克特量表(Likert Scale[1]),主要用来测量受试者对于一项描述的主观或客观判断,通常是对该描述同意或不同意的程度,典型的李克特量表将受试者的判断结果分为五种:非常不同意(very unsatisfied)、不同意(unsatisfied)、无意见(neutral)(即不同意也不反对)、同意(satisfied)、非常同意(very satisfied)。借由上述所提及的方法即可达到将变项量化的目的。
Very unsatisfied | Unsatisfied | Neutral | Satisfied | Very Satisfied |
---|---|---|---|---|
○ | ○ | ○ | ○ | ○ |
通常实验者在搜集到资料以后便进行数据分析,会使用统计(statistics)的方法来归纳并解释。当科学家说研究结果具有统计学意义时,这意味着观测方法、相关研究和实验产生的数据为得出有关它们的结论提供基础。这些数据可能代表种种统计资料,例如智力测验的分数、血液样本中的荷尔蒙的量、检测视觉信号所需时间的微小差异或心理学家可能正在研究的任何其他内容等。与其他科学家一样,心理学家使用描述性和推论性统计数据,来归纳数据并且解释其中的含义。
- 描述性统计(Descriptive Statistics)
- 一个常用的描述性统计值是平均数(mean),即将一组的数值全部加总再除以个数。将实验组与控制组的平均值进行比较,即可发现自变项与应变项的关系。例如,一组学生在测试中的表现可以通过该组的平均得分衡量。通过将所有得分相加并将总数除以得分数来确定平均值,并且描述男女的表现差异也可以透过计算两者平均分的差异来表达。
- 然而有一个需要特别注意的地方:量测时必定存在着误差,而且有时会有极端值的产生,因此若是两者平均值的差异极小,会让实验者难以判断结果的正确性。因此唯有当控制组的平均值之间的差异达到一定程度,才会称之具有“统计显著性(Statistical significance)”,表示结果受极端值之几率极低,如此一来研究者才可相信两者的差异来自于自变项之影响。此外,心理学家想要描述两个变量之间的关系时,他们使用描述性统计量,并将它称之为相关系数。
- 一般而言,常用做为描述统计量数的包括:
- 次数分配(frequency distribution):包括次数分配表、茎叶图(stem and leaf display)、及各种图示法(graphic representation)。
- 集中量数(measure of central tendency):包括平均数(Mean)、中位数(Median)、众数(Mode)等。
- 变异量数(measure of variability):包括全距、平均差、四分差、标准差及变异数。
- 相对地位量数(measure of relative position):包括百分等级、百分位数、及各种标准分数。
- 推论性统计(Statistical inference)
- 帮助心理学家做出推论的数学操作,亦即从他们的数据中得出结论并使假设成为可能。例如,假设一组创伤后压力综合症(PTSD)受害者在接受眼动脱敏再处理(EMDR)治疗后,其焦虑测试的平均得分低于 10 分,并且未治疗的对照组中受害者的平均得分下降了一点。
- 然而,推论统计数据使得研究人员估计两组平均得分之间的差异是由于偶然的因素引起的,而非由于他们接受了不同治疗所导致的影响。其他推论统计也可以帮助心理学家决定:两个变量之间的相关性显著到足以表明两变量间确实存在某种关系,而非仅只是一种侥幸。
- 当推论统计的数据表明相关系数大于预期时,科学家们就会认为结果具有统计学意义。虽然仅凭统计显著性并不能确保最终假设一定成立,但其所带来的发现是值得关注的。
实验法的优缺点
编辑- 优点:可以找出一个事件的“因”与“果”,比起其他的研究法,受试者是在一个经过设计、小心监控的环境下进行实验的,得出的结果是可以较为准确的,因此心理学家通常会比较偏好使用实验法来进行研究。
- 缺点:实验法有其限制,会有道德问题或实验误差等状况。举例来说,若要研究家庭环境对小孩智力发展的影响,实验者不能直接将一群婴儿在人为刻意营造的环境下养育成人,其代表着贫穷家庭的受试婴儿挨饿,而富裕家庭的受试婴儿则过分溺爱、任其予取予求,这是非常不道德的。另外,有些情况下,实验的观测反而会干扰到受试者,成为一个外在变项,进而影响结果。比如说,如果要观察一般人是否会在四下无人时选择闯红灯,在进行实验时,受试者若知道自己正在被观察著,部分的人可能会因此选择遵守交通规则。在这个例子中,实验并不能正确的模拟“无人监测”的情境,且导致实验结果的误差。再者,实验法可能会受期待效应影响,受试者可能会根据已知的期待做出回应造成实验误差。上述情况中,实验法显然是不适用的,因此心理学家便只能依靠其他研究法继续进行研究;举例来说,研究者可用双盲(double-blind)实验排除期待效应,让实验者和受试者都不知道现在正进行的实验内容。
相关法(Correlational Method)
编辑对于一些实验而言,实验者难以对其做到精准控制,例如对于人脑功能感兴趣的实验者,并不能直接对脑的任何部位来进行实验。但是借由观察脑部受损所影响到的行为,便可得知脑部对应部位的功能。这种没有实验控制的配对组合方法,称为相关法。基于过去的观察、个案研究、或是进行问卷调查得到的资料,当有大量的资料可运用时,若是明确想了解两个变项之间的关联程度,通常会借由相关法来进行研究。相关法虽能得知一个变项是否伴随着另一变项改变,但无法保证其间具有某一因素的改变可“引发”另一因素改变的因果关系。
此方法通常是发现关系的最佳方法。假若我们有进入大学的高中生的成绩记录,则发现高中成绩与大一新生成绩之间关系的最佳方法,就是求两者间的相关;也就是看是否高中成绩较好的学生,在大学的成绩亦较佳。
至于某相关是否具有显著性差异,则必须要有更多的补充资料。前述问题和“两个平均数间的差异是否显著?”的问题一样。举例来说,若研究的案例很少,而且呈现高度的相关,此相关的统计显著性或许不佳,因为若研究的案例刚好是母体中的少数,则在所有的母群体当中,研究得出的高度相关可能是不存在的。因此统计学家已发展出许多公式,来说明相关的显著性。值得注意的是实验法和相关法间的不同:在实验法中,一个变项(自变项)受到系统性地操弄,以决定它对某些变项(应变项)的影响效果。同样的因果关系,不见得可以从相关法的研究里推测出来。
相关系数的定义
编辑两个变项之间的关联程度可以用相关系数 (correlation coefficient ) 来估计,符号通常用 r 表示,其值介于 -1.00 与 1.00 之间,数值(绝对值)代表着相关程度,符号代表着相关方向,常用于计算相关系数的公式为 。
一般而言,科学家会依据相关系数的大小将两个变项之相关程度做分级。相关系数的表示,可由实际测验结果的图表表达得更为清楚。以下为相关系数几个主要的定义:
相关系数 | 意义 | 说明 |
r = +1 | 表示在二个变项之间,有着完全的正相关。 | 假若体重和身高完全正相关,那么若已知一个人的身高,便可正确地说出其体重。当相关为正,通常 把“+”省略。 |
r = -1 | 表示完全负相关。 | 例如,车龄越久, 其价格越低,同样若车龄已知,则价格亦可得知。而车龄和其价格间的关系,可用相关系数 r=-1 来表示。 |
r = 0 | 表示毫无关系(零相关)。 | 意指知道一个变项的值,对另一个变项的预测毫无帮助。 |
-1< r <1 | 表示不完全相关。 | 相关程度由相关系数绝对值接近 1 的程度来决定。同样大小的正相关或负相关,代表相同的关系程度。 |
相关系数并非百分比,因此 r = 0.25 不能解释为 r = 0.50 的一半。至于相关系数间的关系,是以平方来表示。例如, r = 0.70 (0.70^2 = 0.49)表示其关系近乎 r = 0.50 (0.50^2 = 0.25)的两倍 ( )。并且,对于不同实验而言,r的值也并非完全可以做比较,当数据库大小较大时,其r值也会越精准,而每个实验也有不同对应的r值。
相关法的优缺点
编辑相关法的优点是在某些不能使用实验法的情况下可以协助进行研究。例如“有被虐待经验的孩童,其脑部发展是否会比一般孩童迟缓”等,这种如果用实验法会违反施测伦理的研究,便可用相关法代替。然而其缺点在于不论两个变项之间是呈正相关或是负相关,研究者皆无法确认何者为因、何者为果。因此,若缺乏实验证据,就不能以相关证据推论其因果关系,这是非常重要的一点。
举例来说,街上柏油的柔软度和中暑病例的数目有相关, 但这并不是说柔软的柏油会散发某些毒素使人中暑,炎热的太阳使得柏油软化,同时也可能是造成中暑病例的原因,这两个原因可能相关也可能无关。当两个变项互有相关时,一个变项的改变可能是另一个变项的原因。但缺乏证据时,便不能下这种结论。
测验法
编辑以现阶段的心理学而言,测验是一种重要的研究方式。其可用来测量各种能力、兴趣、态度及成就。测验法给予心理学家一个不干预大众生活的途径以获取资料,且不必花费大量时间和心力装设实验设备。测验法为提供一致的情境给一群人,研究这群人在各种情境下(如智力、手的灵巧度、焦虑及知觉技巧等)的反馈差异,分析测验分数与受测者特性之间的关系。
然而,测验的建构及运用并不简单,包括准备题目、量尺化及建立常模等许多步骤。
信度(reliability)
编辑指的是测量方法的品质,即对同一现象进行重复观察之后是否可以得到相同资料值。科学研究者试图使用一系列的指标来测量个人或社会现象。可信度概念是研究者们提出用来测量的量度工具稳定的程度。比如说如果用磅秤来测量一个人的体重,如果第一次称重是 100 公斤,而第二次称重是 150 公斤,那么很明显用这台磅秤来反应体重不是很可信的办法。这个类比也适用于其他的社会科学测量方式,比方各种问卷调查、心理量表、以及更广义上的观察。
- 基本原理
- 从受试者内在的变异加以分析,用测量标准误说明可靠性的大小。
- 从受试者相互间的变异加以分析,用相关系数表示信度的高低。
- 类型
- 内部一致性:
- 评分者间信度(不同评分者评分之相关性)
- 折半法(将研究项目分成平分两部分之间的相关性)
- Cronbach's α 系数(平均所有可能的折半组合之系数)
- 长期稳定性:再测信度(借由再次的施测或观察,计算分数间的相关性)
- 等值性:复本信度(计算相似但不相同的两份测验施测后得到分数间的相关性)
- 衡量信度的方法:
- ・评分者间信度(Inter-rater reliability):由于个人因素的影响(如情绪、既有观念等),有些测验不能以客观的方法进行鉴定,例如作文考试。所评的分数通常受评分者的主观感受而受到影响,因此要由 2 人或以上各自根据标准评分,再求大家分数是否大致相同。
- ・折半信度(Split-Half Reliability):折半信度是将受测题目分成前后两半,再求取前半段与后半段之题目的相关程度,若相关程度很高就代表折半信度很高,是考验衡量的同质性。由于此相关只是半个测验分数求得的,并非整个测验的信度,其信度还必须使用“斯布公式”(Spearman–Brown prediction formula)等加以校正,才能求得正确的信度。
斯布公式(Spearman-Brown formula)的一般形式為: ,其中 是可測試的信度,n是新測驗的長度相對於原測驗的倍數,rxx'是原測驗的可信度。
- ・内部一致性信度(Internal consistency reliability):同一个测验中不同子项目是否一致,例如量度“外向”,可以用“朋友数目”、“友善程度”、“经常笑”等来测。一般可用克隆巴赫系数(英语:Cronbach's alpha)来检验。
克隆巴赫係數,又稱 alpha 信度(alpha reliability):對於同一個概念經常存在多道不同的題目,或甚至有多份不同的量表;不同題目或不同量表所測出結果的一致性,以相關係數之期望值表示,就是它們的「alpha 信度」。一般認為「alpha 信度」的值具有下列意義:
Cronbach's alpha Internal consistency α >= 0.9 Excellent 0.8 <= α < 0.9 Good 0.7 <= α < 0.8 Acceptable 0.6 <= α < 0.7 Questionable 0.5 <= α < 0.6 Poor α < 0.5 Unacceptable
- ・再测信度(Retest Reliability):再测信度是让同一组受测者,于前后两个不同时刻做两次测验,再求两者结果的相关系数,此系数就称为再测信度 。此系数可以表示测验结果的稳定性,故又称为稳定系数(coefficient of stability)。最适当的时间间隔依测验的目的和性质而异,通常少则两周,长则六个月。
- ・复本信度(Equivalent-form Reliability):复本信度是设计者有时候会在同测验中有两种以上的复本,受试者先用其中一卷进行测试,同组人或另外一个人再用另一卷进行测试,而这两种测验结果的相关系数即为复本信度,目的是为了让不同程度的受测者能够明确知道问卷题目之用意。
效度(validity)
编辑即有效性,评量一测验或工具是否能满足其测验意图。最主要的概念为建构效度(Constructive Validity),指测量工具能测量理论的程度,其中有六种效度类型:表面效度、内容效度、同时效度、预测效度、聚合效度和区别效度,进一步可以大致分为两类:翻译效度(Translation Validity)和效标关联效度(Criterion-related validity)。
- 翻译效度(Translation Validity)
- 翻译效度意指将建构概念准确地“翻译”为可操作化的程度,其重点在于可操作化是否良好反映了建构概念的真实含义。以下分为两类:
- 表面效度(Face Validity):指测量工具经由受试者或研究者主观觉得与研究主题相关。泛指受试者一看到测量工具,就知道研究者在测量什么的问卷。高表面效度的问卷更能获得受试者的合作并提高作答意愿,不过在某些测验会忌讳高表面效度,例如有关人格的测验,高表面效度受试者越可能虚伪作答。因此对于这些有可能存在表面效度的调查时,应该避免而另寻解法。
- 范例:设计一份“案主对机构服务的满意度”问卷时,案主或你的同事一看到问卷内容就知道是在做满意度调查,具高表面效度。
- 内容效度(Content Validity):指某测验之题目内容是否周延、具代表性、具适切性并确实包含所欲测量主题的内涵。为了让问卷具有内容效度,研究者会去询问专家的意见或参考相关文献。
- 范例:设计忧郁症量表时,我们可以根据 DSM-IV,将忧郁症所包含行为及心情等表征纳入问卷设计中;设计“同性恋者对社会适应的程度”的问卷量表,由于现有文献不是非常充足,所以可以咨询专家的意见,使量表更周延、适切。
- 建构效度(Construct Validity)
- 指某种测验能去测量某个理论的程度。如果测量工具与想要的概念相关联性很高,我们称为聚合效度(Convergent Validity);反之,若测量工具与目标概念不具相关性则称为分歧效度(Discriminant Validity)。实务工作者通常不太使用这个方法,只有需要测量理论的学者较常使用。
- 范例:设计一份关于“自尊”的问卷以了解自尊的概念,由于我们知道自尊跟“自信”的概念很相似(正相关;即自尊越高,自信越高),跟“自卑”的概念刚好相反(负相关;即自尊越多,自卑越少),透过文献找出测量的量表,让同一群受试者填写。若你设计的自尊量表与自信量表测出的结果有高度正相关,与自卑量表呈现负相关,即表示量表具有建构效度中的聚合效度。
- 效标关联效度(Criterion-related Validity):指该测验分数与效标(具高效度的衡量工具)之间相关系数的高低。效标关联效度是在测量具体的行为与实证资料上,其中分为下列四种。(效标:指测量工具所欲测量之特质的独立量数,即检定测量工具效度的标准。)
- 同时效度(concurrent validity):衡量测验工具之可操作化程度与现有实验结果之关联性,借由同时进行两种测量,比较两份分数间的相关性。例如:给受试者听一段含有次声波的音乐,同时观察其脑部情绪反应,以及询问心理恐惧程度。
- 预测效度(predictive validity):衡量测验工具之可操作化程度与理论上可预测的实验结果之关联性,换句话说为某测验与一段时间后另一变项的相关性。
- 范例:将设计的问卷 A 跟他人设计的问卷 B,同时或在不同时间给受试者填写,把两次的结果 A1 & B1 进行相关系数的比较。又称实征效度(Empirical validity)或统计效度(Statistical validity)。效标即可显示测验所欲测量或预测的特质之独立量数,作为检定效度的参照标准。
- 聚合效度(convergent validity):是指衡量工具与实验目标有较高的关联。来自相同构面(潜变数)的项目,彼此之间的相关性要高,不会有效度不足的现象。
- 以相同方法衡量相同特质所得到的分数之间,相关性要高。以不同方法衡量相同特质所得的分数之间,应具有次大的相关性。
- 区别效度(discriminate validity):指衡量工具应该与实验目标无关。来自不同构面(潜变数)的项目,彼此之间的相关性要低,不会有效度污染的现象。
- 以相同方法衡量不同特质所得到的分数之间,相关性要低。以不同方法衡量不同特质所得的分数之间,相关性要最低或是无意义。
信度与效度的分别
编辑- 可信度高并不意味着测量方式更准确,测量方式的准确度是效度(validity)的问题。可信度所讨论的是针对相同或类似的现象,是否能透过同一种测量方式得出相同的结论;而效度讨论的则是能否测量想要量度的问题,例如运用天秤来测量高度就是一种效度差的测量方式。可信度高并不完全代表着有效度高(如一个秤磅每次显示的公斤数都比实际上的数值多一公斤,显示其可信度很高,但由于其并非显示真实的数值,因此其效度并不高),尽管如此,可信度在某方面依然可以保证一种测量方式的有效度。然而,若一个测试的可信度较低,则其就一定没有高的效度。
其他-心理测验法、焦点群集法、德怀术、经验总结法等
编辑德怀术(Delphi Technique):于 1960 年由美国兰德公司发明,是一种寻求共识的研究方式。Delphi”是源自于古希腊阿波罗(Apollo)神殿中著名的“德怀神谕”(Delphi Oracle),是一种典型的庙堂上用来预测未来的工具,故因此取名。其大略的进行方式为请多位专家同时以匿名、书面方式,针对一个特定的主题表达意见,经过多次的讨论与整合,是一种使专家们得以汇整各方面不同的意见及专业知识,逐步地达成共识,进而解决复杂议题的一种研究方法。
德怀术的基本意义与基本原理:
德怀术是一种群体决定的方法,它使用问卷调查方式,但却与传统的问卷调查有所不同,传统的问卷调查只要实施一次问卷,就算完成调查工作;然而德怀术则需进行一连串密集的问卷,直到调查项目达到一致性之后,才能完成其调查研究。德怀术提供多次的回馈意见,具有会议的沟通作用,但却不像会议一样必须全体共聚一堂,而担心受到权威者的影响。换言之,德怀术撷取问卷调查和会议二者之优点的一种探究方法(Linstone,1978;Roweetal.,1991),其原理是建立在“结构化的资讯流通”、“匿名化的群体决定”、及“专家判断”的三大基础上。
德怀术的实施原则如下:
- 匿名原则:所有参与调查的人员在不受干扰的情形下,自由发表个人的意见。
- 重复原则:不是一次调查就结束,而是由主持人针对相同的对象反复实施调查。
- 回馈原则:每次调查都将其他人的意见提供给所有受调查者参考,以作为进一步填答的依据。
- 共识原则:主要目的在于获得专家群的共识,以作为决定的依据,所以德怀术最后一定要到获得一致的意见为止。
实施步骤
德怀术的优点在于它能够有效地排除研究不够严谨的缺点,对于具不明确性、复杂度高、具争论性的议题可应用德怀术寻求出专家的共识。此方法与传统的对谈式讨论不同,这些参与讨论的专家都是以匿名的方式进行,因此所有人不会受到任何外界的干扰或影响,得以自由地发表意见并参与讨论,同时也不受限于时间与空间的因素,任何时刻都可以进行讨论。在现今,此种方法在军事、商业、工业、政治、经济、医药和教育等方面都有着广泛的应用。德怀术的施行步骤如下:
- 确定所要探讨的主题,并以问卷的方式列出问题。
- 寻求适合的专家组成德怀术小组,参与讨论主题。
- 发送问卷,进行四回合的调查。
- 第一回合调查:详细说明讨论的问题与研究目的,请接受问卷的专家针对问题提出其看法或解决途径,回收问卷并进行第二回合。
- 第二回合调查:整合第一回合的调查结果,再重新发送问卷给受调查者,提出赞成、反对程度或遗漏的部分。
- 第三回合调查:将第二回合的问卷调查结果以等第的方式进行排序。此回合的主要目的是希望受调查者将自己的看法与大众的看法相互比较,再依照此一对比的结果,决定要坚持原先的看法,或者是被大众说服,改变自己的立场。
- 第四回合调查:内容主要为前三次问卷中受调查者所做出的各种选择,其目的在于让专家们在参考过此次问卷的资料之后,做最后的决定。最后一回合的调查结果是为研究最终采用的依据,也是专家们共同讨论、协调之后所达成的共识。
- 若四回合后受调查者仍无法达成共识,则可以再持续进行几个回合,直到获得共识为止,最终所获得的结论采用众数或中位数作为实验结果的依据。
心理测验法:根据已被标准化的实验工具(如量表),刺激和引起被测试者的反应,所引发的反应结果由被测试者自己或其他人记录,再通过一定的方法进行处理,给以量化,描绘行为的轨迹,并对其结果进行分析。这种方法的最大特点是对被测试者的心理现象或心理品质进行定量分析,具有很强的科学性。
经验总结法—为教育心理学常使用之方法
编辑- 经验总结法:归纳以及分析各种活动中的具体情形,使其系统化。整理前人的经验,并且将好的部分长期运用,是目前相当行之有效的方法。
经验:在活动中取得的知识或技能,这种经验通常不是刻意安排的,常常是个人或是团体因为某一种际遇或是碰巧达到某种特殊条件而取得,因此科学性不高,但是如果经过理论研究者和实验者不断地把触发这种经验的人做整理、验证、提炼以及加工,经验就可能变成具有科学性的事实,而这种经验一般会是在实施之后发现有良好效果后再统整,要能树立正确的指导思想。此种经验必须具备观点鲜明、正确、先进、科学以及可以成为代表性的特性等。
- 经验总结法的实践步骤:
- 使用经验总结要注意:对象具代表性、依据客观事实并和定性定量结合、观察全面、能区分现象和本质、具创新精神
- 经验总结法在教育方面是历史悠久的研究方法,后来教育心理学也有使用这个方法来研究,因为人类的教育思想有很大的一部分都是来自先人的智慧,不管在国内或是国外皆然,在教育科研发展迅速的现代,经验总结法的科学化和规范化也不断提高,此方法已经变成教育科研以及教育心理学专家发展研究的重要方法。
- 经验总结法的重要作用
- 可以协助转变教育观念,透过不断地进步提升教育的地位与影响力
- 揭示教育规律,可以极大的丰富教育理论,赋予科学意义
- 协助教育相关部门和领导者更加了解教育体系的优劣,正确地执行教育方针并制定政策
- 加强教师素质并提高教育品质
- 提高教育工作者的教育水平和教育科学研究水平
大数据研究法
编辑透过以上几种研究方法,从质化研究(观察法、访谈法等)的文字讯息得知如何运用量化研究(实验法、测验法等)将数据数字化。当研究对象从 N=1 的个案研究到 N>>1 时就变为大数据研究。但当研究的个体数量增加,就可能会出现个体差异导致的选择性偏差(Selection bias)或是相关非因果的偏误等问题,皆会影响信度与效度,因此要能发挥大数据研究的优势,对高技术性实验方法的要求也更高。
搜寻论文、期刊的方法
编辑Google 学术搜寻
编辑Google 有一个特别的功能叫做 Google学术搜寻(Google scholar),里面囊括了世界上绝大部分出版的学术期刊,只要输入关键字就可以找到相关的论文或书籍。另外,加上一些更细节的关键字,可以使得搜寻范围变小,使搜寻更有效率、更快找到需要的论文。
APA PsycNET数据库
编辑在心理学研究领域有一个比较专门的网站APA PsycNET,APA 是美国心理学会(American Psychological Association)的英文缩写,当中涵盖心理学、社会学、神经科学等领域,具有相当可观的资料量。
各大专院校数据库
编辑各大专院校所发行之学报期刊、中华心理学刊等重要研究成果文献皆为国内学术专业期刊可供人参考。若想寻找学术论文,则可前往数据库进行搜寻,如华艺线上图书馆、或是进入大专院校的图书馆系统之数据库查询,其中便包含全球许多地区的学术论文及期刊平台,此外台湾博硕士论文知识加值系统中可查询各大学校的硕博士论文以此进行参考,以上方法为搜寻台湾的研究文献。
中国知识基础设施工程
编辑是中华人民共和国的一项知识工程,由清华大学直接领导。若想搜集对岸的论文期刊则可前往中国知网,平台提供海内外读者一些重要的中国学术文献及期刊。
PQDT数据库
编辑如果想找寻美加地区的博硕士论文,可透过PQDT(ProQuest Dissertations & Theses)数据库查询论文索引摘要,里面包含了商学财经类、综合学科、人文艺术类、应用科技类等多种类型的数据库,并可由数字化论文典藏联盟数据库查得数位博硕士论文。
DART-Europe E-theses Portal
编辑搜寻欧洲地区之论文可前往DART-Europe E-theses Portal欧洲公开取用博硕士论文网进行搜寻。
研究的时间面向
编辑横断面的研究
编辑横断面(cross-sectional,CS)的研究是指一个研究在同一个时间点对受试者所做的观察,这些群体都具有某些相同的控制变因,例如社会经济地位、性别、智力、教育背景和种族等。此类的资料中,每个观察单元只存在空间上的差异。
优点
编辑- 可以在短时间,像是一年内收集到不同年龄层的样本资料,不只省时、省力还省钱。
- 这些受试者只需参加这一次的实验,不需要再做实验后的追踪,所以不会有流失受试者的困扰。
- 可以运用最新的理论。
- 可以研究目前有兴趣的研究。
- 不用担心对同一样本反复施测所产生的练习效果。
应用
编辑- 在某一特定时间对某一定范围内的人群,以个人为单位收集和描述人群的特征以及疾病或健康状况。它是描述流行病学中套用最为广泛的方法。
问题与缺点
编辑- 无法观察个别差异的跨时稳定性:横断面的研究是在同一时间对不同样本所做的测量,不同年龄层的资料不是来自同一个样本,因此我们无法解决个别差异是否有跨时稳定性的问题。
- 可能的解决方案:在搜集横断面的资料时应尽可能地包含贯时性性质的资料。
贯时性的研究
编辑贯时性的研究是指一个研究对其所欲观察的对象,进行横跨一段时间的观察,同时也能搜集长期的变迁。其下又分为:
- 时间序列研究(time-series,TS):研究者每隔一段时间收集一次横断面样本资料,借此了解这些资料在不同时间上所呈现的差异;研究对象不需是相同人群或样本。
- 世代研究:(Cohort study)是一种观察性研究设计,用于研究特定群体(世代)随时间变化的特定结果或疾病的发展。研究者通常选择一个或多个群体,在这些群体中的成员在研究开始时未出现研究关注的结果或疾病。研究者随后追踪这些群体一段时间,观察并记录相关的健康结果或其他相关变量。而世代研究又分为两种类型:
(1)前瞻性世代研究:在这种类型的研究中,研究者在研究开始时选定参与者,并在此后的时间点追踪他们,收集数据。这种研究可以提供有关因果关系的证据,因为研究者能够在时间序列上追踪暴露和结果之间的关联。
(2)回顾性世代研究:在这种类型的研究中,研究者使用过去的数据来确定谁暴露于特定的风险因素,并追溯这些人的健康记录以确定结果。这种研究通常依赖于既有的数据,因此可能受到数据质量和可用性的限制。
- 追踪研究(time-series-cross-sectional,TSCS,又称纵横研究或纵贯性研究):对同一批研究对象在不同时间进行调查与研究,观察单元间可能存在时间与空间上的差异。相较于时间序列研究,追踪研究的困难度更高,也需耗费更多成本,因为追踪的样本很可能随时间消失或变得无法联系。值得注意的是,样本追踪研究与世代研究不同之处在于,前者并不强调世代,并能清楚了解变迁的轨迹。例如:〈都是为了孩子?父母离婚负面影响之重新评估〉(陈婉琪,2014)。不过,随着时间拉长,实验者可能难以找到每一个受试者进行追踪研究,这也是“固定样本追踪研究”的困难之处。
优点
编辑- 能测量研究对象于不同时间之生理、心理、社会之变化。
问题与缺点
编辑- 因纵贯性研究设计须长期于相同样本上进行研究,故研究期间部分样本可能因为迁徙、死亡等因素而流失或减少,使得研究结果受到影响。
- 需要花费较多的时间与经费,如果无法大量取样可能会影响研究结果的推论性。
研究的误差
编辑所有的实验都会发生误差,例如,程序设计、仪器操作、样品取样、人为观察等等。而所有环节都有可能出现偏误,影响实验结果的信度与效度,因此才更需要严谨的设计实验,以减少误差出现的几率和误差对实验结果的影响。心理学的实验也不例外,而且更容易受到实验参与者的情绪状况所影响。以下介绍对实验效度的威胁以及其改善方法,而后提及影响实验效度的具体例子。实验效度可分为两类,外部效度和内部效度。内在效度是指实验研究所操纵的实验变项对依变项所造成影响的真正程度。外在效度是指实验结果的可推论性程度,实验结果的可推论性愈大,亦即其适用性、代表性愈大,越可推论到研究对象以外的其他受试者。
效度种类 | 说明 |
---|---|
内部效度 | 实验操作变因对“实验内”应变变因造成影响的程度 |
外部效度 | 实验内所得的结果,对于“实验外”对象的适用程度 |
常见对内部效度的威胁有随机化失败、无法遵循实验章程、损耗性偏差、实验性效应影响、小样本。
- 随机化失败(Failure to randomize)
The differences estimator
是有无接受试验的类别变项, 则表达处理效应(Treatment effect)或因果关系(Causality)。
根据 OLS 及后续讨论,如果 (有无接受试验)是随机指定,则 对 的条件期望值为零, 成为对因果关系的一个不偏且具一致性的估计式(Estimator)。但是一般而言,非随机分配(Nonrandom assignment)常常造成估计式的偏误,而导致结果受到受试者特征或偏好的影响。
可以将有无接受试验这个类别变项对个体特征(Individual characteristic)作线性回归以检测试验是否随机(Randomly assigned)。
代表个体特征的有无或多寡,特征种类有 个。接着,透过 F 检定检测 W 的系数是否全为零。若接受虚无假设,则可推论试验接受与否是随机指定。另外,如果已知 randomization conditional on covariates,则这些 covariates 须包含于上述的 W 中做回归,而进行 F 检定部参与系数检定。
- 无法遵循实验章程(Failure to follow the treatment protocol)
在真实实验中,人们有时无法百分之百遵循实验章程(如控制组可能或多或少被试验),这种情况称为 Partial compliance,从而可能导致 treatment 与否与 error 产生关联造成结果偏误。
- 补救方法:
- 如果有 treatment actually received 和 intial random assignment 的资料,研究者可使用 TSLS estimator(two stage least square estimator),以 initial random assignment 作为工具变数(instrumental variables),找出 X 对工具变数的回归关系式,以此回归关系式创造 (在给定工具变数值下的 X 估计值),寻找因果关系和试验效力。工具变数需具有两个特性,以确保不偏性和有效性,其一是相关性(relevance),工具变数须 X 有高解释效力(高度相关),常用的准则是一阶 OLS 的 F 统计量需大于 10;另外一个是外生性(exogeneity),工具变数需与 error 项不相关,通常需要专业领域知识的主观判定,或在工具变数的数量多于内生变数的数量时引入 J 统计量来确定是否具外生性。
- 损耗性偏差(Attrition)
指在实验过程,受试者有可能因外在因素而未继续参与试验,而导致观察、研究的对象与比较基准的改动。若这些改变与结果相关,则这些影响将会造成最后实验结果偏误。
- 实验性效应影响(Experimental effects)
实验者的期待效应、受试者的安慰剂效应(可见后文说明)。
- 小样本(Small samples)
由于进行人体试验比较昂贵,通常样本很小。小的样本不会影响估计的不偏性,但会造成因果关系的建立与衡量不精确并影响信心水平和假设检定的有效性,因为基于临界值(normal critical values)和异方差性(heteroskedasticity-robust standard error)的统计推论只有于大样本才具合理性。小样本的推计推论,常常在引入错误(errors)为常态分布的前提下进行分析,然而,在现实状况下,正态分布的假设有些过度理想化。
注:
关于估计(Estimator)的一些性质:
- 不偏性(Unbiased):简单来说,估计量是一个随机变数,若其期望值和母体系数相等,则我们称此估计具不偏性。
- 有效性(Efficient):对估计式减去母体系数取二阶动差。二阶动差较小者,我们称此估计式相较于另一个估计式具有效性;另外当某一个不偏性估计(unbiased estimator)的变异数刚好等于 Cramer-Rao lower bound,便可称此 esimator 为最小变异不偏估计式。
- 一致性(Consistency):当估计式可几率收敛(convergence in probability)到母体系数,我们称此估计式具一致性。另外如果估计式为样本平均值或其函数,根据 SLLN(Convergent Almost Surely)或 WLLN(Weak Law of Large Numbers)可获得更强的收敛性质。
常见对外部效度的威胁有非代表性样本、非代表性流程:
- 非代表性样本(Non-representative sample):研究的母群体(population)和感兴趣的母群体(population of interest)需具足够地相似性以确保实验结果可一般化使用。
- 非代表性流程(Non-representative program or policy):要一般化施行实验中的 treatment,因为规模扩大控管降低或时间拉长,实验中所获得的效果不一定能在现实状况中重现。
抽样是从较大团体(抽样母群体)中选择部分个体(样本)的过程,并以此为基础,估计或预测此一较大团体的事实、情况或结果。
在研究过程中采用抽样,主要有下列四个原因:经济、时效、无法普查(难以接触)、毁灭性之避免。
抽样偏误是抽样调查时产生的偏误。原因出在抽样对象数量的不足,对象之间有一定的关联性,使其无法代表整个母群。
举例来说,在台北车站进行关于金钱使用的问卷调查,随机选择路人作为调查对象。但是在台北车站聚集的人,其收入可能因为城乡差距而高于全台湾的平均值,年龄层也可能集中在青年到壮年之间,职业分布也有所偏颇。因此得到的数据不能代表全台湾的实验结果。美国心理学家罗伯特·V·格恩里(Robert_V._Guthrie Robert Guthrie)曾出过一本著作《Even the Rat Was White》,书中指出西方的心理实验主要是以白人、特别是以白人的大学生作为取样对象,因此实验结果无法套用到其他族群之中。
除了采集更多样本和更精准定义抽样对象以外,能够减少抽样偏误的方法为选择抽样的方式。选择分层随机抽样或丛集抽样,并将母体依照性质分成各类别的小团体,再从团体中进行随机抽样。这样一来,不但能减少抽样偏误造成的影响,还能观察样品的性质差异对于结果的关联性,有助于研究的精确度。常见抽样方法有以下几种:
抽样方法 说明 简单随机抽样
(simple random sampling)母体中所有元素被抽出的几率均相等的抽样方法。由简单随机抽样法所得到的样本称为简单随机样本(simple random sample)。 分层抽样
(stratified sampling)将母体依照其特性或与调查目的有关的性质分成几个类或几个组,每个类组称为一层(stratum),母体中的每一个元素都属于其中的一层,而且是唯一的一层。分层之后再从各层简单随机抽取样本。 部落抽样
(cluster sampling)先将母体中相邻的某些群体划分为 n 个不同的群体(cluster),母体中的每个元素均属于其中的一个部落,且是唯一的一个部落,然后再从这些部落中随机抽取部落,并对部落进行普查的抽样方法。 系统抽样
(systematic sampling)又称“等距抽样”,自母体自然随机排列的资料中,每隔一定间隔选取一元素,直至抽满 n 个元素为止的抽样法。 分段抽样
(multistage sampling)将母体按照某些特性或某种分类标准分为数个群体或层别,先由这些群体或层别中抽出几个群体或层别,此为第一段。然后以特性或分类标准,再从已经抽出的群体或层别中,抽出群体或层别,此为第二段。如此依序为之,最后再以随机或系统抽样或其他抽样方法抽出样本。
反应偏误(Response_bias)
编辑个人面对试题时,可能并非根据模拟情境,而是根据过去的作答模式来回答,此状况被称为反应偏误。比如面对不清楚的问题时,倾向选择否定的回答、或是刻意让是与非的回答各占一半的填卷方式,都是反应偏误造成的现象之一。欲减少反应偏误,需要良好的命题技巧,以及减轻作答者对于作答结果的压力。
反应偏差可以由许多因素引起,因为受试者会主动整合多个讯息,以在给定情况下产生反应,并非被动地对刺激做出反应。[1]正因如此,实验条件几乎任何方面都可能使受访者产生反应偏误。
当受试者倾向于选择积极的选项时,这种反应偏误被称为默认偏差(Acquiescence bias)[2]。另外,若受到社会主观规范的影响而倾向给予符合大众刻板印象的回答,这被称为社会性喜好反应偏误(Socially Desirable Responding Bias)。例如:当我们参与关于环保或犯罪的公开问卷调查时,较不会做出违反环保或道德的回答;面对像是性爱等隐私性问题较不会精准回答本人的状况。对于会造成反应偏误的调查,可采匿名测验;若需要更加严谨,可依靠测谎的仪器或手段。
[注]无反应误差: 并非反应偏误之相反词,而是指在统计调查中,有提供答复的受访者与没有提供答复的受访者之间,在意见上的差异,是非抽样误差之一。
安慰剂效应(Placebo Effect)
编辑安慰剂效应,又名伪药效应、假药效应、代设剂效应。 指病人虽然获得无效的治疗,但却“预料”或“相信”治疗有效,而让病患症状得到舒缓的现象。
安慰剂效应最早由 毕阙博士(Henry K. Beecher)在 1955 年所提出,但更早期的文献中已对此有所记载,且近年研究持续深化我们对此现象的理解。安慰剂效应亦理解为“非特定效应”(Non-specific effects)或“受试者期望效应”(Subject-expectancy effect)。
此效应实验的对象经常是人类,因为需要受试者模拟效果,而未经训练的动物难以理解被灌输的想法。受试者在被告知所服用的药物为何之下,可能会因为心理作用,导致感受到的药效与实际情况有所偏差,也就是说心理层面将影响生理层面。即使拿到没有效果的假药──医学上的安慰剂(placebo)来进行实验,也有可能得到与使用真药相同的结果。另外,从众心理和权威者也可以影响实验结果,当外在的影响足够强大,就有可能改变观察目标的想法;过去受宗教势力掌控的欧洲,就有利用圣水治病的历史,在教会大力宣传下成功让人相信疗效。
目前有两个主要假设说明安慰剂效应如何作用:
- 制约反应(Conditioned Response)
俄国著名生理学家 巴夫洛夫(Иван Петрович Павлов)曾做过狗之唾液制约反射实验。他在给家中小狗食物前,都会发出铃声,在多次反复操作后,每当铃声一响,狗就会自动分泌唾液,原因是狗已经学习到将铃声及食物串联起来。此实验替古典制约理论打下良好基础。所谓古典制约,指的是一种关联性学习,可将原本不存在关联的两个事件透过人为干预建立起联系。透过此种制约,受试者会学习在特定情形下做出特定反应。据此,有学者推论,安慰剂使病人产生与有效药物类似的反应,可能是因为制约而造成。 - 病人期望效应(Subject-expectancy effect)
受试者期望效应属于认知偏见的一种。在科学实验中,由于研究人员预期某些研究结果,便无意识地操纵实验步骤、又或引导实验人员做出希望得到的结果。而病人期望效应便是其中一例子,此效应会引导病人有意无意地认为自己的病情有获改善。丹麦医学研究者Asbjørn Hróbjartsson及Peter C. Götzsche于文章中质疑“大部分病人有礼貌地倾向迎合实验人员而报告病情得到改善,即使他们并不感到改善。”主观的偏见亦可能使病人潜意识相信病情因为得到关注及照料而改善。
若要避免安慰剂效应,主要可分三种方法:
- 单盲法(Single-blind study):最简单的方法,就是不告知受试者服用何种药物。给予实验组具有效果的真药,对照组则是不具效果的安慰剂,且不告知受试者本身属于实验组还是对照组。即便对照组因为安慰剂效应有些微效果,但若最终实验组展现出比对照组更高的成果,就能够证明实验药物跟结果间的关联性。然而,在使用单盲法时,受试者会和实验人员有所接触,故仍要避免实验人员的主观期望影响到受试者。单盲实验的典型案例是Pepsi Challenge:百事可乐在商场让购物者喝用同样白色杯子装的百事可乐及可口可乐,并让他们选择自己比较喜欢哪一种,而实验者自己知道哪个杯子是装哪种可乐。
- 双盲法(Double-blind method):比单盲法更为严谨,指在药物测试中将病人随机编入对照组及实验组,实验过程中,无论是实验人员或实验组、对照组,全都不知道是谁获得真正药物,直到所有资料都搜集分析、统计后,受试者和实验人员才会知道实验对象所属组别,如此一来也就不会因为期望效应,使实验结果产生偏差。
- 但要做到双盲,会遇到很多困难,比如:两种治疗型态可能完全不同,如手术和药物治疗;或两种药物可能是两种不同的剂型,虽然用胶囊技术可使两者无法分辨,但改变剂型可能会改变药物动力学或药效学的特性,因此需要建立不同剂型的生物相等性。
- 有关安慰剂效应的研究及讨论正在进行,于医疗应用上使用安慰剂的共识准则于将来应该会出现。一般都同意,在双盲临床试实中,安慰剂对照群组对排除几种试验中可能出现的偏见是重要的。
- 三盲法(Triple blinding method):最为严谨,是指实验开始至结果出炉前,实验人员、受试者及统计人员三方全都不知哪组是实验组、对照组。三盲法通过在第一次解盲时,将受试者分为两组(但统计人员不知哪一组是实验组或对照组)。在完成资料统计后,再进行第二次解盲,公布实验组与对照组。此方法可以有效避免研究人员在统计、分析资料时因期待而产生的偏误。
安慰剂效应引发的混淆:
- 因为查找引因有一定困难度,很多现象于统计时被错误地归纳入安慰剂效应。
- 疾病自然地消失。
- 疾病本有的临床表现。
- 错误诊断或预测(prognosis)。
- 病患暂时性改善被混淆为痊愈。
反安慰剂效应(Nocebo Effect)
编辑这个词汇最早由华特.肯尼迪(Walter Kennedy)提出,其拉丁文原文 Nocebo 源自于拉丁文 nocēbō,意思是“我将伤害”,是与安慰剂效应相对的概念。
它的效果和安慰剂相反:安慰剂效应中,受试者有正面期待,因而得到正面的结果;而反安慰剂效应则是当受试者对于其用药、治疗等有负面期待的时候,受试者将得到本不应该存在的、额外的负面效果。即当被实验者不相信治疗有效时,其病情就有可能会恶化。
这样的现象大量出现在各式疾病用药上,研究指出,当病患被告知用药可能产生之副作用时,不论药物的真假,病患感受到副作用的可能性就会上升,而这一现象发生的原因不在于药物,而是病患心理层面对于康复的期望。“电磁波过敏症”也被认为和这样的反安慰剂效应相关,当受试者越是认为电磁波会造成不良影响,就越受影响。
反安慰剂效应也是一个好的研究题材:透过应用反安慰剂效应,我们可以研究个体的心理活动对于其生理方面的影响。例如: 在一个研究中,健康的成年人被告知将有电流传导过他们的双手,尽管这是一个错误的讯息,仍有三分之二的人因此而头痛(Schweiger, Parducci 1981);而在另一研究中,受试者是在实验前的皮下注射测试中对某种物质过敏,但对生理食盐水没有反应。但在双盲试验下重新以相同的条件测试后,在医患双方都不知道注射物质的情况下,有 27%受试者对之前引发过敏的物质产生过敏反应,24%受试者对生理食盐水产生过敏反应。(Jewett & Fein & Greenberg, 1990)。借由前述两个例子,我们可以得知心理活动可以影响神经,从而影响到个体的生理活动。
在人类学的范畴中,亚瑟.克莱曼等人类学家认为传统巫术的操作可能就和反安慰剂效应有关(当然,治疗的部分也有心理因素的参与,但是是和安慰剂效应有关),基于巫术的笃信造成对被施巫术的人产生极大的恐惧,甚者因而死亡,原因就是急性的、情绪性的强烈恐惧所引发的身心反应。这个现象在原始部落可谓常见,又名为“巫毒死(Voodoo death)”。
比马龙效应(Pygmalion Effect):
比马龙效应(Pygmalion effect)或罗森塔尔效应(英语:Rosenthal effect)是一种心理现象,在这种现象中,高期望会导致特定领域的绩效提高。这种效果以希腊神话中的比马龙 (Pygmalion) 命名,比马龙是一位雕塑家,他爱上了自己雕刻的雕像,或以心理学家罗伯特·罗森塔尔 (Robert Rosenthal) 的名字命名。
罗森塔尔和莱诺尔·F·雅各布森(Lenore F Jacobson)在他们的书中将这一想法应用于教师对学生的期望,从而影响学生的表现,这种观点由于其他研究结果而失去了可信度。 比马龙效应与安慰剂效应的效果十分类似,指个体被外界赋予更高的期待后,往往会表现的更好的一种现象。不同于安慰剂效应,这些期望往往是对受期待的个体有益。随时间发展,此效应演变出心理学以及管理学上的用途,为自我应验预言 (self-fulfilling prophecy;又称“自证预言”) 。
1963 年美国心理学家罗伯特·罗森塔尔尝试了一个小实验。他告诉他的学生其中一笼老鼠为特别受训过的聪明样本,而另一群则是没受训的普通实验鼠。将老鼠放进迷宫,并记录每一只花多少时间找到出路。但他没跟学生说的是,事实上它们全都是普通的实验鼠。但出乎意料的事情发生了,学生所相信比较聪明的那群老鼠,真的表现比较好。那些“聪明”的老鼠尽管和“笨”的同类没有差别,表现却是两倍优秀。一开始,没人相信罗森塔尔,这样的实验结果就连他自己一开始也很难接受。罗森塔尔后来才了解到,他的学生对待“聪明”老鼠──那些他们期望比较高的老鼠──比较温暖而温柔。正是这样的对待改变了老鼠的行为,强化了它们的表现。
罗森塔尔描述了这项研究的影响:“如果预期中老鼠变得更聪明,那么认为孩子在老师的期望下变得更聪明也不会太牵强。”罗森塔尔和雅各布森将实验带入班级(Pygmalion in the Classroom),其中一所小学的老师被告知一些学生在学业上准备展现出显著的成长。实际上,被指定为“进步”的学生是随机选择的(每个班级约5名,共18个班,涵盖5个年级)。在实验开始前,他们对学生IQ进行测量,并在研究开始后的屡次测试。在8个月内,255名对照组学生的IQ增长了8个IQ点,而65名会进步的学生平均IQ增长了12个IQ点。
在管理学上也有类似应用,上司为了启发下属的上进心而将下属视为出色的人才,他们就较有机会在工作上表现良好,如果将下属视为庸才,他们也容易如预想一般表现平庸。比马龙效应指出,管理人若能有效地发挥此效应,令那些被认为具有较好潜能的下属得到重视和称许,他们的潜能便可以得到激发,令工作表现得到进步。
比马龙效应存在许多争议,有一些研究未能完全复制或支持这一效应。有时候,研究结果可能受到研究方法、样本特征等因素的影响,这使得比马龙效应的一致性受到质疑。虽然一些研究表明高期望可以促进个体的表现,但仍然存在对于因果关系的确认问题。即使观察到高期望和优秀表现之间存在相关性,也不能确定这种关系是因果性的。其他未考虑到的因素也可能对结果产生影响(如个体对压力的反应、自我应验预言等现象)。Pygmalion in the Classroom也受到质疑。首先,有些老师们并无法回忆起哪些学生被指定为潜力巨大的学生,表示操纵变因应无效。(老师在学期初收到一份学生名单;很少能记得名单上的学生名字)。其次,智力测量的有效性也有待商榷,当时使用的智商测试可能对年纪较小的孩子无效。除此之外,本实验忽略了其他可能影响学生表现的重要因素。例如,学生的自我效能感,即他们对自己能力的信念,会影响他们的学习动机和成果。此外,学生的家庭背景,如父母的教育水平和家庭支持,也对其学业成就有显著影响。仅强调比马龙效应而忽视这些因素,可能导致对学生表现的片面理解。
“社会期许”是指在评量个人的性格或态度行为历程之中,个体常因“假装完美”(fake good)的动机而作假,倾向选答能令人产生良好印象的内容以符合社会期待,并非本身真实的内在想法或性格态度。这种在作答过程中有意使他人对其产生良好印象,却非依照本身实际的想法或作法答题的反应倾向,即为“社会期许”。例如过多申报自己的“良好行为”或过少申报自己的“坏行为”、不受欢迎的行为。
这种倾向严重影响研究的效度,尤其见于自填问卷,这种偏差会影响样本的平均数值,亦影响研究受访者之间的差异,尤其在拥有特定社会期待的议题上,例如受访者个人的能力、性格、性行为、滥用药物等议题,须特别留意社会期许误差,为了防止受测者欺骗或作假的反应,人格测验中常编写一些相当不确定或中性的题目编入试题中,以诱导受测者产生社会期许心态高低分数,例如“我有时会心情不好”或“我曾说过别人的闲话”等,如果作答结果社会期许分数过高,表示受测者在问卷中过度掩饰自己的真实想法或感受,该人格测验的结果不尽可靠,而必须重做或进行其他类型的人格测验。
这种误差对不同人口组别的影响可能不同。例如当受访者申报性伴侣的数目时,男性倾向申报较多,女性申报较少。无论如何,两个组别的性伴侣数目平均值,皆受社会期许误差影响。
例如当受访者需要回答:“你是否曾经滥用药物或不当物质?”受访者可能基于社会上的压力或眼光而否认曾经吸食受管制物质(例如大麻),或是尝试合理化其行为,设立一个较好的形象,如回答:“我只会在有朋友在场时,才吸食”。
常受社会期许误差影响的议题包括:
- 个人收入:低收入者倾向高报而高收入者倾向少报
- 负面情绪:例如没有自尊、无力感,经常遭否认
- 没有依从指示/没有按时使用药物:高报配合度
- 智商及相关成就:往往遭高报
- 违法行为:常遭全盘否认
- 排泄功能:受访者往往不愿讨论
- 宗教信仰:受访者往往不愿讨论
- 爱国主义:基于恐惧、审判或旁人目光,而遭高报或否认
- 暴力:不论实际或想像,往往遭否认
- 慈善或仁爱:往往遭高报
- 性取向:非异性恋者往往较为自卑,近年来才稍稍改善
观察者偏误(Observer Bias)
编辑观察者偏误是因为预期心理(Expectancy Effect),或称作期待效应所产生的偏误。传递有利于实验假设的讯息给受测者,有可能进而影响实验的结果。
例如著名的聪明汉斯实验。聪明汉斯是一匹标榜会做简单的四则运算的马,但事实上这匹马不是真的懂算术,一位德国的心理学家Oskar Pfungst发现,唯有饲主知道答案,并且站在汉斯看的到的地方时,汉斯才能回答出正确答案,反之则会失败。因此得知汉斯是靠训练员和观众在无意识下给予表情或姿势等等的暗示而选出正确答案。
美国心理学家雨果·明斯特伯格曾经进行一个关于和平的演讲,并在演讲之后收集各个记者的新闻稿,却发现记者们写了相异甚至相反的叙述。这件事证明观测结果容易受到观测者的立场,背景,环境,以及对于实验的预期所影响。这被称为观察者偏误。同样地,一个装了半杯水的杯子,根据对照物,观察者可能会回答出半满或半空两种回答,这也是一个观察者偏误的例子。
要减少观察者误差,所需要的是进行实验的标准化(Standardization)和操作性定义(Operational Definition)。
- 标准化(Standardization):即统一资料收集的所有步骤,无论是测验还是晤谈都采用一贯的程序,让所有参与实验的人都经历相同的实验条件,以相同的方式发问,以事先建立的规则来评断。
- 操作性定义(Operational Definition):有些标准可能难以统一,例如快乐的程度、过动的定义。为了客观性的测量,必须先建立一个可观测的规则来加以界定,这就被称为操作性定义。也就是说,必须根据某个可以观察,测量,操作的特征来定义我们想要观察的概念,无论是自变项还是应变项,都必须经过操作性定义来使其具有客观性。
面对这种偏误,光是上述的实验的单盲法是不足的,因此有时候会设计连参与实验的实验者都不知道实验目的的实验,这种被称为双盲法(Double-Blind study)。让实验者与被实验者都不知道现在进行的是何种实验条件,像是实验者在询问被验者的时候,也不知道对方是实验组还是控制组。或是更根本的,让实验观察者不知道他们需要观察的对象而客观的记述所观察的事物。除此之外,还有三盲法(Triple-Blind study),即为双盲再加上资料监测者等也不知情,其虽严谨但实行上较为困难。无论是何种方法,对实验的隐瞒都有所要求,有意的欺瞒有时会触犯心理实验的道德规范,这一点在研究的道德争议章节会做更多描述。
幸存者偏差是一种逻辑上的谬误,因忽略失败的子群体,而误将成功的子群体是为全体,造成之偏误。
其概念起源于二战时期,美国哥伦比亚大学统计学亚伯拉罕·沃德教授(Wald Ábrahám)接受美国海军的聘请,运用他在统计方面的专业知识给出关于‘飞机应该如何加强防护,才能降低被炮火击落的几率’的建议,在沃德教授对成功返回的轰炸机进行了分析与统计后得出,机翼是整台飞机中最容易遭受攻击的位置,然而,有别于直觉上‘因为机翼最常受到攻击,所以我们应该强化机翼的防护’这样的推论,沃德教授却给出了‘我们应该强化发动机的防护’这样的建议。其原因来自于虽然机翼遭受了最多攻击,但却不影响飞机的返航,反之,之所以较少看到返航的飞机的发动机受到攻击,极可能是因为若发动机遭受攻击则飞机将坠毁,根本无法返航所致,所以,该加强的并非机翼而是发动机。军队后来采纳了教授的建议,后来也验证教授的决策是完全正确的。因此,幸存者偏差指得是我们往往过度关注幸存者所拥有的特征,却忽略了其他更多失败者的案例。因此,当我们取得的资讯仅来自于幸存者时,此资讯可能会存在与实际情况不同之偏差。这种偏差将会导致各种错误结论。
以下为幸存者偏误在其他领域中的例子: 在金融领域,人们过于关注成功的公司和个人,在新闻媒体中失败的公司和个人则获得较少的关注。实际案例如,人们过多关注部分成功的科技企业家未完成大学学业,却取得相当卓越的成就,造就人们认为大学教育对开始科技业并无帮助的印象。然而,在现实中,绝大多数中途辍学的人并没有变得富有,而忽略这些可能低估大学学位在创造财富方面的实用性。
霍桑效应
编辑霍桑效应是心理学上的一种实验者效应,又被称作被试效应、霍索恩效应,是指被观察者知道自己成为被观察对象后认知与态度改变行为倾向的反应所产生的实验偏差。霍桑效应亦是一种研究的误差,尤其在使用观察法的时候容易出现,因为被观察对象在霍桑效应的影响下做出了实验者原先不想观察的行为。
霍桑效应的发现来自一次失败的管理研究。1924 年 11 月,美国国家研究委员会组织了以哈佛大学心理专家梅奥为首的研究小组进驻了西屋电气公司(Westinghouse Electric Corporation)的霍桑工厂,研究的初衷是试图通过改善工作条件与环境等外在因素,找到提高劳动生产率的方法。在这长达八年多(1924~1932)的实验中有四个主要阶段,前两个阶段是有关于“效率”的研究,第三个阶段是“访谈”研究,第四个阶段是“观察”研究。
但实验并不顺利,实验假设的各项条件并非唯一或决定性的影响因素。对此,乔治·埃尔顿·梅奥以及他的助手们所做的解释是,受试者对于新的实验处理会产生正向反应,是由于环境改变(试验者的出现)而改变行为。工人工作效率之所以没有随着外部条件改变而改变,是因为工人都知道自己正在被实验者观察,因此工人的行为不只是出于环境的改变,还出于他们认知到自己正在进行一项实验。意即,当女工被抽出来成为实验对象时,就会意识到自己是特殊的群体,是这些专家一直关心的对象,这种受注意的感觉使得她们加倍努力工作,以证明自己是优秀的,是值得关注的。所以绩效的提高,并非由实验操控造成,这种效果就是我们所称的“霍桑效应”。
- 霍桑效应的例子:
- 教育 : 在教学中,经常会看到霍桑效应的作用。 例如,老师可能知道校长或班主任正在观察他们,所以会在他们的课程计划和表现上付出额外的努力。
- 面试 : 作为一个面试的候选人,我们总是想展示自己最好的一面,并掩盖自己的短处。
- 心理学治疗 : 在心理学治疗时,心理学家会问一些个人问题,得到的答案和患者的行为可能会因被特别关注而发生变化,人们往往会隐藏自己的感受。然而,当患者被要求写下他们真正想法时,结果可能会改变。
区群谬误(Ecological Fallacy)
编辑又称生态谬误、层次谬误,一种在分析统计资料时常犯的错误。和以偏概全相反,区群谬误是一种以全概偏,如果仅基于群体的统计数据就对其下属的个体性质作出推论,就是犯了区群谬误。这类谬误假设群体中的所有个体都有群体的性质(因此刻板印象也可能犯上区群谬误)。
通常是以较高层级的分析单位(例如:系所、选区)的资料,对较低层级的分析单位(例如:性别、 年龄)作出了错误推论。
例一 一实验研究发现 A 国具有忧郁症的人比 B 国多,且调查发现 A 国的大学生比率比 B 国高,因此直接推论这些忧郁症的人因其具有大学生的身份,学习压力较大,因此较可能有忧郁症。然而,A 国的忧郁症者很可能不是大学生,大学生也很可能没有得忧郁症,要进行刚刚的推论,必须要有更严谨的资料佐证,否则这样的研究推论就是犯了区群谬误。
例二 假设甲城和乙城都各有相同人数的富人和穷人,富人都住在山上,而穷人都住在排放致癌物的工厂附近,故此在两个城市的穷人癌症发病率都比富人高很多倍。在甲城的都是高增值高污染工业,故此在甲城无论是富人和穷人的平均工资都比乙城高,但同时甲城穷人的癌症发病率也因此比乙城高。 一位教授希望找出癌症的风险因素,他在国家统计刊物找到甲城和乙城的癌症发病率和工资中位数,发现工资中位数较高的甲城有更高的癌症发病率,得出高收入是癌症风险因素的结论。然而事实上,贫穷才是癌症的风险因素,区群谬误带来相反的结论。
信度(Reliability)与效度(Validity)不足
编辑做研究时,常会需要运用一些测量指标来测量某一个概念。例如在设计心理测验量表时,实验者欲透过量表来分析作答者的性格是属于封闭的或开放的,那么实验者不能直接问填答者是属于哪种性格,而是要透过一些指标(indicator)来测量开放性格这一个概念。在用指标测量概念时,要注意测量的信度与效度。在前段心理研究法种类的测验法中,有信度、效度的详细说明。
在心理学实验中,可能会有很多没被列入考量的干扰变项会影响实验参与者的心理状况,进而影响实验结果与其信度和效度。例如:在样本的搜集中,对于问答的刻板反应、对实验的预期都可能是造成误差的原因之一,而有时误差的原因不只出在受试者身上,还会出现在实验者身上。因此,在设计实验的时候,维持实验步骤与资料收集的统一性,并减少外在因素对于实验参与者的影响。探讨实验的误差来源和减轻偏误的影响也是心理学研究的一项重点。
化约论(Reductionism)
编辑以单一原因(例如:单一分析单位、单一变项)来解释复杂的现象。又称还原论,是一种哲学思想,其基本观念为:复杂的系统、事务、现象等等均可以通过把他们简化成为各部分之组合的方法,加以描述和理解这已经被拆解成各部分之组合。举例来说,化约论认为生物学是以化学为基础,化学是以物理学为基础。然而在社会科学当中,化约论产出的观点有很多的争议。举例来说,心理学跟生物学、社会学跟心理学,政治学跟社会学,他们的相互关系到底为何,且是否可以将他们简化成为各部分之组合等等。
关于化约论的分类,可以有下面三种方式:
- “本体的化约论”与“理论的化约论”
- 本体的化约论主张这个宇宙的最根本构成事物是基本粒子,而且这些基本粒子的性质或规律,原则上穷尽了其他事物的性质或规律。
- 理论的化约论主张所有的巨观科学理论,最终都可以被化约到微观的粒子物理学,任何科学定律最终都可以由物理定律导衍出来。
- “本体的化约论”与“理论的化约论”
- “大化约论”与“小化约论”
- 大化约论认为自然界之所以是这个样子,是因为存有简单的普遍定律,而所有其他的科学定律都能在某种意义下化约到那些基本定律。
- 小化约论则是认为事物之所以有那些行为,是因为它们组成成分的性质使然。
- “大化约论”与“小化约论”
- “对大自然的化约观”与“当作科学研究程式的化约论”
- 所谓对大自然的化约观又称做化约论式的世界观, 是指所有科学领域都是源自于大自然的终极原理, 亦即F. Dyson所谓的“有限数目的基本方程式”
- 当作科学研究程式的化约论则是指将研究命题化约为一些个别的概念,并且逐一加以分析。
- “对大自然的化约观”与“当作科学研究程式的化约论”
虚假关系(spurious relationship)
编辑指在两个没有因果关系的事件之间,基于一些其他未见的因素(干扰因素 confounding factor,或潜在变数 lurking variable),而推断出因果关系。这会引致“两个事件是有所联系”的假象,但这种联系并不能通过客观的试验得出,需要在近一步的假设试验下才能得出正确因果关系。
相关跟因果关系是两个不同的概念。因果关系是两个事件之间的关系。而相关是根据实验结果得出的关联性。
两个变数受第三者影响,从而在其间得出误导的相关系数。即是说,变数 A 和 B 之间可找出相关。所以,有以下的可能性:
- , A 导致 B
- , B 导致 A
- , C 导致 A 且 C 导致 B (C 为干扰因子 confounding)
- , C 导致 A 后间接导致 B (C 为工具变量 instrumental variable, 简称 IV)
- , A 导致 C 后间接导致 B (C 是中介变量)
- , A 导致 C 且 B 导致 C (C 是对撞变量)
前两种情况是实际的关系,A 跟 B 有因果关系(causal effect)也有相关(association)。
第三种情况是伪关系,A 跟 B 没有因果关系,但有相关。如果能控制住C变数,X和Y就不再相关。
在第四、第五种情况,A 跟 B 有因果关系也有相关。但如果控制住 C,则 A 跟 B 的关系可能会消失。
在第六种情况,A 跟 B 无因果关系,但有相关。若控制住 C,则 A 跟 B 反而会产生了因果关系。
实验的再现性
编辑心理学最特殊的地方在于其建立在个体的心理活动上,因此并无法建立绝对的因果关系,即无法保证同一输入及实验方法一定会制造出同一个实验结果。基于上述各项误差以及个体心理活动的随机性,使心理学实验本身的“再现性”备受质疑。
以下是三个可能解释原研究无法被再现的原: “其一是原研究所得的效应是假阳性结果,这个效应本就不真实,被观测到纯属偶然。其二则可能是再现研究得到了假阴性结果,而没有捕捉到真实的效应,又或者,原研究和再现研究的估测都是准确的,可两者的研究方法在关键部分有了差别。”简而言之,无法再现原研究发现并不意味着原研究是错误的。同理,即便结果被成功再现,也不能证明原研究的假设肯定是正确的。
例子:在 2015 年 8 月,开放科学合作组织(Open Science Collaboration,OSC)对 100 项心理学实验进行再演,重新进行该 100 项心理学实验,发现可以重新导致相同结果的实验不足四成。虽然有其他心理学家就开放科学合作组织的实验方法有所质疑,但该试验已然足够显示心理学实验的问题所在。
再现性可以用几个方式衡量:
- 再测信度(Test-retest Reliability): 用同一测量工具在不同时间点对同一对象进行测量。例如,在某堂体育课与下堂体育课,所测得的体能表现会大致相同。
- 复本信度(Inter-method Reliability):用不同相似工具来测验同一个项目,例如用迈尔斯-布里格斯性格分类测验(Myers-Briggs Type Indicator)。
- 内部一致性信度(Interna Consistency Reliability):同一个测验中不同子项目是否一致,例如量度“外向”,可以用“朋友数目”、“友善程度”、“经常笑”等来测。一般可用克隆巴赫系数(Cronbach's alpha)来检验。
- 评分者间信度(Inter-rater Reliability):由于个人因素的影响(如情绪、既有观念等),有些测验不能以客观的方法进行鉴定,例如作文考试。所评的分数通常受评分者的主观感受而受到影响,因此要由 2 人或以上各自根据标准评分,再求大家分数是否大致相同。
研究的道德争议
编辑由于心理学的研究对象是有生命的个体,所以在研究伦理的议题方面尤须重视。无论是对于人类或动物的研究,都要尊重并保障其基本权利。美国心理学会(American Psychological Association, APA)为达上述目的,最先发表了“心理学专业人员的伦理信条和守则”(Ethical Principles of Psychologists and Code of Conduct, 2002)。我国也设有研究伦理委员会(或称人类试验委员会),对各研究进行研究伦理审查(Institutional Review Board, IRB),通过审查才能进行研究,同时警戒研究者,对研究过程所获得有关参与者的资讯必须保密。
以下附录美国心理学会“心理学专业人员的伦理信条与守则 ”中对于基本规范的重要准则进行说明:
- 善行和不伤害(Beneficence and Nonmaleficence)
- 心理学家致力于使与其合作的人受益,并谨慎避免造成任何伤害。在他们的专业行为中,心理学家致力于保障与其专业互动的人和其他受影响的人的福祉和权利,以及研究动物的福祉。当心理学家的义务或关注之间发生冲突时,他们会尝试以负责任的方式解决这些冲突,以避免或减少伤害。由于心理学家的科学和专业判断和行动可能影响他人的生活,他们会警惕并防范个人、财务、社会、组织或政治因素可能导致其影响被误用。心理学家努力意识到自身的身心健康可能对其帮助与其合作的人的能力产生的可能影响。
- 忠诚与责任(Fidelity and Responsibility)
- 心理学家建立起与其合作对象的信任关系。他们认知自己对社会以及所服务的特定社群的专业和科学责任。心理学家坚守专业行为标准,澄清自己的专业角色和义务,对自己的行为承担适当的责任,并努力管理可能导致滥用或伤害的利益冲突。心理学家与其他专业人士和机构协商、转介或合作,以满足与其合作对象的最佳利益所需。他们关注同事在科学和专业行为上的道德合规性。心理学家努力投入自己的专业时间,为了少量或无报酬或个人利益而贡献自己的一部分。
- 正直(Integrity)
- 心理学家致力于在心理学的科学、教学和实践中促进准确性、诚实性和真实性。在这些活动中,心理学家不偷窃、欺骗或参与欺诈、诡计或故意歪曲事实。心理学家努力遵守他们的承诺,避免不明智或不清晰的承诺。在需要使用欺骗可能是在伦理上可接受的情况下,以最大化利益和最小化伤害时,心理学家有着严肃的责任去考虑对这些技术的使用所产生的任何对信任或其他有害影响的需求、可能的后果以及他们负责纠正的责任。
- 公正(Justice)
- 心理学家认知到公平和正义使所有人都有权利获得心理学的贡献并受益,并且在心理学家进行的过程、程序和服务中,所有人应享有平等的质量。心理学家行使合理的判断并采取预防措施,以确保他们的潜在偏见、专业能力的界限以及专业知识的局限性不会导致或容忍不公正的做法。
- 尊重人权与人类尊严(Respect for People's Rights and Dignity)
- 心理学家尊重所有人的尊严和价值,尊重个人的隐私、保密权和自主权。心理学家意识到,为了保护那些因脆弱性而影响自主决策的人或社群的权利和福祉,可能需要特殊的保障措施。心理学家意识到并尊重文化、个人和角色差异,包括基于年龄、性别、性别认同、种族、族裔、文化、国籍、宗教、性取向、残疾、语言和社会经济地位等因素,并在与这些群体的成员合作时考虑这些因素。心理学家努力消除基于这些因素的偏见对其工作的影响,并且不会有意参与或容忍基于这些偏见的活动。
心理实验的伦理标准
编辑今日我们遵循的伦理标准其实是来自 1970 年代奠定的基础,当时的研究员们列出了一张清单,细数着保护自愿受试人们的隐私安全的规则。这张清单报告就是贝尔蒙特报告(Belmont report),简单概括其内容就是所有涉及人类的研究都要遵守 3 个主要的伦理原则。
- 对受试者的尊重:也就是强调受试者要在知情同意的情况下进行实验,实验研究人员不得对受试者有所隐瞒,他们有权利在签署加入实验的合约前就清楚地了解当中的风险或利益。
- 行善原则:基本上要表达的就是研究者应该尽量避免对受试者产生任何的负面影响,应该将受试者的福祉纳入实验设计的考量。核心的概念可以用三个字简单概括,即 "Do No Harm",不要造成任何的伤害,心灵上亦或是生理上的伤害皆涵盖在范围内。
- 正义原则:也就是研究人员有义务确保受试者不被剥削、迫害,或是在逼迫的情况下接受实验的要求。此外,研究人员还被要求确认该实验的负担或是利益是均匀且公平地分配的。举例而言,在早期的研究中,受试者通常是较贫穷的,基于经济上的负担而加入实验承担其风险;而受益的通常却是较富有的那个阶层,透过实验分析到的结果得出结论,造福较富有的那一方,这样不均匀、不公平的实验风险分配是不被接受的。
以上列出的伦理标准适用于任何涉及人类的研究,包含心理学的研究。然而,即便指标和原则(Ethical principles)已订立清楚,操行准则(Code of conduct)却未有明确的定义,即能意会却无法清楚地知道该如何将此核心概念付诸实践。因此,在操行准则(Code of conduct) 确立前,一堆受质疑的研究已经进行并完成了。
实验案例
编辑以下几个例子皆为历史上知名的争议性心理学实验,读者可以观察未遵守伦理上的原则可能带来的结果。
- 实验一:小艾伯特实验(Little Albert experiment)
由于实验者并未去除受试者、婴儿小艾伯特的条件反射,恐有造成其心理永久负面影响之嫌;且作为小艾伯特监护人的母亲是否真的知情,或有无受到胁迫,至今仍无定论。
- 实验二:米尔格伦的服从权威实验(Obedience to Authority Study)
或对实验参与者施加过多心理压力,以科学权威裹胁其继续进行实验,尽管部分参与者已出现身心极度不适的反应。
- 实验三:旁观者效应(The By-stander Effect)
其中最出名的案例,《纽约时报》所报道的1964年3月13日纽约调酒师遭当街性侵并刺死,38名目击者冷眼旁观事件,实际上被过度夸大与扭曲。2007年《美国心理学家》指出,当时目击者远少于38人,有报警纪录,且大部分人并无亲眼目睹。
- 实验四:史丹佛监狱实验(The Stanford Prison Experiment)
造成部分参与者生理与精神上的损害,且其并未获得先前承诺的自主权,不能随时决定中止参与实验离开。
- 实验五:哈洛的恒河猴实验(Harry F. Harlow)
违反动物伦理,造成受试动物身心重创。
- 实验六:安慰剂效应(placebo effect)
受试者并未知情同意,除了可能伤害医病关系,也有侵害病人自主权的疑虑。
动物实验的研究
编辑动物试验(英语:animal testing)、动物实验(英语:animal experimentation)或动物研究(英语:animal research),是指利用人类以外的动物进行科学实验,以验证个别因素对接受测试的动物在生理或行为上的影响,并与同种类之生物在自然环境下的状态进行比对。用于动物实验的动物称为“实验动物”(英语:laboratory animals)。其目的是为了生理学、病理学或心理学的研究。动物的实验研究通常在综合大学、医学院、制药公司、国防机构以及为各行各业提供动物测试服务的商业设施中进行。动物试验的重点在于纯粹研究的连续性,侧重于发展有机体的基础知识、应用研究,也可能侧重于回答一些具有重大实际意义的问题,例如寻找治愈疾病的方法。这项研究应用的具体例子包括测试疾病的治疗方法、选育、国防研究和毒理学(英语:Toxicology testing),甚至还包括化妆品测试。在教育领域,动物试验有时也是生物学或者心理学课程的一部分。这些实践操作在不同国家受到不同程度的监管。
微生物等级分类
依据体内寄生的微生物种类,实验动物按从低到高的标准可分为:
普通级(conventional,可缩写为CV):不携带主要人畜 共患病和动物烈性传染病的病原。
清洁级动物(Clean animals,CL):除不能携带主要人畜共 患病和动物烈性传染病的病原外,不能携带对动物危害大和对科研干扰大的病原。
无特定病原体级(specific pathogen free,可缩写为“SPF”):除一、二级动物应排除的病原外,不携带主要潜在感染或对研究干扰大的病原。使用SPF动物可以确保不会有特定的疾病对试验结果造成干扰。SPF动物可以通过剖宫产并进行特别护理来获得,这样新生动物就不会得到感染,例如使用带正压差的无菌塑料袋。由于(在皮肤、肠道或呼吸道)不存在可以进行保护的细菌群落,这样做的缺点是任何病原的接触都是致命的。
无菌级(germ free,可缩写为GF)不携带可检出的一切病原体。这些生物通常是通过各种方法培育的,以控制它们暴露于病毒、细菌或寄生虫等微生物的机会。当已知的微生物群体被引入到一个无菌生物体内时,通常被称为一个悉生生物体(gnotobiotic organism),但从技术上来说,无菌生物也是悉生生物,因为其微生物群体的状态是已知的。由于缺乏微生物群体,许多无菌生物会表现出健康缺陷,例如免疫系统缺陷和能量获取困难。通常,无菌生物用于微生物群落的研究,需要对外部污染物进行仔细控制。限菌动物(Gnotobiotes animals,GA)则是在无菌动物物体内移入一种或几种已知微生物后的动物,亦为悉生生物。
普通级的实验动物的饲养环境无任何防护措施。无特定病原体级的实验动物是受国际认可的标准动物模型。这类实验动物饲养在达到一定条件的动物房中,饲养环境能阻止特定病原体在这类实验动物中寄生,以减少对实验结果的影响。而无菌级的实验小鼠需要生活在无菌环境中,体内不含有任何微生物。
以上文字多转述自维基百科Specific-pathogen-free -- https://en.wikipedia.org/wiki/Specific-pathogen-free#:~:text=t%20e%20Specific-pathogen-free%20%28SPF%29%20is%20a%20term%20used,specified%20diseases%20do%20not%20interfere%20with%20an%20experiment 与Germ-free animal -- https://en.wikipedia.org/wiki/Germ-free_animal
为何要进行动物实验?原因如下:
- 动物比较容易在受控制的环境中成长,心理学家因此能辨别各种因素对于动物的行为跟功能的影响。
- 动物的系统可作为人类的模型,且其基本历程(例如:感觉、学习、记忆)较人类单纯且易于研究,有助于我们进一步了解人类的功能。
- 动物的繁衍速度较快,使心理学家得以探讨好几个世代间才有办法观察到的发展历程。
- 许多心理学家研究动物行为并非为了人类的利益,仅是为了探讨各物种的行为特征、习性。
动物实验缺点:
- 结果缓慢且昂贵,缺乏效率:用动物做实验是用电脑模拟的成本的 300-500 倍。
- 应用于人类的问题,即使动物系统基本历程类似,但是否可以类比到人类上仍属问题。
动物实验的利益包括药物的测试及发现,事实上,动物实验对于了解及治疗精神疾病、药物成瘾方面有重大功用,例如焦虑(anxiety)、忧郁症、阿兹海默症等等。另外,动物研究也对动物本身有利,相关研究已经可以帮助动物园里的动物缓解其被监禁的压力;对于动物社会组织及行为的研究也可以帮助人类改良动物设施的设计,进一步确保动物的健康。
尽管如此,动物实验的正当性依旧受到部分人士的质疑。他们认为,对人类有益并不能成为人类进行动物实验的充分理由。同时,近年来心理学及医学越来越重视实验动物的关照。美国心理学学会(American Psychological Association, APA)伦理准则更要求,若要施加痛苦或有害程序在动物上,必须充分说明实验所能得到的知识,且提供动物人道的对待,尽可能减轻其痛苦,另外也有一套严格的准则(Novak & Suomi, 1988)规范实验动物的饲养环境。
1900 年起开始有许多动物实验开始进行,因而引发道德上的争议。科学家拉塞尔(W. M. S. Russell)和伯奇(R. L. Burch)在 1959 年提出针对实验动物的 3R 原则:
- 替代(Replacement):以非活体或是演化程度较低的动物进行实验。
- 减量(Reduction):使用较少动物或用最低实验使用数量取得所需数据。
- 精致化(Refinement):改进、完善实验程序,使实验中动物所受的疼痛与压迫得到减轻。
而英国农场动物福利委员会于 1967 年,订定动物福利五大自由原则,分别为:
- 免于饥渴的自由(Freedom from Hunger and Thirst):必须提供动物干净的饮水及饲料以维持健康及活力。
- 免于生理不适的自由(Freedom from Discomfort):必须提供适当的饲育环境及舒适的休息场所。
- 免于痛苦、伤害及疾病的自由(Freedom from Pain, Injury or Disease):必须提供疾病预防及快速诊疗的机制。
- 表现正常行为模式的自由(Freedom to Express Normal Behavior Patterns):必须提供足够的饲育空间、适当的硬件设施及适当的同伴。
- 免于恐惧和压力的自由(Freedom from Fear and Distress):必须确认所有作业流程不会造成动物遭受心理苦楚。
虽然现今已有许多法规保障动物实验中的伦理原则,但仍无法确保这些规则能百分之百被贯彻。2018 年,纽约时报曾报道福斯车厂以实验猴进行废气对健康影响的实验。2019 年,英国废除活体解剖联盟 (Cruelty Free International,CFI)爆料位于德国一间药物与毒物实验室的不人道动物实验,实验动物们生活毫无福利可言,环境脏污无人清理。
实验猴以粗鲁的方式从笼内移出,被固定在实验器材上强迫站立。操作过程中动物皆处于清醒状况,甚至发出痛苦的尖叫。
另外,动物实验是否真的能精确模拟人类的生理反应以预测疾病,一直是争议点所在。目前国际间一直在发展新的技术,期望能够减少甚至取代使用动物实验,包括细胞培养(Cell Culture)、电脑模拟技术(Virtual Physiological Human)、芯片器官(Organ-on-a-Chip)、迷你脑(Mini Brain)等。
小猕猴实验
以下用心理学家哈里·哈洛(Harry F. Harlow)对小猕猴进行的一系列实验,来深入解释何为“违反动物实验伦理”:
- 1. 铁娘子:
- 在更前面的实验中,实验结果发现猕猴对于使用绒布、铁架、加热器等制作的“绒布妈妈”产生依赖,并且会获得安全感。哈里·哈洛在这个“绒布妈妈”产生追加会定期喷射高压空气、产生尖刺等等会伤害猕猴小孩的装置,称作“铁娘子”。研究发现即使小猕猴被“铁娘子”伤害,依然不会放弃对“铁娘子”—他认为是自己母亲的对象的依恋。
- 在更前面的实验中,实验结果发现猕猴对于使用绒布、铁架、加热器等制作的“绒布妈妈”产生依赖,并且会获得安全感。哈里·哈洛在这个“绒布妈妈”产生追加会定期喷射高压空气、产生尖刺等等会伤害猕猴小孩的装置,称作“铁娘子”。研究发现即使小猕猴被“铁娘子”伤害,依然不会放弃对“铁娘子”—他认为是自己母亲的对象的依恋。
- 2. 社会孤立:
- 将刚出生的小猕猴放入笼子与外界隔绝,或只能看见外界但无法与其他的猕猴互动,并持续 3~12 个月不等,随后使其返回与外界互动。研究显示这样的社会孤立会使猕猴失去社交能力,对外界的猕猴等一切环境感到恐惧、不安,甚至有类似自闭症的症状。并且如果与世隔绝的时间越长(例如超过 6 个月),则非常难使猕猴获得社交能力或治疗其自闭、恐惧的症状。
这个实验后来还进行了更为惨忍的实验,使公猴强暴那些失去社交能力的母猴,而这些母猴没有能力带给孩子关爱,甚至会对猕猴小孩施暴。 这个实验或许可以使我们思考,一个生命个体如果失去与外界互动或者没有得到足够关爱,可能会带来的影响。
虽然哈里·哈洛的这些实验带给人类有关对孩童施暴的父母、社会孤立带给孩子的影响,但这些实验显然已经严重伤害的猕猴们的心理健康。
实验小白鼠
现今大多数实验都会使用小白鼠作为实验用动物,使用小白鼠做实验的优点如下:
- 饲养成本低:其实不只是小白鼠,包括小白鼠在内,有许多动物都已被当作实验用动物了,例如猴子、猩猩、狗、甚至是猪。而其中小白鼠的饲养成本最低。
- 个体差异较小,较容易调控实验变因:经过百年探索,纯系小白鼠的培养方法已经成为固定流程,培养出的小白鼠几乎没有个体差异。在实验中往往需要通过重复多次来验证其科学性,如果参与实验的动物个体差异很大的话,对实验结果影响也很大。因此,这个特性对科学实验的进行意义重大。再者,小白鼠的体型方便实验人员进行控制,所需空间也不多,在配合实验这方面也会顺利许多。
- 繁殖能力强,生长周期短:一般情况下小白鼠六到七周便可以性成熟了,而且还具有产后发情,每次分娩的当天再次合笼交配的话,怀孕率几乎是百分之百。换言之,小白鼠几乎可以连续不断地怀孕生子,一次性排卵更是多达 20 个左右。所以这种全年多发情性,繁殖率又高的动物确实是一种实验的好材料,足够满足实验室的科研需求。
- 遗传上与人类相似:小白鼠是哺乳动物且基因组和人类相似度极高(约 90%)。由于遗传学实验效果很好,同时许多人类目前难以治愈的疾病都可以在小白鼠身上找到相似的性状。通过小白鼠实验能够发现病因,研究发病规律和探究治疗方法。
实验狗
前苏联学者巴夫洛夫把狗圈禁在固定的笼子里,先是直接投喂食物,观察它们分泌唾液的情况;之后在喂食的同时额外增加铃声刺激,反复多次后,狗在只听到铃声的情况下也会像看到食物一样分泌唾液。但他也发现,如果持续只响铃不给食物,狗分泌唾液的情况会逐渐消失——也就是说,条件反射也会消退。 争议事件:在20世纪初的布朗狗事件(英语:Brown Dog affair)中,亲动物和反动物试验团体之间的这些分歧首先引起了公众的注意,当时有数百名医学生和反活体解剖学家围绕着一尊为纪念被活体解剖的狗而立的纪念像与警察发生冲突。
实验猫
美国心理学家爱德华·桑代克提出的学习相关定律。 其中最有名的为饿猫迷笼, 他把饥饿的猫禁闭于设了机关的笼子内——饿猫可以通过抓绳或按钮等三种不同的方式逃出笼外获得食物。一开始,猫被关进迷笼之后只是盲目地乱撞乱叫、东抓西咬,但会在偶尔做对打开迷笼门的动作后“逃出生天”。桑代克重复这个过程,记录饿猫逃出迷笼所需的时间,最终得出猫的学习曲线。桑代克发现,猫在进行“尝试-错误”的学习,经过多次的尝试-错误,饿猫学会了打开笼门的动作。
另外,美国行为治疗心理学家沃尔普(Joseph Wolfe)曾进行电击猫实验。在第一阶段,先把猫关在实验室的笼子之中,喂食时给予电击,导致猫出现极度焦虑等精神衰弱的反应,就算刺激不再出现或停止,猫的情绪焦虑恐惧仍然存在,此时即使猫处于饥饿的状态,也不愿进食。第二阶段主要是消除猫因为电击造成的焦虑和恐惧,因为猫饿了始终都要进食,于是沃尔普先把猫处置于与实验室完全不同的房间喂猫,因为外在环境空间的改变,猫的焦虑恐惧情绪有所降低,经过一会儿,开始恢愎进食。再接下来,把喂食的地方移到与实验室环境相近的地方,猫又开始恐惧焦虑,然而猫因为前一次的经验,使它可以克服这一次的恐惧焦虑。
沃尔普把这一种方法做“互动抑制”(reciprocal inhibition),“减敏感法”(desensitisation),或者是“系统脱敏法”(systematic desensitization)并运用此技巧治疗许多精神官能症。
最新研究
编辑神经成影技术:原理以及其研究应用
编辑前言
编辑以往的许多心理学研究中,都只能从一个人的行为反应,或是个人回报的观感来收集数据并进行相关分析,然而此种研究方法很可能受到个人主观情绪影响,造成结果无法客观呈现。神经成影技术是直接或间接对神经系统的结构、功能进行成像的方法,并直接从图像中读取资讯,可以排除受到情绪影响的叙述,使研究结果能更加客观。
本篇介绍了神经成影技术在不同方面的应用,包括从新的角度解释旧有基本理论或现象,如:情感效价理论、做白日梦等。透过神经成像的方式,可看到当身体进行所研究的活动时脑区的活化情形,并借由这些结果做更进一步的分析。神经成影技术亦可应用在疾病的研究上,如:阿兹海默症等。利用造影技术搭配其对应的追踪剂,便可观察脑部的生理现象,对人类掌控脑部疾病的发生原因有所助益,且由于神经成影是属非侵入式的诊断,对人体较不会造成负担。此外,在对立色彩神经的研究中,经由脑部对于不同颜色产生的讯号强弱差异,让神经成影技术除了应用在寻找神经反应的位置外,也能应用在确认神经反应的机制上,使目前神经成影技术已经成为心理学上不可或缺的研究方法。
原理
编辑神经成影技术(Neuroimaging)是泛指能够直接或间接对神经系统的功能、结构等进行成像的技术。而根据成像的模式,可大致分为两类:结构成像及功能成像。
- 结构成像:用来展现脑的结构,进而在医学上辅助脑部疾病的治疗。
- 功能成像:用来展现脑部使用时的各种代谢活动(包括感觉、运动、认知、情绪等)。常被应用在国内外心理学的研究上,也是本章主要的讨论范围。
目前研究上较为成熟且运用较广泛的成像技术有六种:计算机断面成像(Computed Tomography, CT)、扩散光学成像(Diffusion Optical Imaging, DOI)、核磁共振成像(Magnetic Resonance Imaging, MRI)、功能性核磁共振成像(Functional Magnetic Resonance Imaging, fMRI)、脑磁图(Magnetoencephalography,MEG)、正电子发射成像(Position Emission Tomography, PET)。
心理学的研究着重于脑部代谢活动的研究,因此会选择使用为脑部提供功能性造影的成像技术,故常见 fMRI 及 PET 技术被广泛运用在实验中。根据实验设计的不同,实验者经过分析、比较两者优缺点后会选择对研究较有效果的成影技术。而有时也会看见两个技术相互搭配,再将得到的成像进行整合分析的研究。
利用神经成影技术研究情感效价理论
编辑简介
编辑心理学上常以“情感效价”(valence) 的概念来量化某个心理指标,即利用座标正负向来描述一个人的正面及负面情感,或其他的心理意义。虽然情感效价是一个基本的心理学现象,却一直没有一个科学性的方法能够诠释这个概念。目前心理学上主要有三种解释情感效价理论的假设:
- 双极性假设(Bipolarity hypothesis):认为正、负面情感是由同一个脑区调控,并沿着效价座标单方向地增加或减少。
- 双价假设(Bivalent hypothesis):认为正、负面情感是分别由两个不同的脑区调控,并沿着各自的座标增加或减少,这说明一个人能够同时感受到正面及负面的情感。
- 情感空间假设(Affective workspace hypothesis):认为正、负面情感不是由特定的脑区管控。此假设借由引入“神经座标空间”(Neural reference space)的概念,说明一神经元可能在空间中同时影响正面及负面的情感活动,造成情感效价做出相对应的弹性变化。
本篇介绍北卡罗来纳大学(University of North Carolina)的学者们是如何利用 fMRI 及 PET 的整合分析(Meta-analysis)方法,探讨三个假设中何者最为合理。
实验方法
编辑研究者利用多级峰值核密度分析(multilevel peak kernel density analysis, MKDA),对空间中的峰值做叠合分析,以研究脑内活动的成像,而其中“一般性效价体素”(valence general voxels)被视为可同时在正、负价环境下被活化的指标,因此研究时需先排除具有该性质的脑区。
- 对双极性假设进行测试
- 双极性假设中,脑区的情感活动会单向沿着情价的座标移动,因此若活性变化情形符合 正作用 > 中性 > 负作用 或者 负作用 > 中性 > 正作用,即表示双极性假说成立。然而在研究中无法测试“去活性”作用是否存在于正作用或负作用,所以无法观察到中性 > 正价或中性 > 负价的对比,在这样的限制下,研究者便利用以下逻辑验证:若正、负价确实在座标上互为反向,那正价 > 负价的相对差值和正价 > 中性的相对差值便会有很明显的活性差异,因此若神经对于正、负作用所表现之活性大小差距大于正价与中性、负价与中性之间的差距,便符合双极性假说。
- 对双价假设进行测试
- 双价假设中,应有两互相独立的脑区分别负责正面的情感及负面的情感,即当情感从负价变化到中性时,同一脑区的正面情感不应产生变化(正价活性不改变),反之亦然。以负面情感脑区为例,由于具有“一般性效价体素”的脑区不符合双价假说的设定,因此先排除;接着若是能找到负作用 > 中性,且和正作用没有关联的脑区,或者正作用 > 中性,且和负作用没有关联的脑区,即可说明双价假设。
- 对情感空间假设进行测试
- 情感假设中,体素(voxel)为同时在正、负价环境下活化的脑细胞,然而比起中性,对于正作用或负作用活性较大的体素,仍可能对正、负价其中一方的反应较大。研究中使用到支援向量机(support vector machine, SVM)进行分类分析,随机抽取各 20 组正、负作用对比中性的资料进行测试,并验证情感效价的资讯是否符合大脑中的神经活化分布型态。
结果
编辑- 在大脑喙部前扣带回皮质及内侧前额叶皮质的脑区中可找到双极性假设的部分证据
- 测试双极性假设的实验中,可在大脑喙部前扣带回皮质(anterior cingulate cortex, ACC)及内侧前额叶皮质(medial prefrontal cortex, MPFC)的脑区发现正价相对于负价的活性比起正价相对于中性的活性,有更多的体素显现,可说明在此两块脑区中,符合双极性的假设。然而在其他的脑区中并没有发现负价相对于正价活性比负价相对中性的活性差异较大的证据。
- 无法找出双价假设的证据
- 测试双价假设的实验中,首先寻找是否存在正面情感脑区,然而却没有任何体素显示正价相对于负价的活性差异比负价相对中性的活性差异来得高,再利用相同的分析方法测试负面情感脑区的存在可能,也依然没有找到任何证据。这个结果说明了此假设无法合理说明情感效价理论,亦即正面、负面情感并非由两个脑区独立进行。
- 在左杏仁核及左前脑岛的腹侧、前侧脑区可找到情感空间假设的证据
- 测试情感空间假设的实验中,先寻找相对于中性,对正价和负价的反应较大的脑区,可说明情感空间脑区确实是由一般性效价的体素组成,而这些体素主要分布在两侧的前脑岛(anterior insula)、外眼眶额叶皮质(lateral orbitofrontal cortex)、杏仁核(amygdala)、腹侧纹状体(ventral striatum)、视丘(thalamus)、背外侧前额叶皮质(dorsomedial prefrontal cortex)、上半部前扣带回皮质等区域,并可将这些区域合称为“警觉网络”(Salience network),从解剖学上可以发现这些区域和自我意识的情绪掌控有着相当大的关联。
- 接着,在情绪空间脑区(正、负作用皆大于中性的脑区)中,分别寻找正价对比负价有较高的活性,或者负价对比正价有较高活性的证据,发现具有此种性质的脑区主要分布在左杏仁核及左前脑岛的腹侧和前侧,在此两块脑区中,可发现负作用略大于正作用,并皆大于中性,因此可得出这种正价和负价的活性反应,应存在相对的差异而非绝对的差异,符合情感空间假设。
研究结果显示,双极性假设与双价假设的证据极少,相较之下在具有一般性效价性质的大脑边缘系统及旁边缘系统,有较多支持情感空间假设的证据,由此推论情感效价可能在空间中同时影响正面及负面的情感活动,而非在各脑区之间独立运作。
利用神经成影技术研究 Spontaneous thought
编辑简介
编辑Spontaneous thought,又称为做白日梦、stimulus-independent thought、mind wandering,与日常生活息息相关,深切地影响我们行走时、进行简单工作时等等的心理状态,不只对于研究人们解决问题、创意思考有关,对研究忧郁反刍(Depressive rumination)、创伤后压力综合症(Post-traumatic stress disorder, PTSD)等等临床心理状态也很重要。而此心理状态与人类大脑预设模式网络(default mode network, DMN)的活化已经被证实有密切关系。在此介绍,UBC 与 Cornell University 学者综合分析历年以神经成影技术研究 Spontaneous thought 的论文,找出此种心理状态下的大脑活化区域。这项研究展示了 spontaneous thought 与大脑区域、网络的相关性,除了与大脑预设模式网络以及额顶控制网络(Frontoparietal control network),还有在其他脑区的活化为未来研究提供不一样的研究路线与目标。
实验方法
编辑首先,研究者制定关键词(如 Spontaneous thought、stimulus-independent thought、mind wandering 等等),搜寻历年相关的论文,并且只选择使用功能性磁振造影(fMRI)、正子放射造影(PET)作为成影技术的论文。接着制定了五项规则排除不符合的论文:使用 Talairach 或者 Montreal Neurological Institute(MNI)纪录特定巅峰活化中心(peak foci of activation)、非单一研究对象、研究对象为健康族群、涵盖研究对象自我检测 Spontaneous thought 的频率或深度、研究范围为全脑。上述筛选方式,最终选出了十篇符合的论文。
研究者接着统合所有座标轴为 MNI 座标。接下来,以高斯函数半峰全宽分析,找出非偶然的活化中心群聚,最终得出 157 个活化中心,然后,使用活化可能性评估(Activation likelihood estimation)进行综合分析这 157 个活化中心,并且视觉化,如下图。
结果
编辑右图显示 13 个与 spontaneous thought 显著相关的活化区域,包括部分前额叶皮质、前扣带皮层、部分后扣带皮层、双侧下侧顶叶小叶、海马回旁皮质等等。比较特别的是,研究者发现了数个在大脑预设模式网络的区域之外的活化区域:右侧第二体感皮层、左侧中脑岛、舌状回(Lingual gyrus)等等。这些活化区域在过去研究中比较少受重视,但是也扮演了重要的角色,例如舌状回,位于枕叶视觉区,涉及较高阶的视觉并且参与夜晚做梦的过程,而分析结果令人意外的显示夜晚做梦的活化状态与行走时 spontaneous thought 状态十分相似。
根据右下图,分析发现 spontaneous thought 的活化,与大脑预设模式网络以及额顶控制网络活化区域重叠,代表两者之间可能存在相关性。先前提及大脑预设模式网络 spontaneous thought 的活化已证实相关,而额顶控制网络与维系心理健康的活动区域重叠,也暗示了 spontaneous thought 与一些心理疾病的发生可能有关。
研究者归纳出许多特定区域活化与特定的 spontaneous thought 内容有关,例如:根据中前额叶皮质的活动规律,可以判断为不同“效度”(valence)的情绪活动。
神经造影技术在了解阿兹海默症上的应用
编辑阿兹海默症为一种常见的失智症,其中一种可能的成因与脑部神经元中的Tau 蛋白过度纠结有关。Tau 蛋白在正常情况下能够稳定神经元中的微管系统。若罹患某些疾病,可能会导致 Tau 蛋白被磷酸化,阿兹海默症患者的 Tau 蛋白的磷酸化程度就高达正常人的三、四倍。这种过度磷酸化的情况会形成神经纤维纠结(neurofibrillary tangle),影响神经元的传导情形并对其造成损害。另一种可能的成因被认为与β淀粉样蛋白(amyloid beta)在大脑的堆积有关。β淀粉样蛋白斑块的形成是阿兹海默症的特征,且出现的时机点早于症状的发作。若神经元产生β淀粉样蛋白的速度高过于清除的速度,即会导致β淀粉样蛋白于脑中堆积,形成斑块。
利用具有 Tau 蛋白专一性的正子放射造影(PET)追踪剂,能以非侵入的方法了解 Tau 蛋白的脑内沉积的模式,以及与β淀粉样蛋白、神经退化(Neurodegeneration)的关系。理想的追踪剂应该要符合下列七种条件:
- 与 PHF-Tau 蛋白具有高度亲和力
- 针对 PHF-Tau 蛋白具有高度的专一性
- 能够穿过血脑障壁
- 在正常的脑中会快速消散
- 中等的亲油性
- 与皮层下白质的非专一性结合低
- 低分解率
利用神经成影技术研究对立色彩神经
编辑简介
编辑加州大学的 Stephan A. Engel 使用核磁共振造影(fMRI),在人类大脑皮质上发现了色彩对比神经 (Color-opponent neurons )的存在。色彩对比神经对于研究人类对色彩的理解分辨上,有非常重要的作用。此项研究不仅让我们对色彩认知有更深层的认识,也赋予了神经成像技术新的功能与价值。
一般而言,视网膜上有三种视锥细胞,分别接收不同波长的刺激,而不同细胞接收讯息加总起来,才变成为我们所见到的各种颜色。这三种细胞分别为:长波视锥细胞、中波视锥细胞、短波视锥细胞,分别接收红色系、绿色系、蓝色系讯号。然而,除了上述较为大众所知的系统之外,还存在另一颜色认知系统,即色彩对立理论,其中包括下列三种视觉神经细胞:
- 红绿对立神经:受长波与中波视锥细胞输出讯号的差异值所刺激,即红色、绿色的量的差值,差值越高,刺激越大。
- 蓝黄对立神经:受短波视锥细胞与长波、中波视锥细胞两者讯号加总的差异值所刺激。
- 亮暗对立神经:受不同明暗程度的视觉杆状细胞讯号加总的差异值所刺激。
实验方法
编辑Stephan 的研究团队初步认为,大脑皮质视觉区的初级视觉区(primary visual cortex, V1)含有许多色彩对立神经,他们利用一连串核磁共振造影相关的研究来证明此事。
首先,他们用核磁共振造影测量受试者看到不同颜色、不同对比度下,产生的神经讯号,发现人脑对高对比度的颜色反应比较强烈,对不同颜色的反应大小也不相同。核磁共振造影条目连结中的图片为其中几项测量结果,可以见到,人脑对于高对比的图案都会产生较强的反应。
- 核磁共振造影 :核磁共振造影测量人脑对不同颜色与对比所产生的脑波讯号,横轴为时间,纵轴为脑部反应讯号强度。研究者依序展示给受试者对比度低到高、黑白到彩色的图案。
接着,研究者计算出对所有颜色都可以产生相同反应的刺激,而此反应强度为上图实验的最大反应强度的一半。为了产生相同反应强度,实验会针对人脑较不敏感的色彩,给予更强的刺激,对较敏感的颜色则给较弱的刺激。如此一来,相同刺激、相同反应强度,只要用核磁共振造影测量不同视锥细胞的讯号量,就可以计算不同波长之间的关系,了解是否有色彩对立神经参与作用。以下视锥细胞输出讯号图是此实验结果,可以发现,刺激曲线会构成倾斜的长方形。
- 视锥细胞输出讯号图:横轴是长波视锥细胞的输出讯号变化比例,纵轴是中波视锥细胞的输出讯号变化比例。正值代表讯号增加,负值代表讯号减少。
结果
编辑研究者发现当长波、中波视锥细胞都受到强烈刺激,大脑皮质的反应不是很激烈。相对的,在长波视锥细胞受到较强刺激,中波视锥细胞受到较弱刺激时,大脑皮质却表现出强烈的反应,因此当两视锥细胞的差值较大时,大脑皮质才会有较显著的反应。此结果间接证明了色彩对比神经在大脑皮质的存在,这正是蓝绿对立神经的特征。这项研究赋予了神经成像技术新的用途:不只是找出神经反应的位置,而是进一步确认神经反应的机制。
研究组间变异的新方法:增加结果正确性的策略
编辑前言
编辑目前经常用来检测组间变异性的工具为 Anova(Analysis of variance) F test,当检验结果为不拒绝虚无假设时,Anova F test 效能很好,但若结果为拒绝虚无假设时,有时候会检测力不佳。因此,我们将介绍一些最近陆续被发表的测试,不论在检验结果为不拒绝虚无假设或拒绝虚无假设时,都可以保持良好的检测力。 使用 Anova F test 分析时必须满足三项先决条件:数据具有常态性、独立性、变异数同值性(即母体为正态分布、样本为简单随机抽样、各样本必须取自变异数相等的母群),而以下三种情况经常造成 Anova F test 无法分辨真正的差异性:
- 数据存在异常值、离群值(Outliers)
样本中的离群值(极大值或极小值)容易造成 Anova F test 无法检测出真正的变异性,且根据现在的研究指出,离群值(Outliers)是很常见的。通常母体出现离群值时,会大大降低 Anova F test 的检测力。
- 不对称性(Skewness)
比较组与组之间的数据时,若有一组数据为不对称(如:右尾分布(right-tail distribution)或是左尾分布(left-tail distribution)),数据对称时会呈现钟形分布(bell-shape distribution),极可能造成 Anova F test 检测力低落。
- 组内的变异数 (Variation among each group)
若样本来自两组变异量不相同的群体,便违反 Anova F test 的三项先决条件,同时也会影响检测力与结果的正确性。
替代的检测方法
编辑1. 检测中位数(Medians)
编辑把所有数按照大小依序排列,若样本数为单数,中位数为数列正中间的数值,若样本数为偶数,则为最接近中间的两数值之算术平均数。相较于 Anova F test 比较的是组间的平均数,中位数较不受离群值的影响,也减少了不对称性对检测结果的影响。
当检测母体为正态分布,且无离群值时,中位数检测法的检测力会比 Anova F test 低。此时可使用下述方法。
2. 20%修饰法(20% Trimming)
编辑20%修饰法是把数据依序排列,去除最大的 20%及最小的 20%数值,再根据剩下的数据比较组间的平均数。当我们去除越多边界值时,不对称性造成的不良影响就越小,当去除边界值 0 到 20%时,检测力有显著的成长,在 20%之后其成长效果就趋缓,因此以 20%为最好的去除比例。同时,去除边界值也可以避免离群值造成的影响。 Wu(2002)用了 24 篇论文的数据来比较许多检测方法的效力,然而他发现并没有任何一个检测方法是最有效力的,但在所有使用的检测方法中 Anova F test 的检测力明显是很薄弱的,而使用 20%修饰法的检测力是最佳的。
虽然 20%修饰法是个相当好的检测方式,但仍有许多学者为此争论,认为有许多更好的替代的检测方式。例如非参数(Nonparametric method)、排名(Rank-based method)都在这几年陆续被发表。还有许多像是只剔除离群值、或是为了避免不对称性而只剔除最大的 20%数据等。以上探讨的方式都皆为组与组之间的比较,但若今天面临的问题是 A 组高分群与 B 组高分群的比较、A 组低分群与 B 组低分群的比较,以上方法皆无法得到有效力的结果,这种问题可以被 Shift function 这种检测方式解决,这个方法同时也是以上所述中,有潜力成为最具有检测力的检测方式。
女性主义对心理学研究方法的影响
编辑女性主义心理学批判以男性为标准的心理研究。后现代女性主义心理学认为,在心理学的研究中,传统的实验方法透过实验条件的安排可以得到实验者希望得到的结论。
传统的心理学研究将受试者视为脱离社会和文化背景的抽象的存在,然而事实上实验者无法脱离社会背景,其行为方式必然受到社会背景的影响。女性与男性在这样的实验情境中所产生的行为差异,被解释为内在的心理特性所造成;研究的结果又被用来解释女性在某些方面天生不如男性,为维持妇女在社会上的从属地位提供了科学的根据,这是男性中心主义偏见的例证。因此,传统实验方法有其缺陷,应该用其他方法来加以弥补。女性心理学推崇用多元方法来增加研究结论的有效性,以便使心理研究结论更贴近女性生活的现实。
德国精神分析师卡伦·霍尼(Karen Horney,1885~1952)被视为女性心理学的先驱,她不同意弗洛伊德有关男性和女性心理固有差异的观点(例如:阴茎嫉妒理论),并将这些差异归因于社会和文化而不是生物学。霍尼因此提出了与弗洛伊德相反的“子宫嫉妒”(womb envy),认为这类情绪可能助长了对女性的社会地位的压制,并推动男性在其他生活领域(如商业、法律和政治)取得成功。但她同时认为,子宫嫉妒不是男性天生的心理特征,而是当男性认为他们并没有像他们想象中那样掌控和强大自己的生活时产生的。[3]当然,这样的说法可能存在争议,却着实在过去以男性心理学家为主的心理学研究上做出了空前的突破。
本土研究
编辑本土心理学崛起:贴近自己的心理学
编辑此篇章中的“本土”意指华人社会。本土心理学研究者杨国枢先生(2005)曾以一段话精辟解释本土心理学的定位:“本土心理学是一种以科学方法研究某一特定族群团体或社会文化之中人民的心理与行为所发展来的心理学知识体系,但研究历程中所采用的理论、概念、方法及工具必须与所探讨的本土心理或行为现象及其生态的、经济的、社会的、文化的、及历史的脉络高度契合、符合。
自从科学革命、工业革命后,西方国家在国际上占领优势地位,而在心理学研究也是如此,率先发展了心理学的科学体系。1970 年代的台湾学者开始发觉,由于过去的政治与历史因素,台湾在各个方面——研究亦然——皆严重地受西方影响,其中心理学研究受美国影响尤深。这使得当代心理学研究过度依赖西方理论,缺乏自身独特性,且忽略了不同社会文化下人类行为的差异。即便研究对象是华人,但研究使用的方法、观念、理论皆沿袭西方,研究成果可能因此偏颇而无法成为有效的资料,或是无法成功解释华人文化现象,如同“失去灵魂”。在怀疑西方的心理学研究对当地的适切性之后,港、中、台学者开启了寻找“灵魂”的旅程,三地各自有不同的发展,又交互影响激荡,以脱离欧美或非本土的框架、并建立与本土契合的系统。
本土心理学研究条件:本土化契合
编辑身处于相同环境的人们,往往有相近的生活体验与视野;但散落于世界各地的成员,便不见得拥有相似的经验。当我们的研究方法是直接套用国外的东西而来,这些西化知识是不是能够契合我们的社会文化因素,就成为一个争议点。举个简单的例子,2015 年的电影“我的少女时代”勾起台湾民众的青春集体记忆,横扫票房、掀起风潮;然而小虎队、溜冰场等元素在当今其他国家的电影里,便可能无法引起共鸣。再举个例子,本章节写本土研究,即便翻译成其他语言,一到非华人地区,读者极有可能兴致缺缺、直接跳过。而“本土化契合”正是让当地人来研究当地人。经由这样的机制能保证研究者之问题、方法理论,高度契合被研究者。
本土化研究之原则
编辑为了有效进行本土心理学研究,心理学者提了消极性的“七不”与积极性的“十要”准则。前者为消极避免妨碍心理学本土化发展,后者则为有利且积极捍卫心理学的本土化。
秉持这些原则的原因:
心理学毕竟是以人作为研究对像,在研究之前就应该理解个体之间或者文化之间的差异性。更何况是本土心理学研究以地域为主轴的研究,更应该以谨慎的态度选择理论、方法、变因,避免先入为主。
“七不”
编辑一、不套用他国理论与方法
- 在进行本土的心理研究时,不要套用他国学者的理论及方法,尤其是针对他国人民行为的研究。
二、不忽略他国理论与方法
- 本土化并不是全然地排外,学习者依然可以引用外国建立的概念、参考外国文献,再与本土研究互相对照援引,进而整合成适用于本土之理论。
三、不排斥他人所用之方法
- 做本土研究的心态应是对于所有方法都持包容态度,只要能有效地探讨华人心理,任何研究方法都应予以尊重、悉心探讨,避免错失适用理论。
四、不采用跨文化研究策略
- 进行研究时,不要与他国文化做比较,否则可能再次陷进西方观点。
五、不采抽象性过高的项目
- 不要研究太抽象的题目、或者范围太大的议题。
六、不要采用外语进行思考
- 语文对于思考的面向、内涵有很大的影响,研究时应以本土之思维理解、诠释,以期保有清楚的逻辑。
七、不将学术研究泛政治化
- 虽政治与生活息息相关、密不可分,但研究者应切记自己立场的中立性,不因个人的主观意识、利益的影响,而使得研究的方向、理论,偏离了轨道。
“十要”
编辑一、要忍受悬疑未决的状态
- 需要研究者耐心地思考当地社会文化因素与研究题目之关联性。一旦心急,可能会使用西方的现成观念,不仅失去了研究的本土性,更阻碍了自己本土化的学术思考。
二、要充分反映华人思想
- 在研究时,须将自己本土性思想、认知充分反映在问题界定、概念分析、方法设计、工具制作、结果解释之中,以有利开创属于本土的研究方法。
三、要批判地运用西方理论
- 在研究的过程中,若真的有采用西方概念的必要,则要以谨慎的态度,仔细地分析所探讨之心理与行为,其根本的内涵以及特征。
四、要强调社会文化的脉络
- 考虑到行为发生的背景,才能合理地解释其因果关系。
五、要研究特有的心理与行为
- 在选择研究课题方面,尽量从华人特有的心理与行为来切入(如孝道、关系、缘分、面子、人情等),能避免习惯性套用西方概念,方能再更进一步创造新的本土理论。
- 而在解释特有现象的同时,最好能采用其现象在当地的民俗性词语,如此一来,才可保留概念之本土性及意义。
六、要详尽描述研究之对象
- 进行研究的同时,我们需要详细的资料,也要力求在正当的方法及程序下,纪录、研究现象的本质。
七、要同样重视内容与机制
- 前面有提到应该要详尽研究之对象,指的是行为的内容;而我们也必须重视行为的原因,即背后社会结构的影响。内容与机制缺一不可,否则建构的理论会较为薄弱。
八、要与华人学术传统衔接
- 在学术上,有关华人的心理学术研究,要尽量与华人以往的传统衔接,而非勉强地和外国的心理学、思想哲学作连结。
九、要兼顾传统面与现代面
- 随着时间推移,传统与现代的时局不同。以现在的华人作为研究对象,应注意其变迁的过程,兼顾传统与现代的面向,并探讨变迁的因素,确切了解事件的演变。
十、要兼研今人与古人的心理
- 建立本土理论时,除了要研究现代华人,还要研究古代人的心理,建立更宏观的本土心理学。
本土研究之目的
编辑有鉴于华人社会的形塑过程与西方欧美国家大相径庭,华人心理学界希望借由设计适合东方社会的心理学研究方式,让研究更贴近真实情况。考虑华人社会的文化、社会体系和心理间的交互作用,掌握华人行动背后的意义,进而找到适合研究华人心理概念的设计,发展一套适用的模型或理论,建立东方的心理学研究体系。因此研究者需要将文化、历史脉络放入研究的思考框架中,才能厘清影响个人行为的因素。在研究方法上,应采取“多元典范的观点”,视问题性质的不同,采用不同的研究典范,尽力于对问题能够获得“由不同世界观源与生俱来的全面性了解”,方能彰显学术主体性及独立性。
本土心理学与心理学的本土化的问题
编辑心理学的发展经历了“整合—分裂—再整合”三阶段。现今,国内心理学正处于第三阶段——再整合。
而国外之研究亦有其不同阶段,以及各学派的分立。在了解本土之前,我们亦必须观察并了解西方心理学的分歧。 科学心理学创始人冯特(Wundt)提倡统一的心理学。自冯特以后,心理学逐渐往不同方向发展,大体而言分为实证主义立场的心理学和人本主义立场的心理学此二派。简单来说,就是以科学或人性为中心的差别。两种学派各自为阵,互不相让,然双方皆是为了把自己的理论成就推向巅峰。不可否认,两种学派的积极研究为西方心理学的进程做出了巨大贡献,但另一方面,因两种学派的坚持己见,双方始终无法进一步沟通、融合,导致心理学的学科性质越来越不统一,造成“小心理学观”。 而当今学者若想建立起属于东方、华人自己的心理学,首先必须使研究方法本土化。因研究方法是一套理论体系的标志,是判断一套体系是否成熟的关键,但若过分着重研究方法的本土化,必然使本土心理学研究形同虚设,无法真正与现实生活契合。此外,研究时也应当铭记西方心理学走向分化的教训,更多以开放的心胸与其他研究者交流,并时时自省。如此一来我们必能创造更完整、更兼容也更精准之本土心理学知识。
本土心理学之困境
编辑西方心理学的强加使用
编辑将适用于西方人的心理学概念与测量工具加以翻译,强用于非西方人民,就以为测到相同的心理结果,是任何研究者都不应犯之研究大忌。因此,本土心理学正是强调不要直接套用美欧心理学的理论、概念、方法及工具。
本土心理学者后继无人
编辑即便心理学本土化运动如火如荼地进行,黄光国先生不讳言本土心理学的发展遭受许多困难。各国研究本土心理学的学者寥寥无几,因此当成果遭受许多主流心理学研究者的批判时,也无他人发声、或继续钻研。后继无人,便无人能继续开拓研究的深度广度。菲律宾就是一个佐证,在学术圈最早倡导本土心理学的学者为菲律宾的 Enriquez,当初曾是一位受人景仰的大师,可惜在最灿烂的年华就殒落了,连带使得当地心理学发展面临停滞不前的窘境。
不完整的心理辅导咨商系统
编辑杨国枢认为亚洲与华人地区的心理辅导与咨商专业长期引用来自西方的理论与技术。无论在学术研究、课程教学或实务工作上,都以西方的理论学派与研究结果为思考与工作的依据,忽略了东方文化因素,没有建立起一个符合亚洲与华人地区文化的心理辅导与咨商专业的学术传统与实务环境。
本土心理学的未来展望
编辑本土心理学将兵分两路
编辑黄光国先生认为,依目前形势,在可预见的未来里,会发展成一派以西方科学实证为宗,重视自然科学研究的成果,异于西方理论的架构,较易为学术主流所接受;另一派以素朴哲学观为基础,虽可能较无法与国际心理学家互相交流,然仍有其大放异彩之处。黄光国也建议亚洲与华人地区的本土咨商心理学研究的策略,可以利用东方哲学中的传统智慧为题材,并以西方科学研究的知识论为基础,建构一套既能代表普世人类的心智,又能表现特定文化人群的特殊心态之本土心理学理论,最终进行能验证本土心理学理论的实征研究。
李瑞玲提出三点未来之展望
编辑- 应该进行关于中国心理学历史发展之研究
- 提出可连结于其他学门,本土心理学的研究层次与方法
- 建立一套本土心理学研究的方法论
对于最后一点,李瑞玲更强调:“即使在中国土壤孕育出来的方法论,并不应只适用于本土的社会与学术生态。因为学术本土化的目的,并非只是为边陲社会的学术自主性做民族文化式的诉求,而是经过彻底自我反省后的自我解放”。亦即本土化(Indigenous)研究并非等同于在地化(Localized)研究,而是要建构既能代表普世人类心智,又能表现特定文化族群的特殊心态。此种心理学理论,才是本土心理学研究所要努力方向。
结合西方和本土的策略
编辑郑伯埙在《华人组织行为研究的方向与策略:由西化到本土化》的论文中提到,华人的本土化研究,可结合西方和本土的策略,进而取长补短:其一为本土化研究策略,另一是跨文化策略,最后为整合性策略。采用本土化策略时,刚开始是以民族志做参与和观察,而后以个案研究等质化研究方式,来长期观察某文化下的组织行为。应先为厚实的描述,再由此归纳出重要的研究构想与命题,进而形成理论,而后进入科学研究历程的循环。
代表人物、组织、其他发展
编辑代表人物
编辑杨国枢教授
杨教授1959 年毕业于国立台湾大学心理学系,尔后赴美进修并取得美国伊利诺伊大学文学硕士学位与哲学博士学位,是台湾第一位心理学博士。杨教授毕生致力于发展人格与社会心理学研究,尤其在本土心理学研究上,杨教授看出华人心理学研究的盲点——全盘套用西方心理学的理论与方法,于是他积极倡导与推动贴进华人社会文化特征的本土心理学。辛苦耕耘四十多年后,其丰富、多面向的研究成果为台湾本土心理学的研究奠定扎实、稳固的基础,相关的理论建构与研究方法亦逐渐发展成熟。
杨教授在理论建构方面,建立了“华人社会取向与个人取向理论”与“人类基本需求的双 Y 理论”等两项人格与社会心理学理论。在研究方法与工具方面,则编制了家族主义量表、成就动机量表、自尊量表、自我概念量表...等等本土化测量工具。
至今,杨教授仍坚守学者岗位,致力于华人本土心理学的发展,包括参与相关研讨会与发表著作,更主导多项大型研究计划,盼能竭尽己力贡献学界。
杨教授跟中研院民族学所的所长文崇一先生合编了一本书“社会及行为科学研究的中国化”,主要思考两个议题:心理学理论建构的本土化;知识跟理论建构的自主性。
黄光国教授
黄教授从 1980 年代之初,开始参与心理学本土化运动,是“华人本土心理学研究追求卓越计划”的主持人。他著有《儒家关系主义:哲学反思、理论建构与实征研究》(黄光国,2009);《Foundations of Chinese Psychology: Confucian Social Relations》(Hwang, 2012)。在 Foundations of Chinese Psychology 一书中,黄教授所主张的“文化系统”(Culture System)研究取向,将儒家文化视为整体系统,可以避开“泛文化向度”(Pan Cultural Dimensions)研究取向上的缺失。“泛文化向度”研究取向虽然能累积许多琐碎的实征研究成果,却倾向于使非西方文化面貌模糊,丧失其文化的可辨认性(Cultural Identity)。而“文化系统”研究取向则可使华人了解其文化传统,并获致清晰的文化认同感。此种研究取向以“多重哲学典范”作为基础,其核心为“本体论的实在论”,有坚实的哲学基础,可以推广到其他非西方国家,协助他们建立自主的社会科学。
郑发育教授
郑教授毕业于日本京都大学哲学系,拜京都学派西田几多郎门下,专攻京都学派及德国哲学,战后专研实验心理学,是台湾实验心理学的奠基者,同时也是台湾大学心理系的创立元老。一生不断培育心理学优秀人才,如吴英璋、余德慧等人。郑发育早年接触德国思想例如德国观念论、完型心理学(Hullian psychology)等,使得从事知觉心理学研究时,大抵以知觉的统觉理论为基础。曾赴美国耶鲁大学心理学实验室短研一年,接触到霍尔学派(Hullian psychology)的行为学派,并且设计一系列实验,为排湾、赛夏、阿美族的色彩好恶、智力、及人格测验提供比较,也曾将心理设计测验导入工商适性研究上。
苏芗雨教授
苏芗雨(1902 年 9 月 11 日-1986 年 6 月 25 日),名维霖,以字行。北京大学哲学系毕业、东京帝国大学大学院肄业。曾在校师承李大钊、蔡元培、李石曾、陈大齐等,战后随国府返台,任行政长官公署参议,并受聘为国立台湾大学哲学系正教授,主持哲学系心理学研究室,后任台湾大学心理学系创系主任兼图书馆馆长,为台湾心理学及哲学学者。
誉为心理学拓荒者的苏芗雨,赴京就读哲学时受五四运动影响,积极鼓吹白话文,主张中国白话文做为台人书写系统,并受胡适、陶行知、金岳霖等实用主义者影响,专研发展及教育心理学[5][6],著有《心理学原理》、《心理学新论》、《心理学新论增订本》等。治学严谨、待人谦和,与杨国枢等后进有亦师傅亦友的关系,“但欲培植佳子弟,富贵于我如浮云”为其一生最佳写照 。
余德慧教授
余德慧(1951年1月10日—2012年9月7日,被誉为华人心理学大师。毕业于国立台湾大学临床心理学博士,1987年赴美国加州柏克莱大学进行博士后研究。1989年,返国任教于国立台湾大学心理学研究所,他与恩师杨国枢教授在台大心理学系开设了全台湾第一门“生死学”课程,深受学生喜爱。
曾担任台湾第一本人文心理杂志《张老师月刊》总编辑,开创了新颖的本土心理学研究领域,多次获得行政院新闻局颁发的杂志类金鼎奖。其作品包括《生命梦屋》、《情话色语》、《观山观云观生死》、《生命宛若幽静长河》、《生命史学》和《生死无尽》等。
组织
编辑华人本土心理学基金会:1997 年由一群从事华人心理与行为研究的工作者所发起成立。其性质为一非营利的学术公益团体。此会主旨在于促进华人心理学家以本土研究定向,进而发展能够贴切描述及了解华人心理、行为及生活的学科,并凭以贡献本地社会。此会提倡的“本土研究定向”是有鉴于有关华人心理之研究深受西方心理学的概念及方法之束缚,其成果常与当地社会的实际情况及需要脱节,因而易沦为点缀的学科,不能凭之造福自己的社会。采取本土研究定向,需要研究者摄取本土哲学、宗教、历史等人文科学及社会学、心理学、人类学等社会科学的养份,以全面了解华人的心理、行为及生活。此基金会因此认为加强各人文暨社会科学的合作及交流,是推动本土研究必须走的道路。现今几个华人社会具有其共同的文化传统,但也各自生活在当地特殊的政治、经济、社会体系之中。在这些地区进行合作或跨地区的比较研究,可以多方面了解传统文化在现代社会所扮演的角色,使华人本土研究的内容更丰富、更完整。同时,各华人社会也可彼此借镜,以提升其研究水平。
华人本土心理学推动委员会:持续推广有关华人本土心理学的相关理念知识和理论。
其他发展
编辑《本土心理学研究》期刊:华人本土心理研究基金会出版,1993 年创刊,半年一刊。为纯学术性的中文期刊,主要发表采取本土化研究观点与策略所完成的论文。目前仍持续出刊。
“华人本土心理学研究追求卓越计划”:总计划主持人黄光国教授,向教育部申请参加“追求卓越”的计划,提出“华人关系主义”做为理论架构,并建立了一套自我规约的机制,希望能促进华人本土心理学研究水平的大幅提升。
本土心理学学案
编辑本土心理学学案研究一: 杨中芳教授与她的中庸心理学研究
编辑杨中芳,台湾大学心理学学士,芝加哥大学心理学博士。先后任教于美国、台湾中正大学和阳明大学、以及香港大学。退休后在中国广州中山大学和中国社会科学院推动西方心理学教学及本土化心理学研究。杨中芳的代表性著作有《如何研究中国人》、《如何理解中国人》以及《中国人的人际关系、情感及信任》等。
作为华人本土心理研究基金(香港)的主持人,杨中芳晚年最重要的本土心理学研究,乃探索中国传统文化的核心部分,即所谓中庸的思想对中国人心理与行为的影响。
杨中芳和赵志裕于1997年提出采用心理学构念化的方式,将传统思想的中庸构想为类似于元认知的一套“实践型”思维方式,称之为中庸实践思维。此后,杨中芳对这个“中庸实践思维”不断细化、更新,扩展为一套包含集体文化思维、个体心理思维(生活哲学、具体事件处理、事后反思/修正)和心理健康等三大层面的中庸实践思维体系,并孕育影响了3种中庸思维量表的开发。
杨中芳强调中庸心理学的研究初心并不在复古,而是在于探研一个仍然在当今华人生活中发挥重要作用的思维方式、价值观以及行动策略。故中庸心理学研究虽然采用西方实证研究方式及量表开发,但偏重的却是本土化心理学的研究思路, 即杨国枢所说的,是用华人自身的思维方式及价值体系,来理解华人生活现象的心理意义。
生活应用
编辑心理学研究法最常被使用的研究法分成五种。分别是个案研究法、实验法、观察法、相关法、调查法, 以下一一介绍并举出生活实际应用案例。
个案研究法
编辑研究案例──研究法的谬误-药越贵越有效?
在医学和心理学的许多疗法中,安慰剂效应(Placebo Effect)是一个著名且常见的现象。安慰剂效应指的是病人在服用没有药理作用的物质后,仅仅因为相信它能治病而出现疗效的现象。反安慰剂效应(nocebo effect)则是指人们预期会有负面结果,因而促成相应的症状或负面效应,甚至导致原有症状恶化。例如,有些人对于价格较低或体积较小的药物,较不相信其效用;或者认为价格较高的药物会有更大的副作用。
美国辛辛那提大学(University of Cincinnati)的神经学家Alberto Espay针对安慰剂效应进行了一项实验。他挑选了12位罹患巴金森氏症(Parkinson’s disease, PD)的病人,先让他们停用原本的药物“左旋多巴”(Levodopa),并告知他们有两种新药可以帮助制造多巴胺。实际上,这两种“药物”都只是生理食盐水。研究结果显示,在运动技能测试中,接受较高费用药物治疗的病人,其测试结果比接受低费用药物治疗的病人较佳,显示病人主观上相信服用较贵的药物会得到较好的结果。然而,不论哪种安慰剂,其效果仍不及服用常规药物左旋多巴。
安慰剂效应在心理治疗中也很常见。许多有轻度和中度心理问题的人,在接受心理治疗后表示他们的情况好转,但控制研究证明:这部分康复比例是安慰剂效应与时间推移(自然康复现象)共同作用的结果。大多数有疗效的治疗方法都是原有疗效和安慰剂效应的结合。
实验法
编辑赫尔曼.艾宾豪斯的“遗忘曲线”
赫尔曼.艾宾豪斯(Hermann Ebbinghaus,1850-1909)是德国的心理学家,也是第一个用实验方法研究记忆衰退的心理学家。为了能够客观地研究记忆与遗忘,记忆的实验必须采用标准化、一致性的测验项目。因此艾宾豪斯发明了两千多个无意义单字,把一个母音嵌入两个子音之中,并随机抽出若干字来做为记忆实验的内容。他以自己为实验对象,每次实验取出若干单字,随机排序后,测验自己需要重复几次才能完全记住这些字序,并间隔不同的时间测验自己的记忆与遗忘状况。同时也测验复习之后,需要多久时间才能再重新完全记住这些字序。艾宾豪斯从实验结果得到了一些遗忘规律,得出著名的“遗忘曲线”,是使用科学实验方法,成功用量化呈现遗忘的特性的案例。
(请注意:虽然艾宾豪斯的遗忘曲线是一个被多次验证和应用,且被视为可复制的心理学现象,但其也存在一些问题,包含:
1. 外部效度的问题:艾宾豪斯的原始实验主要是针对他自己进行的,因此实验结果若要推广到其他人身上,在外部效度上会有一定的限制。
2. 实验设计的问题:许多后续研究指出,遗忘曲线可能受到实验设计的影响,例如学习材料的性质、学习方式等,这些因素可能会影响遗忘曲线的形状和速度。
3. 个体差异的问题:每个人的记忆和遗忘模式皆存在差异,因此遗忘曲线在不同个体间的适用性可能会有所不同。
因此,遗忘曲线虽是一个被广泛研究和讨论的现象,但在应用和推广时需要考虑到不同的情况和限制,以确保其可靠性和准确性。)
观察法
编辑企业界的“神秘客”
《远见》杂志每年发布的“服务品质调查”,共动员二十名具国际证照的“神秘客”实地调查十九类不同行业企业。主要观察员工服务态度、热诚表现,约占总评分七成五,出状况测试的魔鬼题占总评分二成五。2021 年共评比两百八十三家企业门市,规模历年最大。以神秘客至 LEXUS 测试为例,保养过程中神秘客宣称手机没电,LEXUS 维修技师立刻大方出借他的手机,令神秘客感受到“把客人当朋友”的服务态度。除此,神秘客保养汽车离去后,还去电指称于车内捡到螺丝,车厂接到通知后便立刻安排再次入厂检修。
值得留意的是,神秘客观察法亦有其局限性,即实验设计与样本采取上可能有所不足,所得出之结果未必具有普遍性。例如:在神秘客观察法中,研究者无法控制所有影响服务体验的变数,比如店铺繁忙程度、员工个人状态、其他顾客行为干预等,这使得很难断定测试结果是由于实际服务品质本身还是外部因素介入。此外,因为培训神秘客并进行消费测试需要相当的时间与金钱成本,所以神秘客观察法只能获取少数样本,进而可能导致测试结果的代表性受到质疑,盖其无法覆盖所有潜在的顾客消费体验
餐饮界的“神秘客”
《米其林指南》是餐饮界中相当具有权威的一美食评鉴书刊。透过动员受过法国完善训练的“神秘客”实地走访各种不同的餐厅,依照五项标准选出餐厅名单,包含食材品质、食物准备技巧与口味融合、创新程度与厨师理念。且为了保持客观、公正,“神秘客”之身份、行为皆与一般顾客相同,并不会有故意掉落叉子等引发餐厅(受试者)注意的刻意行为。
游戏界的“作弊问题”
“怀维尔”(Whyville)是1999年创立的一款为8岁以上儿童而设的教育游戏,它似乎不像是一个需要调查作弊的地方。但是据《作弊:在电玩中占便宜》(Cheating: Gaining Advantage in Videogames)一书的作者、加拿大蒙特利尔市康考迪亚大学(Concordia University)的游戏研究与设计和传播研究教授米娅·康萨尔沃(Mia Consalvo)说,它却成为了作弊无处不在的一个证据。“怀维尔”的开发者在开发过程中发现了一些不寻常的事——这是一款68%的受众为8-13岁女性的游戏,但是作弊在当中却相当盛行。针对这个现象,康萨尔沃提出一种叫做游戏资本的概念,以解释发生作弊的原因。在游戏中玩得好会得到社交声望,提升在群体的地位,因此好的玩家想要维持她的地位,害怕失去现有的资本,所以有时就必须透过作弊的手段保住一切。而“为了保持地位而作弊”的想法其实有证据支持,比如:来自加拿大圭尔夫大学的凯利‧里奇曾研究出大多数的作弊行为都是由成绩较好的学生作出的(60%的违规者分数都在80%或以上)。
相关法
编辑睡眠与学业成绩的相关性
挪威一项针对学生睡眠情况与学业成绩研究中指出,睡觉时间、睡眠时数以及睡眠缺损都与学业成绩有关,睡眠缺损越严重,学业成绩就会越低落。这项调查包含了近八千位青少年,在这项研究中学业表现最好的那群学生,是在晚上 10-11 点间睡觉、每天睡 7-9 小时、睡眠缺损少于一小时。
有人会指出,不一定是睡眠时间不足导致学业成绩低落,也可能是因为学业成绩较差,所以需要花上更多时间熬夜赶上,至于成绩好会念书的人当然早早念完就睡了。因为本研究采用的方法是相关性研究法,结果只是代表相关性,其因果关系仍须透过更近一步的数据分析以及研究才能确定。
2019年的一篇论文对睡眠品质、时间和大学生的学术表现进行了讨论[4]。论文发现更好的睡眠质量、更长的睡眠时间和更持续的睡眠与更好的学业表现相关,睡眠指标解释了睡眠可影响学术表现到标准差的25%,相较于男性,女性展现出更好的睡眠质量和较少的睡眠不一致性。实验的研究方法是让实验者穿戴活动追踪器,使用Fitbit设备进行睡眠追踪,Fitbit设备的数据记录如下:每5分钟心率;每15分钟步数、行程、爬楼梯层数、消耗的卡路里和活动水平测量;以及一天中每次睡眠的持续时间和质量,进行各种统计分析,以探讨睡眠指标与学业表现之间的关系,以及睡眠与学业成果在性别差异方面的情况。平均数据可得出,学生们于凌晨1:54入睡(中位数为凌晨1:47,每位参与者平均入睡时间的标准差为1小时),并在上午9:17起床(中位数为上午9:12,每位参与者平均起床时间的标准差为54分钟)。睡眠时间和学生成绩之间存在显著的正相关(r(86)= 0.38,p <0.0005),表明睡眠时间越长,总分越高。同样,学期内平均睡眠质量和总分之间存在显著的正相关(r(86)= 0.44,p <0.00005)。对于每位参与者,睡眠不一致性定义为参与者每日睡眠时间的标准差,因此更大的标准差表示睡眠不一致性更高。睡眠不一致性与总分之间存在显著的负相关(r(86)= -0.36,p <0.001),表明睡眠时间的不一致性越大,总分越低。
避孕与家用电器相关性
台湾过去曾经做过一个大规模的调查,研究哪些因素与人们是否进行避孕有关。一群社会学家和医学工作者组成庞大的研究队伍,为了得知什么变数最能有效预测人们进行避孕,而广泛搜集了诸多行为和环境变数的资料。搜集资料后,他们发现──家中家电的数量与人们是否使用任何方法避孕的相关性最高。虽然家电数量和是否使用任何避孕方法之间,似乎存在着密切的关系,这个研究结果却不会让人们认为用家用电器就能够解决怀孕问题。这个例子表达了一个很重要的基本原则:有相关不表示一定有因果关系,也就是相关不蕴涵因果(Correlation does not imply causation)。除了要考虑两个变数关系的本质与研究者想理解的问题是否相关之外,还必须再考虑到第三变数问题与方向性问题。
古德柏格与癞皮病
二十世纪初的美国南部,数以千计的人遭受一种称为癞皮病(Pellagra)的皮肤病侵袭。当时研究资料显示,此一病症与卫生条件有关。因为在南卡罗来纳州的斯巴坦堡(Spartanburg)市内,未患有癞皮病的家户似乎都装设了自来水及污水管道系统,也就是卫生条件较好。此相关恰好呼应当时一个传染病的病理理论:由于卫生条件较差,污水处理不当,使癞皮病容易透过感染者的粪便不断传播。 不过古德柏格(Joseph Goldberger)医师对这种解释不以为然,他反而认为癞皮病是营养不良引起的。因为美国南方地区普遍比较贫穷,人民多以当地盛产且便宜的玉米作为主食,较少吃肉、蛋、奶等高蛋白含量的食物。
古德柏格认为污浊的环境和癞皮病之间的相关不具因果关系,之所以会出现相关性,是因为有水管线设施的家户通常经济条件也比较好,而这种经济差别也反映在日常的饮食中。
古德柏格假说不仅建立于观察变数间相关系数所作出的判断,还包括另一类证据:对关键变数进行操控之后所搜集的资料。为了证实癞皮病不是透过患者的体液传播,古德柏格也在自己身上注射患者的血液,还将患者喉中和鼻中的分泌物放入自己口中。此外,他选出两位癞皮症病患,一个有皮癣症状,一个有腹泻症状,他从病患身上拨下鱼鳞状角质皮,混入该病患的尿液,并加入他们的粪便,与一些面粉揉在一起做成小药丸。古德柏格医师自己和几个助手自愿吞服下去,最终他们都没有染上癞皮病。 古德柏格医师在试验癞皮病所有可能的传染途径后都并无大碍,有力的反驳了卫生条件差这一说法。古德柏格之后更为了证明自己的因果机制有效,从监狱农场找到两批无癞皮病并志愿参加实验的犯人,其中一批配给多为玉米制品且低蛋白质的食物;另一批则配给相对营养均衡的食物。五个月内,癞皮病果然在食用大量玉米制品且低蛋白质食物的犯人间肆虐,另一批人则安然无恙,为古德柏格的理论提供强而有力的依据。
上网成瘾与忧郁症
英国里兹大学心理学家曾针对上网成瘾与忧郁症进行研究,且研究后发现上网成瘾者忧郁沮丧的现象,比起没上瘾者严重得多,其忧郁指数足足高五倍。并将其研究成果刊于《心理病理学》期刊。然而此研究并不能代表上网成瘾与忧郁症有因果关系。首先,里兹大学的研究结论,是根据 1319 份线上填写的问卷而得,内容询问受测者上网时间多长、目的是什么,因此受测者可能会由于抽样谬误及社会期许反应而导致误差。其次,上网成瘾与忧郁现象,就像“鸡先蛋先”问题,犹有争议。网络上瘾者情绪可能本就悲观消沉,而导致了此研究结果。因此此研究只代表了两者可能有相关性,其因果关系需要其他研究证明。
研究指出过度使用社群媒体,可能会导致与他人的真实互动减少,进而影响个人的心理健康,导致焦虑和忧郁[5]。也有研究发现长时间的上网,与忧郁症、焦虑症症状的增加有关[6]。究竟是过度上网导致忧郁,或是精神疾病导致网络成瘾,仍难以确定。
调查法
编辑焦点访谈
使用焦点访谈法,研究者会挑选一群研究对象进行访谈。一般来说,会精心挑选 6~10 位对象进行访谈,并由一位熟知该研究主题的主持人带领大家讨论。 比起其他的研究方法,“焦点访谈”能更了解研究对象的行为动机,但因为样本数少,且又带入研究对象的主观想法,因此不具有完全的代表性。此外需考量研究者的能力,是否能够掌控一群访问者,不让场面失控又能问到欲了解的主题。
问卷抽奖
在许多地方都可以看到一些调查问卷,这便是生活中运用调查法的实例。在这类型的网络问卷中,调查的范围十分广泛,例如:生活习惯造成哪方面的影响、对同志婚姻的看法、消费者购买物品的心理因素、自杀防治等相关议题都有。在此类的问卷调查方式中,都会配合“填写后可参加抽奖”的方法,只要奖品足够吸引人,就能增加填写人数,一旦样本数量足够庞大,便具有统计学上的意义。但在此类的社群网站或社团发布问卷调查,也有其缺点。例如接受调查的族群,几乎都是同年龄层的大学生,较缺少社会大众多数族群对议题的看法,缺乏普遍性。故若能在各类年龄群及不同职业的人群间使用此法,即可带来较具普遍性的实验结果。
服务满意度调查
在餐厅用完餐或是使用电话客服后常常可以看到有关服务满意度的调查问卷。调查的范围涉及对服务的满意度、服务人员的态度等。透过此类的问卷调查,业者可以分析调查数据来研究如何增加顾客的忠诚度以及满意度,再根据不足之处进行改进以增加营收。而由于此种问卷调查方式可以直接地获得使用者的反馈,并马上进行处理或是改进,所以已经被众多服务业所采用。但其也具有一些缺点,例如
- 填答意愿低落造成样本不足,而使其不具统计学上的意义。
- 填答时容易受服务员左右而导致不能忠实的呈现结果。
书籍影音
编辑书籍
编辑1.《这才是心理学(增订版)》
作者:Keith E. Stanovich
译者:杨中芳
出版社:远流
史坦诺维奇教授为了让心理学家的研究成果能受到应得的重视及合理的应用,以富有逻辑又不失风趣的方式,搭配简洁具体的实例和最新的研究资料,说明研究者如何透过系统化的实征研究、可公开重复验证与评鉴的程序,逐步描绘出人类心智的真实面貌。
2.《心理与教育研究法》
作者: 董奇,申继亮
出版社:东华
3.《这才是做研究的王道》
作者:Howard S.Becker
译者:吕姿吟/郭锦媛
出版社:群学
作者援引超过数十年的教学与研究经验,给予学生宝贵的建言。这些忠告简单的如改变访谈提问,到困难的像是操作真假值表,诱导出许多新的想法。
4.《史上最伟大的心理学实验最新完整版:原来人性心理是这样!》
作者:田秋
出版社:达观
书中收录了八十余则著名的心理学实验,通过这些有趣的实验让读者发现人们行为背后受到一些奇妙的心理规律所支配的;进而发现,生活中那么多的道理都有据可依。
5.《趣味心理实验》
作者:渋谷昌三
出版社:小仓书房
本书以心理学的实验为例,来探讨我们身边的话题及社会问题,并希望能以科学方式剖析人心。由这些知识,能了解以往不怎么清楚认识的自己,以及和朋友、同事之间的言行。相信对一些社会事件也将能更向下挖掘,深入了解其背后真正的理由。
6.《实验心理学(第四版)》
作者:朱滢
出版社:北京大学
实验心理学是将实验研究方法应用于心理学各个领域的一个心理学分支。本书在介绍实验设计、心理物理学方法和反应时间等基础知识后,对各个重要的心理学研究领域作较系统的讲解,如视觉与听觉、注意、记忆、思维、心理语言学、社会认知、意识等。
7.《生活中的趣味心理学》
作者:田秋
出版社:金城
本书通过心理学实验,让你清楚地看到人在特定情境脉络中的好恶、恐惧、顺从、怯懦等心理特质,从而帮助我们梳理在日常生活中经常忽略的行为背后复杂微妙的心理因素,使我们能更加清楚地检视自我、了解他人。
8.《怎样洞察别人》
作者:G.I. Nierenberg
译者:蔡庆兰
出版社:远流出版
本书所探讨的是洞察别人行为姿态的问题,帮助读者探测人际关系的海洋,确实看清他人行为姿态所透露的讯息。
9.《研究方法:实征性研究取向(第二版)》
作者: 周文钦
出版社:心理
影音
编辑1.科学方法的步骤
3.自然观察法
4.相关法
5.心理学实验法
8.The Little Albert Experiment
9.Finding Little Albert - The Brain: A Secret History - BBC Four
参考资料
编辑核心观念
编辑- Susan Nolen-Hoeksema, Barbara L. Fredrickson, Geoffrey R. Loftus, Christel Lutz(2015)。心理学导论(危芷芬译,第二版)。双叶书廊。(原著出版于1953年)
- Richard J. Gerrig(2014)。心理学(游恒山译,第六版)。五南图书出版。(原著出版于2013年)
- 温世颂(2016)。心理学导论(5-14页)。三民书局。
- 赖惠德(2016)。心理学:认知.情绪.行为(13-21页)。双叶书廊。ISBN 9789865668396。
- Philip G. Zimbardo, Robert L. Johnson, Vivian McCann(2012)。Zimbardo’s 普通心理学:核心概念(张文哲、洪光远、邱发忠、苏文贤译,第六版,11-22页)。学富文化。(原著出版于2008年)ISBN 9789866624636。
- 陈皎眉、张满玲、徐富珍、林宜旻、孙旻𬀩(2015)。心理学(第二版,22-29页)。双叶书廊。ISBN: 9789865668259。
- John W. Santrock(2012)。心理学概论:心灵与生活探索(黎士鸣等译,11-22页)。东华书局。(原著出版于2002年)ISBN 9789863411499。
- Beck, H. P., Levinson, S., & Irons, G.(2009). Finding Little Albert: A Journey to John B. Watson’s Infant Laboratory. American Psychologist, 64, 605-614.
- Watson, J. B., & Rayner, R. (1920). Conditioned emotional reactions. Journal of Experimental Psychology, 3, 1–14.
- 王克先(1989)。学习心理学。桂冠。ISBN 9789575512651。
- 梁庚辰(2018)。心理学:身体、心灵与文化的整合(第二章,13.3.3)。台大出版中心。ISBN 9789863502920。
- 郑雅淳、吕芷晴(2019)。实验动物与他们的产地。窝窝,检自https://wuo-wuo.com/topics/experiment-animals/experiment-animal-and-their-living
- Encyclopaedia Britannica(2019) Gustav Fechner - German psychologist and physicist. *https://www.britannica.com/biography/Gustav-Fechner
最新研究
编辑- Cole, M. W., Repovš, G., & Anticevic, A. (2014). The frontoparietal control system: a central role in mental health. The Neuroscientist : A Review Journal Bringing Neurobiology, Neurology and Psychiatry, 20(6), 652–64.
- Fox, K. C. R., Spreng, R. N., Ellamil, M., Andrews-Hanna, J. R., & Christoff, K. (2015). The wandering brain: Meta-analysis of functional neuroimaging studies of mind-wandering and related spontaneous thought processes. NeuroImage, 111, 611–621.
- Kristen A. Lindquist,Ajay B. Satpute,Tor D. Wager,Jochen Weber, & Lisa Feldman Barrett (2016). The Brain Basis of Positive and Negative Affect: Evidence from a Meta-Analysis of the Human Neuroimaging Literature, 26 (5), 1910-1922.
- Okamura, N., Harada, R., Kudo, Y., & Yanai, K. (2015). Amyloid and tau imaging, its present and future. Nihon Yakurigaku Zasshi, 146(3), 144–149.
- Saint-Aubert, L., Lemoine, L., Chiotis, K., Leuzy, A., Rodriguez-Vieitez, E., & Nordberg, A. (2017). Tau PET imaging: present and future directions. Molecular Neurodegeneration, 12(1), 19.
- Tharick A Pascoal, Joseph Therriault, Andrea L Benedet, Melissa Savard, Firoza Z Lussier, Mira Chamoun, Cécile Tissot, Muhammad Naveed Iqbal Qureshi, Min Su Kang, Sulantha Mathotaarachchi, Jenna Stevenson, Robert Hopewell, Gassan Massarweh, Jean-Paul Soucy, Serge Gauthier, Pedro Rosa-Neto (2020).18F-MK-6240 PET for early and late detection of neurofibrillary tangles, Brain, Volume 143, Issue 9, 2818–2830
- Jie, C., Treyer, V., Schibli, R., & Mu, L. (2021). Tauvid™: The First FDA-Approved PET Tracer for Imaging Tau Pathology in Alzheimer's Disease. Pharmaceuticals (Basel, Switzerland), 14(2), 110.
华人本土心理学学案书籍
编辑- 高尚仁(1991)。中国人、中国心:传统篇。远流。
- 高尚仁(1992)。书法艺术心理学。文化教育出版社。
- 高尚仁(2000)。书法心理治疗。香港大学出版社。
- 杨中芳(2001)。如何理解中国人:文化与个人论文集。远流。
- 杨中芳(2001)。中国人的人际关系, 情感与信任: 一个人际交往的观点。远流。
- 杨中芳(2001)。如何研究中国人:心理学研究本土化论文集。桂冠图书。
跨文化研究
编辑- 黄光国,〈心理学本土化运动的过去、现在与未来〉,《人文与社会科学简讯》第 3 期(2004 年,台北),页 29-42。
- 黄光国,〈“华人本土心理学研究追求卓越计划”的总回顾〉,《本土心理学研究》第 22 期(2004 年,台北),页 3-10。
- 叶启政编,《从现代到本土》(台北:远流,2002 年),黄囇莉著,〈孰可忍?孰不可忍?从现代化的“批判”到本土化的“坚忍”之间〉,页 5-14。
- 杨中芳,〈试论如何深化本土心理学研究:兼评现阶段之研究成果〉,《本土心理学研究》第 1 期(1993 年,台北),页 122-183。
- 杨国枢,〈我们为什么要建立中国人的本土心理学〉,《本土心理学研究》第 1 期(1993 年,台北),页 6-88。
- 徐诗淳与黄诗婕盛(民 100 年 10 月 21 日)。人物专访-杨国枢老师。台大心理系季报。
- 简晋龙与黄囇莉(民 101)。华人权威取向之概念建构与实征研究:本土心理学研究取径(博士论文)。
- 华人本土心理研究基金会
生活应用
编辑相关名词解释
编辑- ↑ Orne, Martin T. On the social psychology of the psychological experiment: With particular reference to demand characteristics and their implications. American Psychologist. 1962, 17 (11): 776–783. doi:10.1037/h0043424. 已忽略未知参数
|s2cid=
(帮助) - ↑ Baron-Epel, Orna; Kaplan, Giora; Weinstein, Ruth; Green, Manfred S. Extreme and acquiescence bias in a bi-ethnic population. European Journal of Public Health. October 2010, 20 (5): 543–548. ISSN 1464-360X. PMID 20439322. doi:10.1093/eurpub/ckq052. 已忽略未知参数
|doi-access=
(帮助) - ↑ Dr. Arpita Acharya,Feminine theory of Karen Horney,网址:https://www.mbbcollege.in/students/viewtxt.php?folder=notes&id=582
- ↑ https://www.nature.com/articles/s41539-019-0055-z#:~:text=Sleep%20measures%20accounted%20for%20nearly%2025%25%20of%20the,strongly%20associated%20with%20better%20academic%20performance%20in%20college.
- ↑ Alexander S. McKay, Donna M. Garcia, John P. Clapper, Kenneth S. Shultz, The attentive and the careless: Examining the relationship between benevolent and malevolent personality traits with careless responding in online surveys, Computers in Human Behavior, Volume 84, 2018, Pages 295-303, ISSN 0747-5632
- ↑ Primack, B. A., Shensa, A., Escobar-Viera, C. G., Barrett, E. L., Sidani, J. E., Colditz, J. B., & James, A. E. (2017). Use of multiple social media platforms and symptoms of depression and anxiety: A nationally-representative study among U.S. Young adults. Computers in Human Behavior, 69, 1–9.