Q方法适合解决什么样的研究问题?请举例说明。(参见第一章)
Q方法适合解决基于态度的人群归类问题。例如,《应用语言学研究中的Q方法案例分析》第一章1.7小节中提到的“西语专业一年级和二年级学生的动机轮廓是什么?”这个研究问题就适合用Q方法来解决。因为这是在考察学生西语学习动机的基础上,对学生进行的归类,这些类别中的学生在西语学习动机上具有共性,通过概括共性特点可以勾勒出学生的西语学习动机轮廓。
Q方法与探索性因子分析有何异同?(参见第一章)
探索性因子分析可以对问卷题项进行归类,所得出的类别基础是将所有填答者视作一个整体,它并没有区分填答者对待不同类别的态度,而Q方法则是倒置的因子分析。Q方法关注一个群体主观性态度的分类,可以将问卷中的不同题项与填答者个体关联起来,并且通过Q排序来凸显个体的主观想法,然后进行归类,并对类别特征进行描述和分析。
Q方法在确定Q样本上与问卷确定题项上有何异同?(参见第二章)
Q样本可以根据某一理论框架进行构建,也可以根据研究问题,依据不同的研究计划来确定。Q样本的数量通常在40至80条之间。Q样本在撰写上要注意一些事项,如避免使用双重陈述、模糊的术语、否定的表达用语等,这些与问卷确定题项基本一致。但是Q方法在确定Q样本上遵循全面性、异质性和代表性的原则,要求题项尽量全面地代表各种观点。一般说来,同一种观点,Q方法只用一个题项来表示,问卷调查中的题项则不同,一个维度下至少需要三个题项来进行测量。
Q方法在确定P样本上与问卷调查和访谈在选择研究对象上有何异同?(参见第二章)
Q方法在确定P样本时,需要有策略性地选取与研究主题有关联的样本,特别是对研究主题感兴趣、有热情,并有自己明确观点的人,这一点与访谈时选择访谈对象是类似的。但是Q方法选择的P样本数量一般在40—60人,选择访谈对象时,一般不会选这么多人,选择问卷调查研究对象时,一般强调调查对象的代表性和广度,人数通常在100人以上。一般说来,Q方法确定的P样本人数都小于Q样本数。但是问卷调查选择研究对象时,人数通常是题项数量的若干倍。
Q方法与潜在剖面分析可以结合使用吗?
这个问题提得非常好,体现了读者的深刻思考。我们从潜在剖面分析(latent profile analysis,简称LPA)的特点、Q方法的特点、两者的区别、结合使用的可能性和注意事项来进行阐述。
LPA是一种基于概率的分类方法,其假设是连续观测指标由若干互斥的潜在类别或剖面生成。具体来说,LPA假设样本中的个体来源于不同的潜在类别,这些类别在观测变量上表现出不同的均值和方差模式。通过一定的估计方法(如最大似然估计),可以确定类别数量、各类别的均值和方差。然后根据个体在观测指标上的得分,计算其属于每一个潜在类别的概率,并将其分配到概率最高的类别。
因此,LPA属于R方法,即变量中心方法,研究的是变量之间的关系,主要基于个体在观测变量上的响应模式来推导潜在类别。相比之下,Q方法属于样本中心方法,关注的是个体在变量模式上的相似性。从题项特征来看,LPA通常采用心理测量学领域的量表项目,这些题项之间需要具有结构效度,即每个变量通常由三个或以上的显变量(题项)构成。而Q方法的Q陈述则要求尽量减少重复性,因此同一题项不能同时用于这两种方法。此外,LPA对样本量要求较高,通常需要至少200人甚至几百人的样本,而Q方法的样本量要求较小。如果计划结合使用两种方法,需要仔细考虑研究目的和进行研究设计。例如,可以同时收集Q排序数据和量表数据,分别进行Q方法和潜在剖面分析,然后对两种方法的结果进行比较和对比,看看是否能够更好地解释研究问题或研究结果。但这样的研究设计目前还极为少见,其意义和可行性需要仔细考量。
在做Q方法时,发现分组只有两组且重合题项较多,请问这是题项设计的问题,还是研究对象不够多样性的问题?
如果研究结果中出现较多跨因子载荷(即参与者在两个因子上均有显著载荷),这可能反映出数据收集或研究设计存在问题。
第一,Q样本设计不合理。例如,陈述内容同质化、表达模糊,无法充分代表研究主题的多样性观点。每一条陈述应表达一个清晰、单一的观点,且Q样本应该充分覆盖研究主题的相关议题。Q样本通常包括40—80条陈述,如果样本数量明显低于这一范畴,可能无法充分代表主题的完整意义,从而难以区分多种观点。
第二,题项内容的代表性不够,会造成因子数量较少或因子区分度较低。
第三,P样本的多样性不足。P样本如果太单一,可能导致排序结果趋于一致,因子分析只能提取少数因子。参与者在背景、经验、价值观等方面的差异性对于因子分析至关重要。因此,研究者需要通过策略性抽样,尽量选择观点、经验和背景多样化的样本,以提高研究的区分度。
第四,样本量与设计合理性的问题。虽然Q方法允许较小的样本量,但是参与者数量和题项的数量仍需合理。
P样本数量的选取有没有最低标准?比如66个Q样本,选取20名左右的P样本可以吗?
可以的,一般来说,在Q方法中,项目和研究对象的数量最低比值为二比一,如果Q样本数量是60,如60条Q陈述,则最多不超过30名研究者,但是这个比例不是固定的,或者说不是一个非常严苛的比例,而是一个参考性原则。
Q样本的质量是否是Q方法研究中最重要的一环呢?是否存在因审稿人认为Q样本质量不高而否定整个研究的情况?换句话说,感觉Profile这个词“包罗万象”,在据此构建观点汇集、确定Q样本时,如何做好“全面性、异质性、代表性”的结合与平衡?判断一个Q方法研究质量的标准都有哪些?
特别感谢,这个问题可能是很多读者都想要问的。
Q样本的质量在Q方法研究中至关重要,正如问卷题项对于问卷调查的重要性一样。Q样本中的每条Q陈述应充分代表研究主题的各种可能性观点,且每条陈述需表达一个清晰、单一的观点,避免题项内容高度重合。为确保Q样本质量,研究者需要从科学设计的角度出发,严格要求自己,最大化提升Q样本的全面性、异质性和代表性。在构建Q样本时,应遵守全面性、异质性和代表性三个原则。全面性要求Q样本覆盖研究主题的所有相关观点,避免遗漏重要内容;异质性强调体现不同立场和背景,反映研究主题的多样性;代表性则要求每条陈述具有足够的代表性,能够准确表达特定群体的观点。例如,可以参考以往研究成果,结合专家访谈、焦点群体访谈、网络媒体等多种方法,从不同角度和渠道尝试收集Q陈述。收集完成后,还需进行专家评估,检查是否遗漏了重要观点或存在重复性陈述,同时审查Q样本的代表性与内容效度,并对研究设计进行预测等。
Watts & Stenner指出,在构建Qset时,要重视coverage和balance,请问如何理解这个balance?
大家可以看《应用语言学研究中的Q方法案例分析》第30页的表2.2,表中包含了各个方面的内容,体现了覆盖的程度。如表2.2里的数量都是33道题,每一个维度的题项相当,也就是每一个维度的题项与其他维度保持一致。
请问一个Q陈述要包含支持(正)、反对(负)和中立(客观描述)的陈述吗?
一个Q样本应包含对研究话题或课题的正面、负面以及中立(相对客观)的陈述,以确保观点的多样性和全面性。然而,样本设计并不需要过于结构化,例如,不需要将每个句子严格划分为正向、反向或中立。表述上可以灵活多样,但在观点上应体现一定的极化(polarization),以便更好地捕捉受访者的态度差异。
请问研究需要分析参与者的构成吗?抽样需要采取分层抽样方式或其他相关的抽样方法吗?
在Q方法设计中,需要对参与者的构成进行分析,因为参与者的人口统计信息(如性别、学习年限、年级、地域等)可能与研究分析密切相关,并对因子的解读提供重要帮助。抽样方法不一定需要采用分层抽样,因为分层抽样属于严格的概率抽样方法。相较之下,更常用的是基于研究目的的目标抽样(目的抽样),这种方法能够更灵活地满足研究需求。
许老师提到了内容效度,请问Q样本的内容效度怎么看?
Q样本的内容效度与设计问卷题项时的内容效度的含义稍微有一些差别,但差别不是很大。内容效度还是要回归到研究问题上,即研究问题中具体关切的是什么?比如,我们关注动机,那么在Q样本陈述的过程中,就要保证这些陈述都是有关动机的,或者说Q样本陈述要能够和我的理论框架吻合,所以内容效度的保证可能更多的是比较主观和经验性的。当我们作为研究者不是特别容易判断的时候,我们可以寻求领域里更有经验的研究者,或看看前人研究在类似情况下是如何操作的,如果Q陈述与过往理论的主要要素吻合,那么内容效度也会比较高。
被试在排序时认为两个题目区分度不大,或对题项理解困难,如何解决?在做观点汇集时,是否要预先划分几个维度?
这个问题非常好!出现被试在排序时认为两个题目区分度不大或理解困难的问题,则说明题项在一开始可能就没有做好,建议在正式开始研究前做预试验,找若干类似的研究对象,即具有相似特征的一些研究对象来进行排序,及时发现问题并予以解决。
题项区分度不大,很有可能是把一些现有研究工具,如心理测量学上的量表题项直接拿来做Q方法的题项了。因为做测量学时,通常一个变量要有三个或以上的题项来作指标,这些指标之间其实有时候是刻意设计的,在内容表达上有时会有重复。因此,如果直接把这些项目用在Q排序上,那么可能会导致研究对象在理解题项时遇到困难,主要体现在两个方面:一是题项表述问题,二是翻译问题。比如,从英语直接翻译成中文的题项,可能就不太符合中文表达习惯。
做观点汇集时需要预先划分几个维度。对某一个现象或一个话题进行研究时,先要通过大量的文献检索,了解前人研究,看看大概存在哪些不同的观点。
请问对照组实验后,可以用Q方法来替代传统的访谈吗?
这个问题应该也反映了很多读者心中的困惑。《应用语言学研究中的Q方法案例分析》第一章比较了Q方法与问卷调查、访谈之间的相似性和不同点。Q方法适合探索一群人的态度共性。访谈更像是一个数据收集方法。访谈数据可以用来进行叙事分析、个案分析,或用在质性量化混合研究中,作为一个补充性或交互验证性的数据。因此,用Q方法替代访谈法或用访谈法替代Q方法都不是特别妥当。比较妥当的方法是思考研究问题的本质。如果想对主观性观点进行客观性的分类就要用Q方法。如果想探究个体观点是如何形成、发展、改变的,就要用访谈法。
目前想进行有关少数民族语言态度的研究,是否可以通过爬虫收集有关评论,在进行文本挖掘的基础上构建Q样本?
随着人工智能、大语言模型的兴起,通过爬虫进行文本挖掘,这是有创意的,未来可以借助人工智能技术推进研究,但是在构建Q样本时,一定要保证效度,比如,可以把人工分析部分和AI文本挖掘分析部分进行比较,对效度进行论证。
P样本的因子载荷为负数是什么意思,需要删去这个数据吗,还是可以特意追踪?
《应用语言学研究中的Q方法案例分析》第70页的表4.3显示,P样本在进行因子排序时,因子载荷上有时会出现负值,并不是要删去负值,这只是Q样本分析中的一个过程性数据。可能我们现在还不能对负值进行解读,要走完整个分析程序,做完因子旋转,再确定因子结构以及分析。
一般做探索性因子分析,因子也可能是正或负的,这其实是一个方向性的问题。相当于做因子旋转时,我们会看到,某些因子聚拢的方向与另一些因子聚拢的方向刚好形成正负,这是正常的。另外,还可能出现双极因子,《应用语言学研究中的Q方法案例分析》第82页对此进行了阐释。双极因子是指一个因子同时由达到显著性水平的正数载荷值和负数载荷值的Q排序所定义,显示研究对象在某一主题上持有两种截然不同的观点或态度。如果出现表4.3的情况,不需要直接删除数据,而是关注这个数据,通过各方面分析再来决策。如果出现双极因子,可以根据书中介绍的方法(Watts & Stenner 2012)来处理。
如果采用量化,可以用Q方法吗?
Q方法其实在技术上是量化的,但在进行Q样本收集以及对因子进行分析时,还是偏质性的,相当于包含研究者的主观判断。但还是建议先明确研究方法跟研究问题之间的关系,研究问题本质上偏量化还是质性,使用什么途径能够收集到数据去解决问题的关键点,观察研究问题是否适合用Q方法来解决?也建议读者关注第二章的2.1小节的四个例子,如果您的研究问题与这些例子相似,也可以尝试采用Q方法。
Q排序以后通常要进行访谈,请问访谈人数有比例要求吗?
建议根据研究问题、研究目的来选择访谈人数,这通常没有固定比例。如果提取了三个因子,我们可能会选择这个因子上载荷值最高、中间、较低的人进行访谈,了解他们的看法、当然也可以选择一个因子上载荷值排在前几位的人。相对来说,要尽量覆盖到不同因子的不同特征。
请问可否再讲述一下Q方法和探索性因子分析之间的关键差别和逻辑?Q方法能不能也是在写出题项后用rotation和analysis总结出类别,再进行因子的命名?
建议读者仔细阅读《应用语言学研究中的Q方法案例分析》的1.1小节和1.2小节,尤其是1.1小节的最后一段和1.2小节的第一段。探索性因子分析是对问卷的题项进行归类,比如,问卷一共有60个题项,通过相似性或其他指标归类,这些类别是对题项相似性的概括。以学习动机为例,探究学习动机的类型,如出国、成绩等,这些是对题项的收集,不涉及题项的填答者。然而,Q方法关注一个话题的相关态度陈述。以学习动机为例,不是看这些陈述能分成多少类,事实上已经分不出类别了,因为同一类别的陈述可能只有一条,而是通过这些陈述归纳出填答者的相似性。
如果Q汇在编制的过程中确实找不到现有理论支撑,主要从访谈中提炼Q汇,是否会影响最后讨论部分的撰写?
建议尽量避免仅依赖访谈来提炼Q汇,尤其在人文社科领域,理论指导和前人研究成果都很重要,应先进行大量文献检索,全面了解相关理论和前人研究成果。仅仅依赖访谈来提炼Q汇,可能会导致研究的覆盖面和科学性不足,题项不成立,影响研究的可信度和效度,从而对后续的结果讨论和论文撰写产生负面影响。
与线下Q排序相比,线上Q排序有何优势和不足?(参见第三章)
线上Q排序操作便利,不受时间和空间限制,且Q陈述可以随时调整;数据可以直接导出用于统计分析。但是Q方法的倡导者仍然是推荐线下Q排序,因为研究者可以与研究对象面对面互动,深入了解其填答过程,解决可能出现的各种突发事件。线上Q排序有一些弊端。首先,有些线上Q排序软件不便于研究对象同时看到所有Q陈述,难以对不同Q陈述进行相互比较和评估。其次,有些研究对象不熟悉计算机操作或者不愿意学习线上操作方法,导致填答困难或者应付,导致数据质量下降。最后,由于研究者不在场,无法确保研究对象认真按照程序进行Q排序,难以把握研究对象的填答进度,因而难以保证数据质量。
Q排序后为何要进行访谈?访谈时需要关注哪些方面?(参见第三章)
Q排序后进行访谈主要旨在请研究对象详细阐述观点,获得他们对Q排序的完整、丰富、详细的理解。访谈应该关注以下三个方面。第一,请他们回顾或者解释为什么会如此进行Q排序,尤其是为什么将某些Q陈述放在Q排序表格的两端,即为什么如此同意或者不同意某个Q陈述。第二,要恰当地引导研究对象对那些他们比较看重的Q陈述发表自己的看法。第三,研究者要跳出研究中的Q样本,请研究对象就研究的话题、概念下定义或者进行解释,从而获得故事化或叙述性的数据,为后续的因子解读提供更丰富的信息和示例数据。
因子提取过程需要综合考虑哪些指标?为什么?(参见第四章)
因子提取是一个复杂的过程,研究者要综合考虑各种因素来确定。具体说来包括以下指标。第一是研究所采用的相关理论框架,如果理论框架中包含3个要件,那么可以考虑提取3个因子。第二,如果没有明确的理论框架,那么可以依据每6条Q陈述提取一个因子的原则提取因子,但也要同时考虑因子分析的其它数据结果。第三,只有因子的特征值大于1,才可以作为一个有意义的因子。第四,如果因子解释的方差在35%及以上也可以作为一个因子。此外,研究者还需要考虑以下统计指标:同一因子中最少有两个Q排序,且它们的因子载荷在0.01水平上显著;同一因子中两个最高的因子载荷的乘积的绝对值还要超过标准误的2倍。以上两个条件的计算公式详见本书第68页。
有人说Q方法的结果解读是主观的。您怎么看待这种说法?(参见第五章)
Q方法的结果解读具有一定主观性,但并非完全主观的。研究者要综合考虑各种信息来解读结果,尽量保证研究的客观性。一般说来,研究者在解读结果时要关注以下四类重要信息。第一类信息是特征陈述。研究对象对这些陈述的同意或不同意程度反映了这个因子所包含的研究对象的观点组合。第二类信息是因子之间的差异降序排列。这些排列显示了每条Q陈述在每对因子载荷的Z值之间的差异,并以降序形式显示出来。这个信息能够显示因子之间的差异性,帮助研究者深入观察因子特征。第三类信息是区别性陈述。它是指那些能够把一个因子的观点显著区别于其他因子的Q陈述。这些信息非常重要,在进行总体性分析时便于解读因子特征。第四类信息是共识性陈述。它是指那些在任意两个因子之间Z值差均达到显著水平的Q陈述。通过上述四类信息,研究者可以整体解读Q排序结果,最大限度地避免主观性和随意性。
在因子提取的过程中,规定需要满足的条件之一为“同一个因子中起码有两个以上的Q排序,其因子载荷在0.01水平上达到显著”,其中“0.01水平”如何设定?是默认的吗?在实际操作中,只看未旋转因子矩阵中是否有Q排序超过显著阈值可以吗?同理,对因子旋转后Q排序进行标注时,也默认所有的Q排序都是0.01的水平吗?
请问可否再解释一下“0.01”这个水平应该如何在实操中设定?
PQMethod在数据分析通常采用0.01作为显著水平。并根据这个设定的水平,计算达到显著水平的阈值,研究者需要根据自己研究中的Q陈述个数按照公式提前计算出阈值,2.58 ×(1+√no. Of items in Q set)(2.58是正态分布下0.01显著性水平对应的Z值),详见本书第68页。本书共有47条Q陈述,按照这个公式计算,0.01显著水平的阈限值就是0.38。在实际操作中,不能只看未旋转的因子矩阵,因为未旋转因子矩阵只是初步提取的结果,往往没有清晰的因子结构;需要在旋转之后再判断每个Q排序在某个因子的载荷是否显著,并在因子矩阵中进行标注。
建议读者把这个问题简单化。按照公式简化为2.58除以Q排序数量的开方。用这个公式计算出的阈值表明采用0.01作为显著水平。所以不是说要在软件什么地方设定0.01,阈值就是按照0.01计算的。换言之,如果采用0.05作为显著水平来计算,公式是1.96除以Q排序数量的开方。最后得到的载荷值,可以根据显著性再标记。
构建观点汇集中的访谈与Q排序后邀请部分研究对象的访谈有何区别?
构建观点汇集时的访谈旨在收集具有特色的Q陈述,让Q陈述尽量全面、典型、有差异性。Q排序后的访谈旨在考察填答者进行Q排序的原因,比如为何把某个Q陈述放在某个位置上(例如,放在+5,或者-3,或者0)。它的目的是为Q排序结果解读收集更为细致的信息。
量化研究与质性研究的论文写作范式差异很大,那么,Q方法的论文范式更接近质性还是量化研究论文的形式?
Q方法兼具量化和质性的特点。它的数据分析部分是偏量化的,但是它的结果解读和汇报又偏质性。不过,因为结果解读是在量化数据分析之后进行的,据我看到的使用Q方法的学术论文汇报时,还是偏质性研究方式多一些,因为研究者会汇报对结果的解读,并且引用Q陈述的内容构成解读的语境。其实,就应用语言学学科而言,质性和量化研究论文的格式基本一致,都遵循IMRDC格式。我们按照这个格式行文即可。
书中第126页提到:需要收集行为投入等数据时,不适合运用Q方法。请问是否可以或者有必要同时结合客观指标和Q方法(学生对自己行为投入的认知)进行分析?还是说在研究设计中,能用客观指标衡量的问题就不用Q方法了?
Q方法最适合用来考察参与者的态度,不适合考察行为。所以书上说它不适合用来收集行为投入信息。在具体研究中,研究者需要根据研究问题的性质来判断是否可以采用Q方法。如果研究的内容是态度的结构,那么可以考虑使用Q方法;如果研究的内容是行为,那么就不适合采用Q方法。如果研究中既要考察态度结构,又要考察行为,那么可以在态度结构部分使用Q方法,行为部分使用其他适当的方法。
Q方法适用于对研究对象态度进行研究,请问如果是对学习者的学习投入进行研究,按照其分类,即情感、认知、行为维度,是否也能使用Q方法进行研究?还是只适用于情感维度的研究?如果只适用于某一维度,能否与通过问卷调查收集到的其他维度的数据进行比较?
Q方法适合考察态度的结构,但不适合研究行为。学习投入(engagement)本身更倾向是行为范畴,尤其其中的行为维度,应该以客观数据作为判断行为投入的依据。但是目前很多研究采用量表来测量学习投入的各个维度,这种方法实际上是依赖学习者自述或自认为的学习投入,而非客观发生的学习投入。使用Q方法的话,其意义就值得商榷,因为Q方法更多用于探究态度而非行为。换言之,研究设计阶段,要对所研究的变量的概念化和操作化进行仔细考虑。
为什么Q分类量表会呈正态分布呢?这符合实际情况吗?
这种正态分布是不是也会限制被试的排序?
这是Q方法的独到之处,也是它的根本要求。因为Q方法要对填答者的主观性结构,即态度结构进行客观化分析,因为必须进行量化,而且要使量化结果可以比较。因此,Q分类量表都是正态分布的。这样就可以把每位填答者的数据在同一个标尺上进行处理了。这也正是其分析结果可以提供Z分数的基础。有了Z分数,研究者就可以进行因子间的比较了。
最初也有这个困惑,如果有很多Q陈述我都同意或不同意,但是填写Q分类量表时,只有两条Q陈述可以填在最同意或最不同意上,那么其他Q陈述该如何处理?但是Q分类量表之所以设计成正态分布,就是要迫使填答者再次仔细思考,在这么多同意的Q陈述中,哪些最为同意?通过所谓的“限制”,让填答者清晰地表达态度,这个“限制”是不得已的,或者说是Q方法本身特性所带来的操作方法。
当然,这种方式也不排除有限制填答者的“嫌疑”。但是,在Q排序之后,我们还会使用访谈作为补充,让填答者阐释当时为什么这样排序,进一步阐述所谓的被限制的想法。因此,综合来看,这在一定程度上既保证了态度结构的量化,又保证能够最大限度地让填答者说出自己的想法。
如果在文章中汇报因子特征值和因子解释方差,汇报的该是因子旋转前的特征值和解释方差,还是旋转后的?
建议读者进一步了解分析过程,一般汇报旋转后的因子解释方差,如果采用质心提取法,PQMethod程序默认提取7个因子,如果读者尝试对这7个因子进行旋转,旋转后只能显示因子解释的方差,而不会显示特征值,这是这个程序的一个bug。可以用Brown(1980:220)建议的公式手工计算特征值。
但是一般情况下,在论文里不用汇报特征值。
在第四章关于PQMethod的实操中,根据Watts & Stenner的建议,对因子载荷达到显著的阈值由根据计算公式规定的0.38调高至0.45(详见第79页),由此得到了新的因子矩阵。请问:1)Watts & Stenner的具体建议是什么?即当结果不理想时,如何将此建议应用到自己的数据分析中?2)调整阈值的具体操作方法是什么?
1)先确定显著载荷的初始标准,观察各Q排序的载荷情况;若发现有较多Q排序是混杂Q排序或不显著,需要被删除的,比如Watts & Stenner举的例子中共有50条Q排序,而4条不显著,11条混杂,因此需要删除15条,占总数的30%(15/50),所以要提高阈值。这个过程是逐步的,比如,其例子是从原来的±0.34,±0.35,±0.36一直到±0.40时,发现只有5条Q排序不显著,3条是混杂,删除这8条,有42条保留,即删除的占16%(8/50)。但如果继续提高到±0.41,不显著的Q排序数量增加,即要删除的Q排序数量就上升了。因此,其决定阈值设定在±0.40。通过这种方法,能使可用数据最大化而混杂Q排序最少化。
2)具体操作其实就是可以在因子载荷输出中仔细查看,也没必要每次都在程序上去重新标注。
We tend, therefore, to employ a strategy which minimises confounding and which duly maximises the number of significantly loading participants in a particular study. Let us suppose you have followed the instructions laid out in Note 8 above and have calculated that a significant loading in your study (at P < 0.01) must reach ±0.34 or above. You then find that (in using this significance level) 35 of 50 participant Q sorts load on a single factor, 4 have no significant loading and the remaining 11 are confounded. This means that 15 participant Q sorts (30% of the data) are not being used to construct the various factor exemplifying item configurations. In such circumstances, it may be sensible to consider raising the level at which a loading is said to be significant (which will only make your criterion more stringent from a statistical viewpoint). In the example, we might look again at the solution with a significance level of ±0.35 or above, then ±0.36 or above, and so on. At ±0.40 we find that 42 of the 50 participants load significantly on a single factor, five now have no significant loading and only three are confounded. In other words, only eight participant Q sorts (16% of the data) are not now being used. We also find that raising the level still further (to ±0.41 or above) only serves to increase the number of Q sorts with no significant loading and hence to reduce the overall numbers of participants with significant (and usable) loadings. At ±0.40, therefore, we have maximized the number of participants with significant loadings and have duly achieved our most satisfactory solution (Watts & Stenner 2005: 88).
Watts, S. & Stenner, P. 2005. Doing Q methodological research: Theory, method and interpretation. Qualitative Research in Psychology 2: 67-91. doi: 10.1191/1478088705qp022oa.
第113页备忘单的制作需要包括”在因子1中排名高于/低于在其他任何因子排名的项目“,这部分有些不理解。能否具体讲一下?
这可以通过实例来理解。如本书第114页表5.7的备忘单中,从因子1的排名为+3,把这条归入“在因子1中排名高于在其他任何因子排名的项目”,是因为从本书第111页表5.6可知,第2条Q排序在因子1排名是+3,在因子2排名是-1,所以第2条Q排序在因子1的排名高于其在其他任何因子(这里只有因子2)的排名。
假设该研究析出了3个因子,第2条Q排序在因子3的排名是+1,那么第2条Q排序仍然可以归入“在因子1中排名高于在其他任何因子排名的项目”,因为这条Q排序在因子1的排名高于其在其他任何因子(这里包括因子2、因子3)的排名。相反,如果第2条Q排序在因子3的排名是+4,那么这条Q排序就不能归入“在因子1中排名高于在其他任何因子排名的项目”,因为其在因子3的排名(+4)高于其在因子1的排名(+3)。
同理,“低于在其他任何因子排名的项目”也是按照这样的逻辑来理解。
如果对一些比较新的问题进行研究,但是在相关文献中没有找到观点,是否可以依靠访谈得出的数据进行Q排序呢?
针对这个问题,可以理解为这是一种创新吗?
这个问题在第一阶段答疑时有读者提出,还是建议尽量避免仅依赖访谈来提炼Q汇,尤其在人文社科领域,理论指导和前人研究成果都很重要,应先进行大量文献检索,全面了解相关理论和前人研究成果。仅仅依赖访谈来提炼Q汇,可能会导致研究的覆盖面和科学性不足,题项不成立,影响研究的可信度和效度,从而对后续的结果讨论和论文撰写产生负面影响。
这可以从不同的角度来看。如果把访谈结果或访谈中的一些观点提炼出来,但不直接用于Q排序或Q方法中,而是把它变成一种理论假说。比如,通过质性研究发现了一些变量之间的关系,据此提出一种假说,这相当于是一种理论框架。在这个框架下进行论证,再提炼为具体Q陈述,而且要有足够的证据证明这种做法是可行的,比如,信度、效度需要有保障。但是,这一系列的操作需要花费大量的精力和时间,这样可能跳出了Q方法的常见步骤和范式,不确定这样的新做法能否被Q方法研究方面的学者接受,按照这种方式做的研究论文,也不确定审稿人能否接受,这可能存在比较大的风险。
但是,如果有足够的时间,以及勇于尝试的魄力,试一下也未尝不可。所以,这个问题的答案是开放的,大家也可以试试看有没有新的可能性。
Q方法会将相同特征的被试进行归类,请问是怎么归类被试的?能否再讲一下Q方法提取因子的原理?
这个需要对探索性因子分析有个基本的了解。在Q方法中,我们的目标不是对“题目”进行归类,而是对“人”(被试)进行归类,将每位被试的排序结当作一个变量,计算每两位被试之间的相关系数(皮尔逊相关系数),得到一个被试之间的相关矩阵。使用因子分析对相关矩阵进行分析,找出哪些被试在排序上相互高度相关,即他们的Q分类方式很相似。程序再将这些相关性高的被试聚集到同一个“因子”(factor)上。
在最后解读分析结果时,需要严格按照软件导出的结果,还是可以更多依赖研究者的解读?比如:某一条陈述(statement)出现在所有3个因子的区别性陈述,且在每个因子表内的排序都很高,但在软件给出的共识性陈述表中却并没有出现这一条陈述,这种情况下,这一条陈述可以算做共识性陈述吗?
两者需要结合,但研究者的解读起关键作用。Q方法的本质是结构化的主观性研究,程序提供的统计数据可以辅助研究者做判断,但研究者需要根据被试排序的表现、访谈的反馈、理论背景等进行综合进行解读。在统计上,不能算是“共识性陈述”,因为共识性陈述的定义是:各因子之间在该陈述上的排序差异不显著。如果软件没有将其列为共识性陈述,则仍然不是共识性陈述。但是可以在报告中提出研究者的解读,如,尽管这条语句在统计上不属于共识性陈述,但它在所有因子中都排得很靠前,显示其在整体样本中较为重要,因此可能具有潜在的共识性。但请这位读者复查这个问题里,是指某一条陈述(statement)出现在所有3个因子的区别性陈述还是特征陈述(definitive statements)。
本书的因子提取部分与配套视频中提及的“综合各种因素考虑,提取两个因子是合理的,但是为了和书上一致,还是按照提取四个因子来做因子旋转”。请问这是什么意思?为什么不按两个因子来做因子旋转?
特别感谢这位读者的提问,这也给我们提供了一个很好的反思。
在录制视频时,我的确想到了这一点,后来考虑到两因子与四因子的操作是重复的。为了与本书四因子的操作过程吻合,得出一致的结果,最终还是按照四因子的方式来进行旋转与标注,没有做两因子的旋转。但是读者也可以根据书上讲解的步骤,按照两因子的方式来提取及旋转。
请问Q方法研究中因子间的相关性有具体要求吗?
这个问题问得非常好。
因子相关系数是要考量的一个重要因素。对于因子,建议最好不要太高度相关。本书第81页提到了相关系数,根据Watts & Stenner的建议,因子载荷达到0.38属于显著,那么提取的因子的相关系数如果大于0.38就会被认为较高。因子相关系数较高说明因子间区分度不是非常大,这值得警惕。但是也有研究者认为相关系数高有时不一定是坏事,这表明两个因子在很多问题上可能存在共识,那么可以着眼于分析因子之间的分歧点。本书第81页阐释了因子相关系数较高时一般采取的几种策略,详见4.6小节。
请问被试的人数选择该怎么把握?如果研究有26名被试,运用40条Q集,采用(-5;+5)的级别,开展研究,结果是否有效?
第一阶段答疑中也提到过,书上也有相应的论证和建议。首先,一般来说,P样本的数量要小于Q样本的数量,本书第31页有相应陈述,按照书上提到的P样本的选择原则,这个人数超过了20名(40/2=20);但这只是一个参考原则。
其次,至于结果是否有效,我们需要看Q样本的质量,综合考量因子提取的方法,因子旋转的方法,特征陈述(区别性陈述和共同性陈述)等,最后再做结果解读,才能讨论结果是否有效。
请问可以用KADE软件进行Q方法的数据分析吗?这和PQMethod的分析结果有区别吗?
目前我没有使用过KADE这款应用,都是使用PQMethod做Q方法研究。如果想用KADE进行Q方法的数据分析也可以。至于结果是否与PQMethod的结果有差异,总体上可能不会有太大差异,但是数值上可能有出入。因为每一个软件的底层运算逻辑过程可能不一样。
请问研究定向动机流可以使用Q方法吗?
这个问题问得非常好。
因为定向动机流不是把动机作为静态来看待的,而是把动机视作动态发展的,所以它的理论视角是复杂动态系统理论,强调动机的非线性变化,以及考虑学习者目标设定、学习者与环境的多重互动、学习者深层动机的激发与发展的动态过程等。
现有的一些研究会使用混合方法,如结合回溯性访谈来了解学习者的动机发展。但是Q方法更多是对人群的看法、观点进行归类,所以严格意义上,它反映不了学习者的动机流。尽管我们在设计Q陈述时,可能包含一些让学习者回想自己动机的一些题项,但这个过程仍只是基于学习者的自述。如果要探索动机流的发展,Q方法可能不是非常合适。诚然,可以尝试使用Q方法加上纵向访谈或学习日志的方式来探究不同阶段中动机流的类型或情况,以了解学习者动机的动态变化。
请问正反两个题项要隔开还是连着问呢?问题的字数有限制吗?
这里提到的正反两个题项,可能指Q陈述中内容截然相反的题项。
建议还是拆开来放,或在摆放Q陈述时采用随机化方法。采用随机排列可以避免人为排序带来的误差。如果是人为排序,也尽量要避免将两个观点截然相反的题项前后摆放在一起。
理论上讲问题的字数没有限制,但是从操作实践的角度看,最好参考问卷题项的设计思路,避免出现多维度的表达、模糊的表达、泛泛而谈的表达。字数也可以参考问卷题项的字数标准,建议别超过太多,如果内容太多导致转行,填答者阅读时也不太方便。