《外语教学问卷设计与评价》|“我来读文献” 【书目阅读】No.136

主审:

总主编:

主编:

副主编:

编者:

作者:秦晓晴、毕劲

译者:

书号:978-7-5213-6634-1

出版日期:2025/10/17

定价:¥85.9

  领读专家
秦晓晴

南京大学英语语言文学博士、应用语言学博士后,现为华中师范大学教授、博士生导师、博士后合作导师,入选教育部新世纪优秀人才支持计划和湖北省新世纪高层次人才工程。曾任华中科技大学等校特聘或兼职教授。研究方向为第二语言习得、英语写作教学和研究方法,主持多项国家级和省部级科研项目,发表学术论文近百篇,出版研究方法和二语教学专著数部。多次获各类优秀教师奖及科研奖励。

  导读

如果说问卷设计是整个研究的地基,那么问卷实施、数据整理、信效度评价与统计分析则构成了其主体结构。再完美的问卷设计,如果在实施与数据处理阶段出现问题,也可能导致研究失效。问卷调查的真实挑战往往并非来自设计本身,而是来自复杂的研究现场:受访者不认真填写、回收率低、在线问卷出现重复答题、样本代表性不足、数据录入或编码错误、异常值未处理、统计分析方法误用等。

《外语教学问卷设计与评价》的后五章围绕这些关键问题展开,系统讲解问卷的试测、实施方式、样本抽取、数据整理与清洗流程、信度与效度检验方法、统计方法选择规则以及问卷研究质量评价体系,帮助研究者从操作层面提升研究的科学性。本阶段导读强调质量控制是问卷研究的核心理念,研究者需要在每一个步骤做出明确、合理、可追溯的判断,确保数据具有可信度、代表性与解释价值。

此外,本阶段还将引导读者关注问卷研究中的伦理问题,包括知情同意、隐私保护、数据保密等。这些元素不仅关乎研究规范,也影响受访者的答题真实性与数据质量。书中还介绍了问卷研究质量评价体系,为学位论文撰写与学术研究提供了可操作的标准,使研究者能够对自身研究进行全面的自查与把控。

通过第二阶段的学习,参与者将能够理解问卷实施与数据分析中的关键环节,掌握效度和信度判断的原理与操作方法,提升识别统计误用、数据质量问题和研究设计漏洞的能力,并学会从整体上把握问卷研究的科学性与可信度。

  思考题及解答
第一阶段
第二阶段
为什么在外语教学研究中,问卷调查会如此普及?它与访谈、观察等方法相比有何优势和局限?
在外语教学研究或二语习得研究中,问卷调查是使用频率最高的研究工具之一,仅次于测试。问卷普及的原因,一是经济高效,可大规模实施;二是标准化强,可减少理解偏差;三是匿名性强,适合敏感变量;四是量化分析便捷,可用于结构方程模型或回归分析,尤其适用于当下的网络调查,无需手动录入数据,可快速收集所需信息。问卷与访谈/观察的关系并非相互矛盾,而是互补关系。相对于访谈,问卷省时省力,更易量化;相对于观察,问卷更容易标准化,可测心理变量。但是问卷也有局限,即自我报告偏差、不能捕捉动态过程。
为什么许多问卷在“构念—指标—项目”链条上出现断裂?请结合你的教学或研究经验解释。
出现链条断裂的原因有很多,第一是构念未被充分定义,也就是文献综述未能做好。第二是指标无理论来源,全凭经验命题。第三是项目与指标不一致,以及缺乏方法论意识。简单来说,可将研究问题与构念的关系比作寻宝图与坐标:研究问题如同寻宝图,指引研究者在学术理论的宝库中探寻答案,而构念则是寻宝所需的坐标。缺少构念这一坐标,研究者在解答研究问题的过程中便会如同无头苍蝇般盲目;同理,若只有构念这一坐标,却没有研究问题作为目标,整个研究过程也将毫无意义。
在实际研究中,哪些概念最容易被混淆?这种混淆如何影响问卷设计?
测量情感因素等相关内容时,概念更易出现混淆,如动机与兴趣、自我效能与自信、语言/考试/交际焦虑、学习策略与学习行为,以及学习意愿与动机强度等。这些概念存在共性,部分内容相互重叠,因此区分时需特别明确其内涵及所包含的维度和方面。概念混淆会导致以下问题:1)维度交叉、结构效度缺失;2)量表出现高相关(>.80)的“伪多维”情况;3)出现难以解释的研究结果,甚至违背理论预期的情况。
请举例分析你见过的一个“问题项目”,说明它的问题来自表述、逻辑还是构念。
一个典型的“问题项目”是“我上课认真听讲、专心做笔记”,其问题源于表述与逻辑:一题包含两种不同行为,易导致测量模糊。因此,该项目需拆分为两个独立题项。另一个典型的“问题项目”是“教师反馈增强了我的学习动机”,其核心问题是构念模糊,“学习动机”是学生似懂非懂的术语,且该题预设教师反馈是学习常态,这样既影响学生理解,也降低测量准确性。
为什么说“研究问题决定构念”?如果研究问题不清晰,问卷会产生什么后果?
研究问题决定构念,核心在于研究问题是研究的核心导向。构念的界定与选取均需围绕研究问题展开,无明确的研究问题则构念无从谈起。研究问题不清晰会引发以下后果:一是构念定义模糊,易出现概念混淆;二是量表维度混乱,问卷冗长碎片化,研究者难以明确测量的核心内容;三是统计模型难以解释,可能导致结论失真;四是实际测量偏离研究目的。从研究问题的提出,到构念的定义和操作化,再到指标与题项的设计,是一个紧密的逻辑链,研究问题不清晰会导致各个环节出现偏差,进而影响研究质量。
AI时代问卷研究的选题是否发生变化?研究者如何保持理论敏感性?
AI时代问卷研究的选题已发生变化,AI的广泛应用使得学习者行为、教师教学行为发生改变,进而涌现出AI使用自我效能等新构念与研究话题。研究者要保持理论敏感性,需要广泛阅读跨学科文献,聚焦所研究构念的本质,而非追求花哨的概念。当前存在理论繁杂缺乏统一性、部分理论泛化难以解释问题、研究复现率低、理论效度不足等情况。AI虽能助力收集海量数据,但研究者需先确认现象的稳健性,确保理论与现象相互约束,这是保持学科科学性的关键。
当同一构念需要多个指标测量时,如何确保这些指标共同指向同一概念?
确保同一构念的多个指标指向同一概念,核心是做好构念界定与科学验证。研究者需基于文献和理论明确构念维度,若现有理论不足,可结合个人观察或前期研究进行补充,再确定各维度指标及对应题项,文献也是检验指标维度归属的重要依据。 统计层面,研究者需将维度作为整体分析,同时重视信效度检验,如通过专家审查保障内容效度,并在试测环节用探索性与验证性因子分析检验结构效度;信度分析需覆盖构念和量表,并且题项数量需合理以保证信度稳定。
为什么教育问卷中暗示性、前提性表达如此常见?如何避免?
核心原因有二,一是社会科学变量间存在依存关系,容易引发变量连锁反应,导致此类表达难以完全避免;二是部分研究者仅简单修改他人问卷,且不做预实验,因此容易忽视表达的潜在倾向性。 研究者需做好三方面,一是问卷设计应先基于文献,再通过受试者访谈确认题项理解是否一致;二是与同事、导师共同审校,借助多元视角规避个人偏差,且必须开展预实验;三是采用中性、无预测性语言,删减主观副词,规范项目审查流程,保障测量客观性。
哪些外语学习相关构念难以通过自我报告测量?原因是什么?
外语学习中,真实语言能力、学习投入度、情感情绪类构念(如焦虑、压力)等难以通过自我报告准确测量。原因在于真实语言能力受不同学校考试标准影响,大规模统一测试不现实;学习投入度易受记忆偏差、活动界定模糊影响;情感情绪类构念波动性强,受多重因素干扰。此外,社会期望效应、自动化行为的难以观测、对构念的理解不一致以及回忆偏差等,也会降低自我报告的测量准确性。
如何在研究精度与受访者负担之间取得平衡?
在研究精度与受访者负担之间取得平衡,核心是兼顾信度与减负。问卷长度与信度直接相关,统计逻辑上,单个因子需三个及以上题项才能保证信度,缩短问卷易影响精度,因此需在合理题量基础上减负。减负可通过关怀措施实现,如设置抽奖,或针对学生优先安排课堂时间填写问卷。发放形式上,对学生优先采用纸质问卷面对面发放,便于解释问题、建立信任;对家长等难以直接接触的对象使用电子问卷,在保障精度的同时降低受访者负担。
你在实际研究中遇到过哪些问卷实施困难?你采取了哪些策略以改善回收质量?
在问卷实施中,很可能遇到问卷回收率低、受访者随意作答、受访者重复填写、样本代表性不足等困难。改善策略包括:寻求权威支持(如任课老师协助)、实施激励(如小奖品或合理报酬)、确保信息透明(说明研究目的、保证匿名性)、优化问卷长度(小型研究5—10分钟,复杂研究30分钟以上)。
在线问卷与纸笔问卷各有哪些不可替代的优势与风险?在外语教学中应如何合理选择?
纸笔问卷回收率高,且因为研究者能实时监控作答情况,受访者配合度较好,作答更认真;但数据录入繁琐,需多人协作以避免错误。在线问卷则支持大量收集、滚雪球扩样及复杂逻辑跳转设计;风险在于随意作答可能性高、易重复填写。在研究中,若样本量不大,应优先采用纸笔问卷;若问卷设计复杂或需快速扩样,则可选择在线问卷。
什么样的答题行为应在数据清理阶段被排除?这些标准是否因研究类型不同而变化?
在数据清理阶段,需排除随意作答行为,如答题时间过短、逻辑矛盾、开放题空白等。这些标准因研究类型而异:课堂小规模研究质量较高,可采用较严格清理标准;大规模在线调查则需事先明确标准(如答题时间范围),并关注社会期望效应。清理时应避免过度剔除导致样本失真。不像大样本,小样本研究更容易受个别异常值影响,因此需更严格控制数据质量。
如果某项目删除后可提高信度α值,是否应直接删除?依据是什么?
在这种情况下,不应仅依据α值上升直接删除项目,而且需综合考量项目因子载荷、项目与构念的一致性,以及删除后是否导致构念维度缺失等因素。α值上升并非决策的唯一依据。若α值剧增,应先检查反向问题是否正确调整。α值受项目数量影响:项目较少时α值较低,项目较多时α值可能较高。信度分析应在内容效度和结构效度验证后进行,避免过度清理导致数据失真。
外语教学研究中哪些构念易出现效度不足?如何提高?
在外语教学研究中,语言焦虑和自我效能等情感因素,因其波动性大、情境依赖高,易出现效度不足;学习投入度的定义模糊,易引发测量偏差;跨文化研究中的社会期望效应也会削弱数据效度。要提高效度,应优先采用本土化经典量表;若需自行开发量表,则需通过专家审查、因素分析及混合方法校验,确保理论、表述与统计的一致性,保证研究的可靠性。
为什么说统计方法的选择取决于数据类型?请举例说明常见统计误用。
问卷答案包括多种形式及对应的数据类型,对数据类型进行区分有助于调查者选择合适的数据分析方法。常见误用包括:对李克特量表单个项目进行相关分析、混淆主成分分析与因子分析、用t检验多次比较多组数据,以及将相关关系误认为因果关系。研究者需基于数据特性选择方法,避免因误用方法导致结论偏差。
如何判断问卷结果是否真正回答研究问题?如何避免“为了统计而统计”?
判断问卷结果是否真正回答研究问题,需确保统计方法与研究问题严格匹配:描述性问题使用描述统计,关系问题采用相关分析,因果问题则采用结构方程模型等方法。避免“为了统计而统计”,应以问题为导向选择方法,而非追求复杂性。报告时需包含精确p值、效应量及置信区间,显著性水平应在分析前就确定,外语教育研究可适当放宽标准,避免仅依赖p值而忽视实际意义。
评价问卷研究质量时,你最关注哪些维度?为什么?
评价问卷研究质量时,我最关注伦理问题、构念清晰性、信效度及统计匹配度。伦理问题要求确保受访者自愿参与,避免强迫行为,否则问卷质量会显著下降。构念清晰性需明确定义研究构念的理论来源与结构,避免逻辑漏洞。信效度是核心维度,直接决定数据可靠性与有效性,影响统计推断及研究问题的解答。统计匹配度则强调方法与问题的契合性,避免方法误用导致结论偏差。
当前国内外语教学问卷研究最突出的问题是什么?如何改进?
当前外语教学问卷研究最突出的问题是构念定义不清。常见衍生问题包括统计方法误用、信效度报告不足、透明度缺失及结论与数据脱节。改进需从源头入手:明确定义构念并细化操作指标;确保统计方法与数据特性匹配;详细报告信效度;提供完整的知情同意书及参与者背景信息;严谨解读结果,利用AI辅助分析。
在智能质控、自动分析等AI趋势下,研究者如何既利用技术又保持方法判断力?
在AI辅助研究中,研究者需保持方法判断力,将AI视为工具而非决策者。AI缺乏真正理解能力、因果推理能力及社会伦理意识,易导致过拟合或荒谬结论,存在风险。研究者应确保数据质量,严格遵循研究问题导向,利用AI辅助数据处理与模式识别,但核心的理论构建、方法选择及结论解读必须由研究者主导。