期刊速递 | 《语言测试与评价》2025年第二辑（总第七辑）目录与提要-学术科研

首页 > > > 学术科研 > 期刊速递 | 《语言测试与评价》2025年第二辑（总第七辑）目录与提要

期刊速递 | 《语言测试与评价》2025年第二辑（总第七辑）目录与提要

2026/02/06

《语言测试与评价》2025第二辑（总第七辑）

本期目录

本期提要

LTA

热点聚焦

In Focus

英语诊断性测评与优诊学平台的

回顾和前景展望

武尊民¹ 金艳² 屈凌云³

¹北京师范大学 ²上海交通大学

³外语教学与研究出版社

提要

英语诊断性测评是通过识别学习者个体或群体的知识、技能缺陷及学习障碍为核心目标的评估方式，为教学决策提供依据，其主要理论基础是Bachman的交际语言能力模型、Vygotsky的最近发展区理论以及Black和Wiliam的形成性评价理论。本文概述在中国教育生态环境中，英语智能诊断与教学支持系统“优诊学”（UDig）体系十年来的发展历程，从课堂层面、区域层面和技术整合等不同维度展示诊断性测评对优质均衡教育的作用和意义。在中国教育推进重大改革的形势下，优诊学面临着新的挑战，同时也有着进一步发展的机遇。我们将借助AI迅速发展的东风，进一步完善各学段诊断性测评体系，强化结果应用，为国家的教育优质均衡发展作贡献。

关键词

英语诊断性测评；优诊学平台；优质均衡发展；挑战与机遇

引用格式

武尊民, 金艳, 屈凌云. 2025. 英语诊断性测评与优诊学平台的回顾和前景展望[J]. 语言测试与评价, (2): 1—17.

初中英语诊断性测评助推

义务教育优质均衡发展

——基于优诊学的区域差异调查

林敦来¹ 张佳慧¹ 柳丽萍²

¹北京师范大学 ²外语教学与研究出版社

提要

基于标准的语言诊断测评在推动义务教育优质均衡发展方面具备潜力。本研究依托外研社优诊学初中生英语能力诊断测评系统，选取我国某省40所学校（其中W市20所，L市20所）学生三次测评数据进行多维度分析，探究诊断性测评在诊断和缩小校际英语教学差距中能够发挥的作用。研究发现：优诊学诊断性测评能够准确细致地反映初中英语教学的校际差异情况和校际进步差异情况。教研员能把握优诊学诊断性测评的典型特征并依此开展有针对性的教研活动，推动义务教育优质均衡发展。本研究基于一线教学中日常采用的促学性诊断系统进行探究，为义务教育英语学科实现优质均衡发展提供理论与实践参考。

关键词

语言诊断性测评；义务教育优质均衡；英语教学改进；优诊学；区域差异分析；测评数据驱动

引用格式

林敦来, 张佳慧, 柳丽萍. 2025. 初中英语诊断性测评助推义务教育优质均衡发展——基于优诊学的区域差异调查[J]. 语言测试与评价, (2): 18—34.

从学生对反馈报告的解读与应用探究诊断测评的善益性

李久亮

北京服装学院

提要

反馈报告是诊断性语言测评的重要特征，为学生开展补救性学习提供关键信息。然而目前学界对该领域给予的关注不够充分。本研究以测试使用论证为理论框架，基于测试的后效主张，分析学生如何解读与应用英语诊断测评的反馈报告来调整、改善英语学习。受试是来自三所高中的18名一年级学生。他们在第一学期开始使用优诊学高中生英语成长诊断学习系统，在学期中和学期末参加两次访谈。结果表明，大部分访谈数据构成考试善益性的理据，学生能够对反馈报告信息作出合理解读并从中获益。因此，本研究提出的测试主张基本成立。然而，也有一部分访谈数据对测试主张的理由构成反驳。文章讨论了如何帮助学生解读及应用反馈信息，以促使诊断测评充分发挥其善益性。

关键词

诊断测评；反馈报告；测试主张；考试善益性；后效

引用格式

李久亮. 2025. 从学生对反馈报告的解读与应用探究诊断测评的善益性[J]. 语言测试与评价, (2): 35—51.

基于生成式人工智能的大学生英语源文使用能力诊断测评研究

姜子芸

南京师范大学

提要

本研究基于生成式人工智能技术（GenAI），应用GPT-4.1模型对中国大学生英语学习者的综合写作源文使用能力进行诊断测评，通过诊断评分量表评估源文使用的全面性、准确性与恰当性三个维度。研究以78名大学生的读听写结合任务作文为数据来源，运用多层面Rasch模型评估GPT诊断评分的一致性与偏差，运用线性混合效应模型分析GPT诊断评分与综合写作分数之间的关系。结果表明：1）GPT与教师评分严厉度差异适度，内外部一致性较好；2）GPT在全面性维度的评分相较于教师更宽松，在恰当性维度评分更严厉；3）基于GPT的源文使用诊断测评结果显著预测考生综合写作能力。研究为GenAI赋能外语综合写作诊断测评提供方法参考和实践启示。

关键词

生成式人工智能；写作诊断测评；源文使用；综合写作任务

引用格式

姜子芸. 2025. 基于生成式人工智能的大学生英语源文使用能力诊断测评研究[J]. 语言测试与评价, (2): 52—65.

LTA

考试开发与研究

Test Development and Research

意义回忆型听力词汇测试效度验证

王华张蓉

山西大学

提要

本研究以基于论证的效度验证理论为框架，对意义回忆型听力词汇测试的评分论证、概化论证、解释论证和外推论证进行系统考察，以验证单个动词与短语动词听力词汇测试的效度。研究结果显示：1）两类测试均具有较高题目质量和信度，支持评分论证；2）部分题目存在项目功能差异，部分支持概化论证；3）两类测试测量的听力词汇知识有所不同，支持解释论证；4）两者与学习者整体听力水平均呈较强相关，但共同使用时仅短语动词测试具有显著预测作用，该结果与以往研究存在差异，基本支持外推论证。本研究为听力词汇测试的设计与使用提供了更完整的效度证据基础，对提升二语听力测评工具的科学性与应用价值具有现实意义。

关键词

听力词汇测试；短语动词；单个动词；效度

引用格式

王华, 张蓉. 2025. 意义回忆型听力词汇测试效度验证[J]. 语言测试与评价, (2): 66—80.

中国语言测试研究热点与趋势分析

（2009—2024）

——来自国家社科基金与教育部人文社科基金立项数据库的证据

刘逸凡张新玲

上海大学

提要

本研究对2009—2024年国家社科基金与教育部人文社科基金语言测试研究相关资助项目主题进行词频分析。研究结果显示：1）近15年间我国语言测试研究经历了初步探索阶段（2009—2012年）、快速发展阶段（2013—2018年）、稳定创新阶段（2019—2024年）等三个阶段，其立项数量呈波动式上升的发展趋势；2）研究热点包括语言能力量表研究、测评体系构建研究、测试技术创新研究、外语课堂评估研究等四类；3）我国语言测试研究存在厚“通用”而薄“特殊”、重“语言”而轻“内容”、多“技术”而少“社会”等不足之处。未来语言测试研究者仍需要从完善国家外语能力测评体系、开发研制内容语言融合测试、拓展语言测试社会属性研究等三个维度持续展开探索。

关键词

语言测试；研究热点；词频分析；国家社科基金；教育部人文社科基金

引用格式

刘逸凡, 张新玲. 2025. 中国语言测试研究热点与趋势分析（2009—2024）——来自国家社科基金与教育部人文社科基金立项数据库的证据[J]. 语言测试与评价, (2): 81—96.

LTA

测评与教学

Assessment, Teaching and Learning

CSE读写译策略量表在翻译硕士培养中的综合应用研究

冯莉¹ 吕晓轩²

¹黑龙江大学 ²北京林业大学

提要

本研究系统考察了《中国英语能力等级量表》（以下简称CSE）中的读写译三类策略量表在翻译硕士专业学位（以下简称MTI）培养中的综合应用及其效果。通过对67名MTI学生的问卷调查与深度访谈，经过量化与质性分析发现：CSE读写译策略能力描述语之间呈现显著的内在关联性，其中阅读策略能力（5—7级）对笔译策略能力（6—8级）的支撑作用尤为突出，写作策略能力（5—9级）与笔译策略能力在“评估与补救”维度上表现出高度协同性；MTI学生在译前规划、阅读意图分析等关键策略能力上存在明显不足；基于CSE策略量表设计的四维教学干预措施显著提升了学生的策略能力与翻译质量。本研究探索性开展了CSE策略量表应用于翻译人才培养的混合式研究，为MTI教学提供了理论和实践参考，进一步展现了CSE策略量表在外语教育领域的应用潜力。

关键词

CSE策略量表；笔译策略能力；阅读策略能力；写作策略能力；翻译硕士培养

引用格式

冯莉, 吕晓轩. 2025. CSE读写译策略量表在翻译硕士培养中的综合应用研究[J]. 语言测试与评价, (2): 97—112.

LTA

书评刊介

Book Review

《二语数字多模态创作能力测评》评介

余楠林敦来

北京师范大学

提要

作为二语写作领域的新兴话题，数字多模态创作（DMC）已在教学实践中展现出广阔潜力。然而，如何恰当地评价DMC产品与过程，仍是外语教师与研究者面临的难题。Emily Di Zhang（张娣）助理教授与Shulin Yu（于书林）副教授合著的新作《二语数字多模态创作能力测评》，及时弥补了当前研究的空缺，涵盖二语DMC能力的构念界定，二语DMC能力量表的开发、验证及应用等核心议题，为DMC测评研究提供了优秀范例。本文对该书内容进行简述，并做简要评价。

关键词

书评；多模态；写作测评；数字多模态创作

引用格式

余楠, 林敦来. 2025. 《二语数字多模态创作能力测评》评介[J]. 语言测试与评价, (2): 113—120.

LTA

会议综述

Conference Summary

多元文化背景下的语言评估：东西方的交汇

——“第46届语言测试研究学术研讨会”综述

张娟

伊利诺伊大学厄巴纳—香槟分校

引用格式

张娟. 2025. 多元文化背景下的语言评估：东西方的交汇——“第46届语言测试研究学术研讨会”综述[J]. 语言测试与评价, (2): 121—124.

全球南方背景下的语言测评：现状探索与未来方向

——“第十一届亚洲语言测试学会年度

国际研讨会”综述

孔潇潇

墨尔本大学

引用格式

孔潇潇. 2025. 全球南方背景下的语言测评：现状探索与未来方向——“第十一届亚洲语言测试学会年度国际研讨会”综述[J]. 语言测试与评价, (2): 125—126.

本刊简介及稿约

《语言测试与评价》是聚焦语言测试与评价研究的学术集刊，以“服务国家语言测评战略，探索语言测评理论前沿，推动语言测评实践创新”为宗旨，以国际视野与中国现实相结合、理论研究与实践应用相结合、专业特色与融合发展相结合、学术引领与服务社会相结合为主要特色，关注国际国内发展趋势，贯彻落实国家政策要求，注重理论联系实际，兼顾学术性和实践性，致力于解决语言测评领域现实问题。

本刊设有“热点聚焦”“理论前沿”“考试开发与研究”“测评与教学”“测评技术”“跨学科研究”“人物专访”“书刊评介”等栏目。刊文范围覆盖多语种和全学段，从不同视角探讨语言测评政策、语言测评理论与实践、语言测评技术应用、师生测评素养等。同时，本刊鼓励多学科和跨学科研究，欢迎来自二语习得、应用语言学、心理语言学、心理学、认知科学等学科与语言测评相关的学术成果。

一、稿件要求与投稿说明

来稿需与语言测试与评价切实相关，以政策研究、理论研究和实践研究为主，同时也欢迎相关学科最新动态的图书评介。研究范围可分为不同语种（英语、其他外语语种及国际中文）、不同学段（基础教育、高等教育、职业教育等）。选题应有新意，对填补研究空白有所贡献。稿件应具有较高的学术水平和实践价值，且未在其他刊物发表过。本刊尤其欢迎具有独到见解的原创性研究。

研究性论文篇幅以10,000字以内为宜，综述性文章以8000字以内为宜，新书评介（限最近两年内国内外出版的语言测评领域学术图书）以5000字以内为宜（以上字数含中英文标题、中英文提要、中英文关键词及参考文献）。
研究设计合理，研究方法可靠、符合逻辑，数据准确。论述部分需深入详尽，较为详细地说明研究结果在语言测试与评价中的应用及操作方法，避免空洞或浅尝辄止的讨论。
为了增强可读性与应用性，来稿应做到观点明确、论述简明扼要、语言通俗易懂。
来稿应遵守学术规范。对直接引用的相关言论或观点，应标注出参考文献的具体页码；对间接引用的重要思想或观点，应注明文献来源。
稿件不涉及保密问题，署名无争议。稿件一律文责自负，编辑部有权出于出版质量要求和版面需要对稿件进行必要的修改。
来稿请附详细的作者简介，包括作者所在机构、职务或职称、地址、邮编、联系电话、电子邮箱、主要研究方向等，以150字以内为宜。

二、投稿方式及其他相关事宜

投稿邮箱：请直接将稿件发送至电子邮箱 lta@zju.edu.cn。
本刊不收取版面费、审稿费等任何费用。
本刊参照国际期刊惯例，严格实行同行专家双向匿名审稿制度，采取初审、外审、复审、终审制度。稿件投出后90日内若未收到编辑部反馈，即可自行处理。
稿件一经刊登，将赠送当期样刊两册。

相关阅读

《语言测试与评价》期刊简介与投稿方式

打开微信扫一扫