难度定级、文本改编与教师发展:专访陆小飞博士和金檀博士
2018/01/08
陆小飞博士:文本难度或文本复杂度是在母语与外语阅读教学与研究中都非常重要的一个构念。总的来说,文本难度指的是文本阅读与理解的内在难易程度(Gamson, Lu, & Eckert, 2013)。在这个看似简单的定义背后,隐藏着两个并不简单的关键问题:影响文本难度的因素有哪些?这些因素又应该如何判定与衡量?多年以来阅读研究者对这两个问题进行了诸多探讨。
美国共同核心州立标准认为文本难度应通过以下三个维度的分析来考量:文本的质性维度分析、文本可读性的量化分析、与读者和阅读任务相关的因素分析。质性维度的分析需要受过专业训练的人对与文本难度相关的一些质性因素进行判断,如文本的知识要求、文本结构、文本所表达的意义等。可读性量化分析主要通过计算机软件对可能影响阅读难易程度的语言特征,如词汇、句法、语篇连贯等进行自动分析。第三个维度的分析则需要阅读教师考虑诸多与读者和阅读任务相关的因素,以判断文本是否适合具体的读者或阅读任务,如读者的认知能力、阅读动机、阅读经验、阅读任务的复杂程度等。
陆小飞博士:对文本难度进行定级的主要目的是为了帮助阅读者选择适合自己阅读水平的文本。例如,美国共同核心州立标准通过Lexile系统对中小学阅读材料进行定级,以帮助阅读教师、图书馆、家长和学生选择适合读者阅读水平的文本。
此外,通过对阅读课程中实际使用的阅读文本进行难度定级研究,一方面可考察教学大纲中所确定的阅读教学目标是否达到,另一方面对教学大纲的制定与调整也有指导作用。例如,我们近年受美国Spencer基金资助的一项研究对过去近百年里美国小学阅读课程中所使用的阅读教材文本难度(包括语言复杂度和阅读理解任务复杂度)的演变进行了系统的历时分析(Gamson, Lu, & Eckert, 2013; Lu, Gamson, Eckert, 2014; Stevens et al. 2015)。该项目的研究结果对美国共同核心州立标准提出的增加阅读文本难度的课程改革具有实际指导意义,因此引起了美国阅读研究领域的广泛关注。
陆小飞博士:目前文本难度定级的智能技术主要用于对与文本难度相关的语言复杂度特征的量化分析。早期的文本可读性公示多通过分析文本的词汇难度(如平均词长、单词中的平均音节数、复杂词汇的比例等)和句子长度来对文本进行定级,如Flesch-Kincaid Grade Level Readability Formula和Dale-Chall Readability Formula。美国共同核心州立标准目前使用的Lexile Framework也通过词频和句子长度来给文本难度定级。
不过,与传统的文本可读性公示不同,一些阅读测试会根据学生的表现生成与Lexile定级系统对应的阅读水平分数,学生可根据自己的分数选择与自己的阅读水平相匹配的阅读文本。随着自然语言处理技术的发展,近年来出现了众多语言复杂度或文本分析的工具,很多也被直接或间接用于文本难度定级中,如Coh-Metrix,可对文本的连贯性进行全面分析;又如上一问题中提到的我们最近的研究项目中用到的Developmental-Level Analyzer (发展水平分析器,参见Lu, 2009), L2 Syntactic Complexity Analyzer (二语句法复杂度分析器, 参见Lu, 2010)和Lexical Complexity Analyzer(词汇复杂度分析器, 参见 Lu, 2012)等。
陆小飞博士:文本改编主要适用于儿童阅读和外语阅读情景下。为了给儿童或外语学习者提供有意义且难度适合的阅读文本,我们有时需要对这些学习者可能感兴趣的阅读材料(如文学原著、学术读物等)进行改编,以将其阅读难度或语言复杂度调整到适合这些读者阅读能力的水平,因为过难或过易的读物都不利于帮助学习者提高阅读水平。
文本改编的具体实施与阅读教师或文本改编者所参考的文本难度定级标准以及所考虑的影响文本难度的因素是直接相关的。例如,根据上一问题中提到的文本可读性公式或Lexile定级标准进行文本改编,则可能会选择调整文本中低频词的比例和句子的平均长度。
金檀博士:如何应用智能技术进行文本改编是一项颇具挑战性的研究课题。我们在这个课题上做了初步探索,积累了一些经验与做法。2017年12月29日,TESOL Quarterly在线刊登了我与陆小飞老师的特约文章(Invited Teaching Issues)“A data-driven approach to text adaptation in teaching material preparation: Design, implementation, and teacher professional development”(Jin & Lu, in press),具体介绍了这些经验与做法。概括来说,有三个步骤:
(1)教师需求(Teachers’ Needs)。任何智能技术的应用,都不能脱离用户主体的需求。文本改编的用户主体通常是一线的外语教师,因此必须了解教师们对于文本改编最迫切的需求在哪里,在哪些方面需要提供技术支持,这也是应用智能技术的“初心”;
(2)文本标注(Annotations)。在充分了解教师们对于文本改编的需求后,就应“不忘初心”来进行“文本标注”了。例如,教师们希望针对不同水平等级的文本分别对难词或超纲词进行标注,这样我们应用智能技术将这些词汇标红便于识别;
(3)改编基准(Benchmarks)。在提供文本标注后,还应“不忘”教师需求这一“初心”,继续为教师的文本改编提供必要的反馈。在多轮征集教师意见后,我们决定应用智能技术为文本改编提供相应的改编基准。什么是基准范围呢?就是对改编程度的一个建议范围。例如针对超纲词,我们会给不同水平级别的文本提供一个控制范围,比如说3%~7%。这样教师们在改编的时候,就有一个改编基准可以参考了。对于如何设定基准范围,感兴趣的老师可以参考我们之前的两项研究(Jin, Li, & Li, 2016;Jin, Guo, Mak, & Wu, 2017)。
总的来说,应用智能技术进行文本改编的核心是需要教师的全程参与,就像我和陆老师在文章中所说,“full participation by TESOL teachers was central to the success”。基于我们研究所开发的“iTEST英语文本指难针”已免费对外公开使用,网址为:http://languagedata.net/tester/。
金檀博士:对于外语教师来说,应该如何看待和使用智能技术来促进教学和研究呢?这是另一项非常有挑战,但很有意义的研究课题。陆老师和我在外研社U讲堂推出了“语言、数据与研究:量化工具百宝箱”(网址:http://ucourse.unipus.cn/course/536),尝试讲解目前外语教学与研究中常用的智能技术工具,包括词汇工具(Range、Sketch Engine)、句法工具(句法复杂度分析器)与篇章工具(英语文本指难针、Coh-Metrix)。
在学习“量化工具百宝箱”这门课时,我们有三个建议(详见Jin & Lu, in press):
第一,学习工具的基本原理。每种智能工具都有自己的使用情景。这是什么意思呢?就是有的智能工具是用于分析写作文本的,我们一般不能再用于分析口语文本。因此,在学习一项工具之前,要了解该工具的基本原理,这样就可以有的放矢。
第二,自己动手来操作试试。随着智能技术的发展,现在研发的智能工具越来越人性化、便于操作。无需对智能工具有恐惧心理,认为智能工具是技术人员的“专利”,自己是文科背景,学不好、用不会。实践证明,只要努力尝试,大多数智能工具还是比较容易掌握的。
第三,实践检验、积极反思。智能工具的学习和使用,一定要在自己的教学情境中去实践与检验,并可以反思该智能工具的优点与不足,还可以尝试收集数据去进一步研究,这样一项教学研究的雏形就基本形成了。
总的来说,我们一定要立足于外语教学课堂中的问题,然后就像我们在“语言、数据与研究”系列课程(http://ucourse.unipus.cn/study/map/8/detail)的寄语中所说,先是“带着问题学方法”,然后“不忘初心用工具”,从而“继续前行写论文”。谢谢大家抽出宝贵时间来阅读我们的访谈,我们真心希望:“和语言相伴,与数据同行,让我们在教学和研究中共同成长”。
拓展阅读
[1] Gamson, D. A., Lu, X., & Eckert, S. A. (2013). Challenging the research base of the common core state standards: A historical reanalysis of text complexity. Educational Researcher, 42, 381-391. https://doi.org/10.3102/0013189X13505684
[2] Lu, X., Gamson, D. A., & Eckert, S. A. (2014). Lexical difficulty and diversity in American elementary school reading textbooks: Changes over the past century. International Journal of Corpus Linguistics, 19, 94-117. https://doi.org/10.1075/ijcl.19.1.04lu
[3] Stevens, R. J., Lu, X., Baker, D. P., Ray, M. N., Eckert, S. A., &Gamson, D. A. (2015). Assessing the cognitive demands of elementary school reading curricula: An analysis of reading text and comprehension tasks from 1910 to 2000. American Educational Research Journal, 52, 582-617.https://doi.org/10.3102/0002831215573531
[4] Jin, T., Li, Y., & Li, B. (2016). Vocabulary coverage of reading tests: Gaps between teaching and testing. TESOL Quarterly, 50, 955–964. https://doi.org/10.1002/tesq.324
[5] Jin, T., Guo, K., Mak, B., & Wu, Q. (2017). Lexical profiles of reading texts in high-stakes tests: Where are the benchmarks? International Journal of Computer-Assisted Language Learning and Teaching, 7, 34–49. https://doi.org/10.4018/IJCALLT.2017010103
[6] Jin, T., & Lu, X. (in press). A data-driven approach to text adaptation in teaching material preparation: Design, implementation, and teacher professional development. TESOL Quarterly. Advance online publication. https://doi.org/10.1002/tesq.434