语料库在外语教学与研究中的应用(北京)

2023.08.08 - 2023.08.09 北京

主讲专家: 许家金刘鼎甲

价格:¥1880.0

 

我要报名1691596799000

  语料库自诞生之日起,便与语言教育尤其是外语教育密不可分。新一代人工智能的蓬勃发展为语料库语言学研究注入了新动能,也为深化外语教育改革带来了新契机。将语料库语言学的研究成果和技术手段应用于外语教学与研究尤为重要。

  为促进语料库语言学与外语教育深度融合,北京市教育委员会、北京外国语大学中国外语与教育研究中心和外语教学与研究出版社将于2023年8月8—9日北京举办语料库在外语教学与研究中的应用研修班,特邀北京外国语大学许家金教授刘鼎甲老师,通过专家讲座、教学和研究案例展示、实践演练等形式,系统讲解语料库语言学基本概念、语料库创建原则及加工方法,介绍常见语料库资源和语料库研究方法,并结合教学应用与研究案例,分享语料库在外语教学与研究中的应用思路,帮助高校外语教师切实掌握语料库语言学核心理念和语料库技术操作、深入开展外语教学及相关研究。

 

【研修特色】

  • 明晰理论,夯实基础

主讲专家将系统讲解语料库语言学的基本概念、语料库的创建原则及语料库标记与标注等操作,帮助参班教师厘清语料库基础知识,知晓经典时代与后经典时代的语料库研究方法,掌握语料库创建流程和基础操作技能。

  • 结合案例,掌握方法

主讲专家将结合语料库在教学大纲、教材编写、词典编纂、课堂教学中等应用案例,深入讲解语料库研究方法及其在外语教学中的应用,演示语料检索、解读与分析,讲解基于R语言的可视化程序、对应分析、条件推断树、逻辑斯蒂回归建模等研究方法,助力教师深入理解语料库研究方法,掌握实际应用技能。

  • 贯通实践,强化应用

研修采用学-思-用相结合的方式,主讲专家将根据研修内容提供实践素材,通过小组活动、汇报展示及点评指导等环节帮助参班教师内化研修所学,提高应用能力,同时展望包括ChatGPT在内的大语言模型与语料库技术的融合应用。

 

 

【研修日程】

许家金

北京外国语大学中国外语与教育研究中心副主任、人工智能与人类语言重点实验室多语种语料库研究中心主任、教授、博士生导师。中国语料库语言学研究会秘书长、全国语料库翻译学研究会副会长。《语料库语言学》杂志主编。教育部“新世纪优秀人才”。先后主持9项国家社科基金及省部级课题。主要研究兴趣为语料库语言学、二语习得、语言对比与翻译、语料库词典学。

刘鼎甲

博士,硕士生导师,教育部人文社会科学重点研究基地中国外语与教育研究中心专职研究员,国家语言文字工作委员会科研机构国家语言能力发展研究中心专职研究员,中国英汉语比较研究会语料库翻译学专业委员会理事。主要研究领域为语料库语言学、计算语言学与数据库理论与实践。主持国家社科项目、国家语委重点课题、教育部哲学社会科学青年项目、博士后科学基金、北京外国语大学校级重点和数据库课题等,在 CSSCI、CSCD、 SCI、 EI和 EBSCO索引的国内外期刊发表论文20余篇,具有丰富的语料库研究经验。目前开设《 语料库数据分析方法》《语言学理论与实践研讨》等课程,设计和开发多项语料库数据处理、分析和检索平台,具有丰富的学术研究与写作经验。

磨语料库研究利器,展数智时代新篇章

——语料库在外语教学与研究中的应用”研修班

 

  8月8—9日,外研社2023年暑期全国高等学校外语学科中青年骨干教师高级研修班第九期——语料库在外语教学与研究中的应用研修班在北京成功举办。本期研修班特邀北京外国语大学许家金教授刘鼎甲博士主讲,详细介绍了语料库语言学与语料库翻译学的发展脉络、语料库研究方法及应用、常用软件工具及其操作方法、ChatGPT等大语言模型与语料库的融合应用等内容,并通过实操讲解和实战演练,助力来自全国160余所院校的200余名高校外语教师夯实语料库理论基础,掌握语料库方法与工具,提升科研能力,改善教学实践。

研修会场

北京外国语大学 许家金教授

北京外国语大学 刘鼎甲博士

 

厘清概念,掌握原则

  研修伊始,许家金教授简要回顾了“语料库在外语教学与研究中的应用”研修班的发展背景与课程设置情况。随后,刘鼎甲老师梳理了语料库的源流,详细介绍了各个时期的语料库语言学流派、代表人物及研究成果。刘老师强调,语料库研究具有广阔的学科视野,大有可为。刘老师介绍了经典时代语料库研究中的基本术语,并阐述了与词相关的语料库统计方法以及语料库操作相关概念。

  许家金教授介绍了文本编辑工具EditPlus和语料库文本检索分析工具AntConc的具体功能。通过多个研究案例,详细阐述了创建语料库的原则——目标原则、代表性原则和量的规模原则。接着介绍了COCA、BNC等大型主流语料库及其获取方式,展示了由北外语料库团队创建的多语种、多用途在线语料库集群(BFSU CQPweb)。许教授强调,在选择特定语料库之前,研究者应该详细了解该语料库的库容、所含语料文体等基本信息。此外,在建设语料库时,需要制定取样方案,或参考现有语料库的取样方案。

  创建语料库的第一步是采集语料。许教授讲解了采集语料的基本操作,重点介绍了几种网页自动爬取方式,演示了如何运用idiom search网站确定检索关键词,并使用BootCaT工具自动爬取网页文本。许教授还讲解了如何利用Syntactic Complexity Analyzer、Readability Analyzer等工具来分析语料文本的词汇难度和句法复杂度。

 

驾驭方法,熟练操作

  刘鼎甲老师介绍了不同类型语料库的标记规范,并强调了文本分类的完备性与边界性。他以新闻文本为例,示范了语料文本元信息标记的方法,并指导参班教师制作元信息表头。刘老师重点讲解了词性标注。在进行标注前,熟悉词性标注集是非常重要的,他详细介绍了UCREL CLAWS5和Penn Treebank P.O.S.等常用标注集。在此基础上,刘老师使用Tree Tagger和CorpusWordParser两种典型标注工具分别对英文和汉语语料进行分词和词性标注,并引导参班教师进行实际操练。

  许家金教授带领参班教师解读了词性标注后的文本。他通过实例来说明,标注后的文本能帮助研究者快速检索特定的词类或短语结构,并分享了一些可用的语料库标注工具资源。随后,许教授通过AntConc语料库分析工具,演示了如何对标注好的语料进行统计分析。

 

数智融合,未来已来

  语料库语言学发展到后经典时代,在描写语言现象的基础之上,通过统计、观测,更可以回答为什么出现此种现象的问题。刘鼎甲老师介绍了R语言的特点以及RStudio的界面功能。紧接着,两位主讲专家使用该软件详细示范了数据的可视化操作,并解读了统计分析结果。许教授以评价语言研究为例,演示了如何进行对应分析;刘老师以主语回指语研究为例,演示了如何用条件推断树进行统计分析。参班教师在主讲专家的引导下,一步步操练基于R语言的语料库数据分析。

  语料库方法以其量化特征,回应语言学中形义对应关系这个根本问题。许教授通过《大学英语教学大纲通用词汇表》等实际案例,详细展示了语料库在英语教学中的应用。在教学大纲方面,可以利用语料库制作词表。在教材编写方面,可以利用语料库确定目标语言学习特征、提供真实口语语料、分析教材语言难度。在词典编纂方面,可以利用语料库抽取相关领域的专业词汇、创建词条。在课堂教学方面,许教授阐释了大语言模型在教学设计中的应用路径与方法,并使用Twee来演示视听说练习的设计。

  刘鼎甲老师分享了语料库在翻译教学和研究中的应用案例。他从翻译中的词汇选择和表层结构入手,指出翻译教学中存在的规定性问题,进一步指出语料库翻译学是在描写译学的基础上建立起来的,并系统梳理了语料库翻译学的三个发展阶段。刘老师以自己对被动结构和大学介绍信息的翻译研究为例,演示了如何应用语料库进行翻译研究,从而解决翻译教学中的问题,改善翻译教学与实践。最后,刘老师向参班教师介绍了一系列语料库资源,如CQPweb、English-Corpora平台,BCC语料库等。

  在读博士郭嘉雯、任俊强、杨宇航、殷俪恺同学和在读硕士宋瑛明同学担任助教,在研修过程中,及时解决参班教师操作实践中的问题。

 

道技合一,创意激荡

  在小组实践活动中,六组教师利用ChatGPT等大语言模型开展外语教学或研究设计。西华师范大学宋莉老师、云南中医药大学孙雯老师、成都东软学院李少波老师、浙江工商大学杭州商学院杨仙菊老师、首都医科大学傅斯亮老师、黔南民族师范学院曾令忠老师代表小组展示了设计成果,主讲专家高度肯定了各小组的智慧与创意,同时进行了具有针对性的反馈和有益补充。

小组汇报代表

 

  本次研修班由外研社高等英语教育出版分社李晓雨主持。两天的研修紧张而充实,在主讲专家的引导下,参班教师对语料库语言学与语料库翻译学的发展脉络、语料库研究方法及应用、常用软件工具及其操作方法有了深刻的了解。他们不仅从经典时代迈向后经典时代,还展望了ChatGPT等大语言模型为语料库研究和外语教学带来的便利与洞见。参班教师表示收获颇丰,课程内容实用,为自己今后的教学与科研奠定了深厚的基础。

外研社高等英语教育出版分社 李晓雨

 

  外研社将一如既往为全国高校外语教师提供教学和科研全方位服务,与教师一道汲取学科育人新理念,探索教学改革新路径,构建外语教育新生态,落实“强师”基础要求,投身“强教”战略实践,共赴“强国”伟大征程!

 

乐思奖获奖名单

 

  许家金和刘鼎甲两位老师的讲座高屋建瓴,令人受益匪浅。两位老师对语料库源流、语料库语言学基本概念、语料库的创建与加工、经典时代与后经典时代语料库研究方法等几大方面做了非常全面的介绍,其中让我收获最大的就是大语言模型辅助外语教学与研究的方法。当今社会,语言教师要结合自己的教学与科研兴趣,借助大语言模型,实现人机协调,既可以提高教学效率,也可以辅助教师将科研与教学有机融合,提升教师的科研素养和信息素养,以研促教,以研促学,以研促评。人工智能对教师带来了更大的挑战,我们应该站在时代的前沿,充分利用大数据,为教学和科研服务。

——李老师 唐山师范学院

 

  本次语料库主题研修班令我受益匪浅,我了解了语料库的创建过程和语料库加工的技巧。最令我兴奋的部分是关于预训练模型与语料库技术融合的内容。学习如何将语料库数据与预训练模型相结合,可以帮助我更好地理解模型的表现形式和改进方法。通过培训,我不仅增加了对语料库技术的理解,还掌握了实际操作的技能。这对于我未来在语言研究和自然语言处理领域的发展将产生积极影响。这次培训帮助我迈出了重要的一步,期待能将所学知识应用于实际项目中,为语言技术的发展贡献一份力量。

——张老师 浙江经贸职业技术学院

 

  今天的课程使我对后经典时代语料库研究方法有了初步认识,极大地扩展了我的思路。语料库不仅可以用于结构性分析,还可以结合R语言进行对应分析、条件推断树以及逻辑斯蒂回归建模。例如,条件推断树的应用可以在文本数据中发现相关因素和变量的关系,在教学实践中就能够更好地分析学生的学习情况和影响因素,从而采取更有效的教学策略。此外,两位老师还介绍了语料库在英语教学大纲、教材编写、词典编撰、课堂教学中的应用,给出了实用建议,并推荐了很多教学辅助工具,帮助我们提升借助语料库资源和数据进行教学设计的能力,从而提高教学质量和研究效率。

——彭老师 西南政法大学

 

  今天学习了基于R语言的语料库分析中的可视化程序的基本操作。因为我是文学专业,以前很少需要制图,今天跟着老师一步步操作,看着漂亮又清晰明了的图形出现在眼前,很有成就感。另外,我还了解了twee.com等非常好用的网站和工具,这为我以后的教学工作提供了极大的便利。各组汇报代表的演示也让我深受启发,ChatGPT在续写和翻译等领域都可以巧妙融入教学和研究设计。再次感谢外研社,希望能有机会再次参加语料库研修班!

——胡老师 山西大学

相关推荐

X

打开微信扫一扫