本书汇报了在大数据视角下大规模英汉平行语料库的加工、检索与应用等若干问题的研究进展。
本书的第一至三章介绍了平行语料库研究的背景、大规模平行语料库研制的加工和检索技术,并通过知识图谱和可视化方法梳理国际平行语料库研究的现状与发展趋势。第四至五章回顾句法标注语料库的研制与应用,报告句法标注在英汉语言研究中的信度分析。第六至七章探讨大规模英汉平行语料库的加工问题,包括元信息标记、词法标注、句法标注和双语对齐,以及“大规模英汉平行语料库检索平台”的设计开发和应用,包括理论基础、设计思路、基本架构与功能、应用个案和信度分析。第八至十一章基于大规模英汉平行语料库开展了相关的研究,其中,第八章报告科技文体中英语被动结构的语言特征及其汉语对译形式,第九章对影响英语被动结构汉译形式的显著因素展开多变量分析,第十章以文体作为考察变量,对英语被动结构的汉译方式展开多文体对比研究,第十一章以《国富论》不同时期的汉译本为例,探讨翻译汉语名词短语复杂性特征的历时变化。
本书可为语料库语言学、语料库翻译学、翻译研究及翻译教学等领域的学者、教师提供理论启示和实践参照。