语料库在外语教学与研究中的应用提高班(二)
2011/08/01
|
||||||||
语料库应用高级研修班进入第二天,三位专家紧密结合实际案例为教师讲解了中文语料和汉英双语语料的采集与加工、正则表达式的编写、句法结构分析及基于语料库的话语分析。语料库应用的建库、数据提取、统计和数据分析三个主要阶段正在教师们的头脑中明朗起来。
Day 2 关键词:正则表达式,双语平行语料库,句法结构分析,基于语料库的话语分析 1. 正则表达式功能强大在何处? 正则表达式(Regular expression,简称regex或regexp)是计算机汇编语言中的一种技术,用于匹配文本中的字符串。这种技术简洁而功能强大,可以用为数不多的几个符号来匹配各种存在一定规律的字符串。在语料库语言学应用操作中,利用正则表达式可以极大地提高检索效果,因此正则表达式是语料库检索和文本清洁过程中必备的技术。 2. 双语平行语料库可以应用于何种研究? A parallel text is a text placed alongside its translation or translations. A parallel corpus is a corpus of parallel texts. 双语平行语料库可以用作翻译者的辅助工具和机器翻译资源,进行源语—译语对比研究和翻译语言特征研究。 3. 基于语料库的句法结构分析如何进行? 基于语料库分析句法结构,首先要求具备两个(或更多的)可比语料库,并对这些语料库进行词性赋码或句法标注,然后分别在两个语料库中提取相关的句法结构,计算其频数,分析其典型特征,进行对比以揭示观察语料库的语言特征。 4. 基于语料库的话语分析如何进行?有何常见选题? 语料库同话语分析的兼容有内容和方法上的合理性。话语连贯、语境特征和互动性都会通过一定的词汇语法特征体现出来,因而可以通过语料库技术提取和分析相关的词汇语法特征展开话语研究。 话语的典型特征及语料库研究思路可以总结如下: 研修瞬间
研修资源 梁茂成 8月3日黄金序列 梁茂成 8月3日双语平行语料的对齐 梁茂成 8月3日正则表达式初步 李文中 8月3日学习者搭配分析 许家金 8月3日基于语料库的话语分析 许家金 8月3日双语语料库检索 进入2011年外研社全国高校英语教学与教师发展系列研修班网站 |