首页>学术科研>文献推荐

语料库语言学文摘(2013年第1期)

许家金

推荐理由:

语料库研究素以量化描述见长,然而若止于量化,终于描述,语料库语言学这株苗圃新花,将注定是昙花一现,也必定营养不良,难以长盛。不少人主张应结合现有理论阐释量化数据。遗憾的是,这方面的成功案例少之又少。本期《语料库语言学文摘》(以下称《文摘》)所收2013上半年刊发的一些论文值得格外关注。无论是针对本族语或中介语的研究,都在数据的理论提升方面有诸多可圈可点之处。

 

本期选出的全文转载论文,多数都注重语料数据和现有语言理论的结合。比如,与认知语言学/功能语言学(张立飞、严辰松)、二语习得理论(章柏成)、篇章体裁分析(张乐、卫乃兴)、语言类型学视角(李金满、吴芙芸)、心理语言学研究(李海、张淑静)、社会认知(谭业升)等领域的相互关照。可见语料库语言学除去坚守自身理论内核外,还具有包纳其他语言学理论的开放性。语料库语言学与相关研究领域的互通,表明其具有广泛的适应性和扩展空间。

 

《文摘》全文收录论文的作者,多数并非专攻语料库语言学的学者,他们有各自的理论立场。这些学者的加入,使得语料库语言学研究丰满了许多。语料库语言学不再仅仅热衷于词块、主题词、搭配、语义韵这些传统议题。随着更多学者带着各自理论视角投入语料库研究,可以预见语料库语言学将会不断孳生新的研究增长点。

 

《文摘》收录论文中体现出的研究动向,若借用研究方法相关的概念来看,可以说它们或多或少都采用了某种方式的“三角验证”(triangulation)。这种译法,多少有些生硬。同古汉语一样,此处的“三”是虚指,表达“多”的含义。因此,triangulation称为“多重验证”或“多重论证”更合本义(有关triangulation的类型,可参看Denzin 1970: 301)。诚然,《文摘》八篇选文中,很多更应看作量化研究和定性研究的混合型研究设计(参看Hashemi 2012)。多重验证是为加强论证的信度,混合设计(尤其是“后继型混合设计”,sequential design)则更多是为拓展研究的深度和广度。

 

基于语料库的语言研究中,语言学理论的引入,有助于深化语言描写层次,挖掘现象背后机制的同时,还肩负着与相关领域进行理论对话的使命。比如,张立飞、严辰松一文,利用平衡汉语语料库,就汉语中的复杂名词短语,特别是“的”字连用和单用的语言事实,对语法界权威观点(刘丹青 2008)提出质疑,修正了此前对独“的”复杂名词短语使用规律的描述,并从认知功能角度做出合理解释。在研究结论处,张立飞、严辰松认为“语法虽然有着功能或认知上的动因,并不是绝对的,而是呈现出一种概率性”。可见“计算机时代的田野调查者”(许家金 2011)很有必要与“坐而论道的语言学家(armchair linguist)”互学互辩。照此下去,语料库方法强于形式描写,弱于理论阐释的状况自会改观。

 

词语学要义

许家金

推荐理由:

全书共分九章,内容包括:词语学的理论基础与方法论特征,词语搭配研究的方方面面,非词语化,语义韵,词语的评价意义,文化关键词的话语意义,短语学,词块研究,对比词语研究。本书系统阐释论述了词语学这个领域,内容丰富,条理清晰,具有很好的阅读学习价值

A glossary of corpus linguistics

许家金

推荐理由:

 

本书是一本语料库语言学术语词典。书中既包括传统的,也包括最新的语料库语言学术语,主要涉及以下几个方面:主要的语料库、主要的语料库语言学术语、与语料库研究相关的主要语言学术语、主要的数据分析方法、语料库建设和分析中常用的软件或提取程序、语料库语言学中的相关标准等。

语料库语言学文摘(2012年第1期)

许家金

推荐理由:

        语料库,顾名思义,即语言材料数据库。而其对应的英文corpus(源于拉丁文,复数corpora),有“身体”、“尸体”、“~体”、“汇集”等义,初一接触,实在让人不明就里。事实上,corpus的本义,除见于一些专业术语和固定表达外,已很少用。与现代语言学概念中corpus相近的用法则有a corpus of Shakespeare(莎翁作品集萃)。如今,语料库语言学中的corpus,则专指服务于语言研究及应用,存储于电脑中的大量真实语言材料的电子文本汇集。

        现代大型电子语料库及相关研究,始于20世纪60年代大西洋两岸,经五十余年发展,至今几成显学。语料库语言学是一门朝阳学科:注重语言事实的量化描述,分析流程规范,逐渐赢得学界的认可。然而,也有观点认为,语料库方法强于语言用法特征的描述,弱于理论阐释,因此,有必要向其他语言学流派,或其他学术领域虚心求教,以求学科臻于完善。

        在语料库研究成果应用方面,西方学者已迈出坚实步伐,在语法书编写、词典编纂、教育教学上都有诸多经典案例。国内语言学界利用语料库者也已不在少数,对相关理念、方法的把握并不落后于西方。我们期待具有重大影响力的学术成果的问世,这自然需要学界同仁不断精进。

        在我国,语料库语言学从萌芽到蓬勃发展,已有三十多年。三十多年来,中国的语料库语言学者筚路蓝缕,从草创到开拓,从试验到创新,功不可没。在他们身影的背后,留下一行行清晰的脚印。他们创建语料库,培育团队,立足本土开展语料库应用,引介与创新并重,如今已成果缤纷,蔚然可观。今天的中国语料库研究大“家庭”里,汇聚了德高望重,笔耕不辍的长者,年富力强的中坚,更有一批精通计算机技术的专业人士与我们同行,共同构建一个更加富有活力的学科队伍。

 

       编辑这本《语料库语言学文摘》,意在记录和追踪我国语料库语言学研究领域的进展和动态,使之成为了解语料库语言学研究的一个窗口,以期做到拥一卷《文摘》而可观大略。入门者若由读《文摘》开始,则开卷有益,精进者则可在此基础上广闻博览。我们以此期望,中国语料库语言学学界能做出既具本土特色,又能与国际学界对话的优质研究。

      《文摘》计划每年两期,以电子版和少量纸质版免费公开发布。《文摘》的资料收集、整理和编辑,主要由北京外国语大学中国外语教育研究中心语料库语言学团队完成。

 

 

BFSU CQPweb多语言在线语料库检索平台

许家金

推荐理由:

 

“BFSU CQPweb多语言在线语料库检索平台(http://124.193.83.252/cqp/ ,用户名:test,密码:test)”由北京外国语大学中国外语教育研究中心的许家金副教授2012年主持创建。

 

目前BFSU CQPweb平台上已安装英语、汉语、德语、日语、俄语、阿拉伯语、冰岛语等7个语种27个语料库。按语体分,有口语、书面语语料库;按体裁分,有小说、演讲、法律、新闻和通用语料库等。其中莫言小说语料库和跨越近1000年的冰岛语历时语料库更是其中的特色。

 

CQPweb是开源的四代语料库分析工具。CQPweb的主要特点是:1、将语料库与分析工具合二为一;2、支持多语种语料库的分析;3、运用了索引技术,检索速度大大快于单机版语料库;4、充分利用语料库的元信息,提供更多呈现语料分析结果的呈现方式。CQPweb可以实现WordSmith Tools等三代语料库软件的绝大部分功能。

概括说来,CQPweb可以实现以下功能。

(1)在线生成语料库的词频表(frequency list);

(2)查询(query)字词、语言结构等,以获取大量语言实例或相应结构的出现频次(frequency),并可以按语体、年代、章节、学生语言水平级别、写作题材等分别呈现查询结果。

(3)计算特定词语在语料库中的典型搭配(collocation);

(4)计算语料库中的核心关键词(keywords)等。

 

有关BFSU CQPweb的使用,可参看“多语种在线语料库检索平台BFSU CQPweb使用简明手册”http://ishare.iask.sina.com.cn/f/34579400.html

 

共25记录«上一页12345下一页»