语言学中语料库的定义及实例

在语言学中,语料库是用于研究、学术和教学的语言数据(通常包含在计算机数据库中)的集合。也称为文本语料库。复数:语料库。...

在语言学中,语料库是用于研究、学术和教学的语言数据(通常包含在计算机数据库中)的集合。也称为文本语料库。复数:语料库。

corpus linguistics

第一个系统组织的计算机语料库是布朗大学标准的当代美国英语语料库(俗称布朗语料库),由语言学家亨利·库切拉和W·纳尔逊·弗朗西斯于20世纪60年代编译。

值得注意的英语语料库包括:

  • 美国国家语料库(ANC)
  • 英国国家语料库(BNC)
  • 当代美国英语语料库(COCA)
  • 国际英语语料库(ICE)

词源来自拉丁语“body”

实例和意见

  • “20世纪80年代出现的语言教学“真实材料”运动[提倡]更多地使用真实世界或“真实”材料——不是专门为课堂使用而设计的材料——因为有人认为这些材料会让学习者接触到从真实世界语境中提取的自然语言使用的例子。最近语料库语言学的出现和大规模数据库或语料库的建立不同类型的真实语言为向学习者提供反映真实语言使用的教材提供了进一步的途径。”(Jack C.Richards,系列编辑前言。在语言课堂中使用语料库,Randi Reppen。剑桥大学出版社,2010)
  • 交流方式:书写和言语“语料库可以对任何方式产生的语言进行编码——例如,有口语语料库,也有书面语语料库。此外,一些视频语料库记录了副语言特征,如手势……,并构建了手语语料库……”代表一种语言的书面形式的语料库通常是构建的最小技术挑战。Unicode允许计算机在世界上几乎所有的书写系统中可靠地存储、交换和显示文本材料,无论是现在的还是已经灭绝的。“然而,收集和转录口语语料库的材料很费时。有些材料可能是从万维网等来源收集的……但是,像这样的转录本并没有被设计为口语语言探索的可靠材料……”poken语料库数据通常是通过记录互动然后进行转录来生成的。口语材料的正字法和/或音位转录可以编译成一个语音语料库,可以通过计算机进行搜索。”(Tony McEnergy和Andrew Hardie,《语料库语言学:方法、理论和实践》,剑桥大学出版社,2012年)
  • 协和“检索是语料库语言学的核心工具,它只是指使用语料库软件查找特定单词或短语的每一次出现。有了计算机,我们现在可以在几秒钟内搜索数百万个单词。搜索词或短语通常被称为“节点”,协调行通常以节点词/短语出现在行的中心,每侧有七个或八个词。这些被称为上下文中的关键词显示(或KWIC一致)。“(安妮·奥基夫、迈克尔·麦卡锡和罗纳德·卡特,《导论》。《从语料库到课堂:语言使用和语言教学》。剑桥大学出版社,2007年)
  • 1992年“语料库语言学的优势”[Jan Svartvik]在一本有影响力的论文集的前言中介绍了语料库语言学的优势。他的论点在这里以缩写形式给出:-语料库数据比基于内省的数据更客观。-语料库数据可以很容易地被其他研究者验证,研究者可以共享相同的数据,而不是总是编译他们的wn。-研究方言、语域和语体之间的差异需要语料库数据。-语料库数据提供语言项目的出现频率。-语料库数据不仅提供说明性示例,而且是一种理论资源。-语料库数据提供了许多应用领域的基本信息,如语言教学和语言教学语言技术(机器翻译、语音合成等)-语料库提供了对语言特征进行全面问责的可能性——分析员应解释数据中的所有内容,而不仅仅是选定的特征。-计算机化语料库使世界各地的研究人员都能访问数据。-语料库数据是非母语人士使用该语言的理想选择。(Svarvik 1992:8-10)然而,斯瓦特维克还指出,语料库语言学家也必须进行仔细的手工分析:仅仅数字是不够的。他还强调语料库的质量很重要。”(汉斯·林德奎斯特,《语料库语言学与英语描述》,爱丁堡大学出版社,2009年)
  • 语料库研究的附加应用“除了在语言学研究中的应用之外,还可以提到以下实际应用。词典编纂者导出的频率表,尤其是一致性,正在成为词典编纂者的基本工具。语言教学。使用一致性作为语言学习工具是目前计算机辅助语言学习的主要兴趣(CALL;见约翰1986)。语音处理机器翻译是计算机科学家称之为自然语言处理的语料库应用的一个例子。除了机器翻译,NLP的一个主要研究目标是语音处理,即开发能够从书面输入输出自动生成的语音(语音合成)或将语音输入转换为书面形式(语音识别)的计算机系统。《语言学百科全书》,Kirsten Malmkjaer主编,Routledge,1995年)

  • 发表于 2021-10-07 16:44
  • 阅读 ( 179 )
  • 分类:人文

你可能感兴趣的文章

语言美国化的定义和实例

在语言学中,美国化是指美国英语独特的词汇和语法形式对英语其他变体的影响。也被称为语言美国化。 正如Leech和Smith*在下文中所观察到的,“如果‘美国化’一词被认为意味着AmE对BrE的直接影响,则应谨慎对待”(2009年...

  • 发布于 2021-09-06 00:55
  • 阅读 ( 224 )

语言中模糊性的定义及实例

...社,2005年 David Tuggy,“歧义、多义和模糊性”,《认知语言学:基础阅读》,德克·盖尔茨主编。穆顿·德格吕特,2006年 蒂莫西·威廉姆森,模糊。劳特利奇,1994年

  • 发布于 2021-09-14 06:22
  • 阅读 ( 234 )

语言学中裁剪的定义及实例

...形式可能会取代原来的单词。 实例和意见 根据《当代语言学:导论》一书,剪辑最常见的产品是名字Liz、Ron、Rob和Sue,它们是伊丽莎白、罗纳德、罗伯特和苏珊的缩写。作者指出,剪辑在学生的演讲中特别流行,它产生了教...

  • 发布于 2021-09-21 02:15
  • 阅读 ( 188 )

方言水准测量的定义及实例

在语言学中,方言均衡是指在一段时间内减少或消除方言之间的显著差异。 当不同方言的说话者长时间接触时,方言水平会发生变化。与普遍的看法相反,没有证据表明大众媒体是造成方言水平下降的重要原因。事实上,《...

  • 发布于 2021-09-21 16:39
  • 阅读 ( 218 )

语言规划意味着什么?

...言社区中一种或多种语言的使用而采取的措施。 美国语言学家约书亚·菲什曼(Joshua Fishman)将语言规划定义为“为实现语言地位和语料库目标而进行的权威性资源分配,无论是与渴望实现的新功能有关,还是与需要更充分发...

  • 发布于 2021-09-22 02:41
  • 阅读 ( 265 )

语系定义及实例

...最好的语系。在过去200年的大部分时间里,研究IE的比较语言学的学者比所有其他语言学领域的学者加在一起还要多。我们对IE语言的历史和关系的了解比任何其他语言组都多。对于IE的一些分支——希腊语、梵语、印度语、拉丁...

  • 发布于 2021-09-22 15:11
  • 阅读 ( 212 )

英语习语的定义及举例

...定的)语素序列的语言块中产生的,这导致[John]Sinclair[在语料库一致性搭配中,1991]提出了“习语原则”。他这样陈述了这一原则: The principle of idiom is that a language user has available to him or her a large number of semi-preconstructed phrases t...

  • 发布于 2021-09-22 16:49
  • 阅读 ( 274 )

语言中缩略语的定义及实例

在社会语言学中,acrolect是一种克里奥尔语变体,由于其语法结构并没有明显偏离标准语言变体的语法结构,因此往往受到尊重。形容词:顶选。 与basilect形成对比的是,basilect是一种与标准变体截然不同的语言变体。介观选...

  • 发布于 2021-09-22 17:42
  • 阅读 ( 246 )

转换语法(tg)定义及实例

...结构》一书出版后,转换语法在接下来的几十年里占据了语言学领域的主导地位。 “被称为转换生成语法的时代,意味着与[二十世纪]上半叶的语言传统的一个急剧的决裂由于其主要目标是制定一套有限的基本和转换规则,解...

  • 发布于 2021-09-23 02:44
  • 阅读 ( 356 )

单态词的定义及实例

...B.Pierrehumbert,“概率音位学:辨别力和稳健性”,《概率语言学》,由Rens Bod、Jennifer Hay和Stefanie Jannedy主编。麻省理工学院出版社,2003年) 语素和音节 “一定不要把语素和音节混淆起来;密西西比有不止一个音节,但只是...

  • 发布于 2021-09-24 21:54
  • 阅读 ( 265 )
nvybh772
nvybh772

0 篇文章

相关推荐