语料库在大学英语词汇教学中的应用

  • 来源:知识文库
  • 关键字:语料库,大学英语,教学
  • 发布时间:2015-03-10 12:13

  一、语料库的基本知识

  语料库通常是指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。

  语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源,这是因为经过科学选材和标注、具有适当规模的语料库能够反映语言的实际使用情况,人们可以通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库是以电子计算机为载体承载语言知识的基础资源,其语言材料是在语言的实际使用中真实出现过的,真实的语料需要经过加工、分析和处理才能成为有用的资源。

  二、语料库在英语词汇教学中的应用

  1、词频统计

  根据大学英语教材语料库的统计结果可以看出,如果能够掌握频率表中出现频率最高的词汇,在阅读时就可识别出整篇文章词汇的一半左右。而在英语词汇的教学过程中,应着重讲授这些频率最高的词汇。掌握词频统计表中的常用的大约8000个词汇,就可以覆盖语料的90%以上。

  所谓的高频词汇,就是一个文本中出现频率较高的词汇,是根据语料库中的语料统计研究得出的高频词汇,并不是凭感觉或主观经验来确定的词汇。只有通过语料库中的词频统计研究得到的词汇,即高频词汇才是真正的常用词汇。通过英语词汇的高频词汇表,可以确定英语词汇学习的主要内容,找出词汇学习的重点,为学习者提供参考,因此,在学习英语词汇时,应该首先学习出现频率较高的常用词汇,把与词汇有关的语言规律作为学习的重点从而减轻词汇学习中的不必要的负担。

  2、词类分布

  在英语中,词类分为开放词类和封闭词类两大类。开放词类指各种实义词,包括名称、形容词、副词和动词。封闭词类指所有的功能词或结构词,包括介词、代词、限定词、连词和助动词。此外还有基数词、序数词、感叹词是介乎“封闭”与“开放”之间的词类。

  在词汇研究中,可以利用标注后的语料对哪些词类是经常使用和语料库中词类的出现频率和分布情况进行研究,从而在英语学习中选择合适的内容和学习的先后次序,找出学习的重点,避免由于选择过时的表达方法而造成学习的滞后性。通过语料库研究可以得出,开放词类比封闭词类分布性广,开放词类如名词、动词、形容词的使用词次数都超过了千次,而封闭词类如限定词和量词的使用词次数只有几十个词次,另外,从统计的数据中还可以看出,语料库中出现在句首和句尾的最常用的词类搭配中频率最高的三个分别是形容词+名词,定冠词+名词,介词+名词,从语法的角度来看句尾的词类搭配比句首的词类搭配更容易检测。因此,基于语料库的词汇研究对进一步的句法研究有很大程度上的借鉴作用。

  3、词汇复杂度

  词汇复杂度即词汇的变化程度是用文本中的词形和词次的比例来表示的。词形是文本中使用到的词汇,词次是这些词汇在文本中出现的总次数。同一词形在真实的文本中可能被多次使用,因而词次一般要比词形多,语料库的总次数是指语料库所含的总词次。词汇复杂度可以通过以下两种方法进行计算:词汇复杂度 = 词形/词次

  把文本分成层次或分成段落,然后将结果平均,得出文本的词汇复杂度,这样词汇的变化程度也是比较准确的。词形/词次的比值越高,表明文本中使用的词越多,重复词相对越少。另外,词汇复杂度与文本的长度有关,因此,文本越短,词汇重复少,词汇复杂度越高;文本越长,词汇重复使用越严重,词汇复杂度会降低。

  通过大学英语教材语料库研究可以得出,一般英语教材中的词汇复杂度较低,文本长度大致相同,所以词形大约都在300-500个之间,词次,也就是这些词汇在文本中出现的总次数大约在3000-6000次之间,所以词汇复杂度 = 词形/词次,大约为0.1左右。而学生在写作中,文本使用到的词汇也就是词形,大约在200-400个之间;词次,也就是这些词汇在文本中出现的总次数大约在2500-5000之间,所以词汇复杂度也是大约为0.1左右。由此可见,英语教材中的词汇复杂度与学生的写作中的词汇复杂度较为接近,学生完全可以在平常的学习中,通过背诵教材中的课文,而没有必要阅读过多的课外读物来加强自己的词汇量。

  4、词汇密度

  词汇密度是指文本中所含的实词和功能词的百分比。所谓实词是指内容性词汇,包括用以传达信息的名词、动词、形容词、副词等开放类性词汇;功能词主要包括助动词、冠词、介词、连词等。一般情况下,称实词为TW,功能词为FW,则 LD = TW/FW。 实词与功能词的比例越高,则词汇密度越大。根据研究表明,LD取决于文本的类型,与文本长度无关。

  一篇文章中所含有的信息量的高低是可以通过句子的词汇密度来进行比较的。如果语篇的词汇密度大,这就说明,这篇文章中使用的实词比较多,含有较多的信息量,即信息含量大;如果语篇的词汇密度小,则说明该语篇虚词使用的较多,而实词使用的少。大学英语教材语料库中语料句子的词汇密度比学生写作中句子的词汇密度高,也就是说,大学英语教材语料库中使用的实词较多,含有较多的信息量,而学生写作语料库中的虚词使用的较多,而实词使用的少,所含的信息量较少。

  参考文献:

  [1]王建新.计算机语料库的建设与应用[M].北京:清华大学出版社,2005

  [2]汪榕培.英语词汇学教程读本[M].上海:外语教育出版社,2005

  [3]穆惠峰.基于语料库的词汇教学研究与英语词汇教学[J].宿州教育学院学报,2007,04

  作者简介:张晨(1982.3-),女,山东聊城人,甘肃政法学院人文学院助教,研究方向:外国语言学及应用语言学。

  (作者单位:甘肃政法学院)

  张晨

关注读览天下微信, 100万篇深度好文, 等你来看……