-substring
英语专业学生笔语词汇发展研究
主题词:语料库:笔语;词汇多样性;词汇复杂度
文献标识码:
A
近年来,
国内外学者对二语习得研究
越来越广泛深入,
在国
内对笔语词汇的研究比较多,
但大多是对语料的共时研究。
揭示
学习者二语习得
的发展规律和发展趋势,
开展学习者语料的历时
研究,已成当务
之急。文秋芳教授以大学英语专业
56
名学生四
年跟踪的口语语料对英语专业学生口语词汇进行历时研究,
从流
利性、
词汇多样性与词频广度分析了学生口语词汇的使用特点和
学生口语词汇进步模式变化的趋势。
受此启发,
本研究
拟以采用
中国学习者英语口书面语语料库
(SWECCL)
p>
语料库中的书面语语
料库子库
(WECCL
)
为依据,从词汇多样性、词汇复杂度两方面来
分析笔语词汇的
使用特点,
以揭示英语专业学生在大学
4
年中笔
语词汇的变化发展趋势。
一、研究的方法
(
一
p>
)
测量指标的选择
根据
John
Read
的观点,笔语词汇的丰富度
(lexical
richness)
主要体现在词汇多样性
(
lexical
variation)
、词汇复
杂度
(vocabulary
sophistic
ation)
、
词汇密度
(lexic
al
density)
和错误数量
(
number
of
errors)
四个方面。本研究采用的是没有
经过标注的生语料,所以没有把词汇密度作为测量指标:
另外,
对词汇准确性即词汇错误数量的研究不仅仅局限于词汇拼写错
误,它涉及错误类型分类、词法、搭配等诸多方面,由于文章篇
幅有限,词汇准确性
不作为测量指标。因此,本研究对英语专业
学生大学四年笔语词汇变化发展的描述主要依
据两个指标:
词汇
多样性和词汇复杂度。
1
.词汇多样性
词汇多样性也叫形符比
(type-token
ratio)
,是指语料中出
现的类符与形符的比率
,
形符
(type)
是指文章中所有不
重复的单
词,类符
(token)
是指
文章中所有单词,包括重复使用过的。形
符比是研究词汇丰富度的重要指标,
其最基本计算方法是将形符
数除以类符数。
Wol
fe-Quintero
指出这种计算方法过于简单,
文章长短
差异过大时得出的数据不科学。
简单的形符比的确存在
文章字数
相差悬殊时所得出的数据随文章长短变化而变化的问
题,
语言学
家们在数学转换方面做出各种各样的尝试来校正文章
长短不一对形符比的影响,但是
p>
Richards
和
Malvern
认为所有
的方法都存在问题。因此,为了得到更有意义的形符比,
p>
Laufer
提出当文章长短相差悬殊时要对文本进行调整。本研究
采用
Laufer
的方法,即根据文本中最短文章字数在每篇文
章中截取
相应字数进行文本采集和计算。
其公式为:
词汇多样性
=(
形符数
/
类符数)×100。
2
.词汇复杂度
词汇复杂度也称词汇生僻度
(rareness)
,
是研究文章中除普<
/p>
通日常词汇以外相对复杂词汇比例的测量指标。
Ellise
p>
和
Barkgeizen
提出过词频广度的
概念,词频广度是指口笔语中不
同词频等级词形的分布比例。
词
汇复杂度与词频广度实际上都是
测量词频等级的指标。
Lauf
er
和
Nation
提出词频概貌
p>
(LFP
,
shor
forLexical Frequency Profile)
作为研究词汇丰富度的测量指
标,
词频概貌首先在词汇使用频
率的基础将词汇由简到繁分成三
或四个等级,
之后计算文章中出
现的词族
(family)
在每个等级所
占的比例用。
Laufer
发现
20
00
词以外的单词能够更清晰地区分
学习者的词汇表达能力,而
且计算
2000
词以外的单词比例实际
上就是计算词汇复杂度,
因此本研究使用
Laufer
和
Nation
开发
的
Range
软件中的第三个词表
(ba
seword list 3)
和
3
个
词表以
外的单词计算词汇复杂度,使用的计算单位是词形而不是词族,
< br>计算公式为:词汇复杂度
=(
文章中复杂词形数/总词形
数)×100。
(
二
)
p>
语料的来源及其分析
本研究所用语料来自两个语料库:
中
国学习者英语口笔语语
料库
(SWECCL)
< br>中的笔语语料库子库
(WECCL)
和兰卡斯特大学的<
/p>
LANCAWAE
语料库
(Lancas
ter Corpus of Academic Written
English)
。
SWECCL
语料库是一个包括笔语和口语语料的大型学习者语
料库,由南京大学与外语教学与研
究出版社联合开发。
SWECCL
语料库库容为
200
万词,分为笔语语料库
WECCL
和口语语料库
SECCL
两个子库。
WECCL
子库的设计容量为
100
< br>万词,收集了从
国内
9
所不同层
次的高校英语专业
1―4
年级学生的英语作文。
本研究采用的语料来自
WECCL
生语料库,
选用英语专业一至四年
级的议论文、
说明文和记
叙文。
每个年级每种文体依据作文长短
随机选择
18-30
篇,
然后以字数最少的四年级记叙文为标准
,
从
12
个语料集合中各随机抽取约<
/p>
6200
字,
总字符数约为
74400
字。
之后,
从<
/p>
WECCL
子库中分别抽取
1
、
2
年级学生作文各约
5
000
字
组成约
10000
词的语料,
再抽取
3
、<
/p>
4
年级作文各约
5000
字组成
约
10000
词的语料
。
L
ANCAWAE
语料库由兰卡斯特大学建立,收集了一系列非英
语本族语学生的作文,
同时还包括一部分本族语学生作文作为参
照。该库在
21
世纪初建立,并一直处于不断增加和完善之中。
本研究抽取了早期双语学生
(early bilingua)
作文约
10000
词,
晚期双语学生
(1ate bigligua)
作文约
10000
词,另外还有约
10000
词的英语本族语学生
(native
speaker)
作文。
本研究采用
Laufer
&
Nation
开发的统计软件
p>
Range32
对整
理后的所有语料进行分
析。之后用
SPSS
中的非参数检验比较英
语专业
4
个年级在笔语词汇多样性和词汇复杂性的总体差异
,
比
较笔语词汇与口语词汇发展变化,
以及英语专业高年级和低年级
与国外非本族语学习者和母语学生之间的差异。
三、研究结果与讨论
(
一
)
p>
我国英语专业学生大学四年笔语词汇多样性和复杂度
-substring
-substring
-substring
-substring
-substring
-substring
-substring
-substring
-
上一篇:小学英语优质课听课心得体会5篇
下一篇:安徒生童话:墨水笔和墨水瓶(英)