-
I.
WordSmith Tools
简介:
WordSmith Tools
是
一个在
Window
下运行的用来观测文字在文本中的表现的<
/p>
功能强大的综合软件包。
它共包含
Concord (
语境共现检索工具
)
、
WordList
(词频列
p>
表检索工具)
、
KeyWords(
关键词检索工具
)
、
Splitter
(文本分割工具)
、
Text Converter
(文本替换工具)、
View
er
(文本浏览工具)等六个程序,其中前面三个程序是主要
的
文本检索工具,后面三个程序属于辅助性工具。这六个程序的各项设置由一个叫
Word
Smith Tools
Controller
(文字匠工具控制器)的程序来控制。
II
.各个工具的操作和主要功能介绍:
1
.
Concord
1
)基本操作过程:
?
在
WordSmith Tools Controller<
/p>
窗口中选择
Tools
选项。
当该选项打开,
你就
会看到
Concord
。单击它,
Concord
< br>的窗口将打开。
?
按下
按钮,
将出现一个对话框,
选择将进行语境共现检索的文本文件。
?
确定一个检索词或短语。
?
如果要改变设置,按
Horizons
etc
按钮,对缺省的设置值进行修改。
?
按
Start
Concordance
按钮,检索开始。窗口上出现检索进行的状态条。检
索结束,结果显示在
Concord
的窗口。
?
如果要保留
语境共现检索的结果,按
2
)主要的功能:
?
语境共现
(Concordance):
?
语境共现
(Concordance)
的窗口显示:
按钮存盘
。
语境共现
(Concordance)
的窗口包括六个纵列,例如:
A.
N
列:显示检索项的数目。
B.
Concordance
列:显示语境共现检索的结果。
C.
Set
列:
在这一列,
用户可以使用任何字母对条目
进行分类。
例如,
如果你
想对检索词的
动词和名词用法进行归类,你可以键入字母
V
或
N
。要清除
键入的字母,按
0
(零)。
D.
Tag
列:显示最接近的标记符号。
E.
Word
No.
列:
显示检索词在文本中的位置。
例如,
上面例子中条目
1
的检
索词
good
< br>是文本的
2,265
个单词。
F.
File
列:显示源文本的文件名。
G.
%
列:以百分比的形式显示检索词在文本中的位置。
?
要想得到有关语
境共现检索的结果的更多的信息,按下面的按钮:
?
按
按钮
<
/p>
,可增加语境共现检索的结果每行的显示量,按
按钮
,可减少
语境共现检索的结果每行的显示量。
p>
?
按
(
?
按
)
按钮,可启动文本浏览工具(
p>
Viewer
),对源文本进行查看。
按钮,可查看检索词在规定的语境范围内的搭配词的情况。例
如,下图是
在上例中检索词
good
在
左右各五个词的语境范围内的搭配词的情况。
从图中可
以知道,
搭配词
very
共出现
29
次,其中在
good
的左边
26
次,右边
3
次,而
在左边的
26
次中有
23<
/p>
次是作为左边的第一个单词出现。
?
按
(
)
按钮,
可打开检索词分布图窗口。检索词分布图窗口显示的内容如下:
File
源文本文件名
Words
源文本文件中单词的数目
Hits
找到的检索词的数目
per
1,000
每千字检索词的数目
Plot
检索词分布图显示检索词在
文本
中出现的位置
?
按
按钮,
Concord
将检索语境共现检索的结果中的
句子,找出重复出现的字
串(
word clusters
p>
)。字串的大小的推荐值一般为
2
—
4
个字,最低出现率为
3
个。例如:
?
按
(
)
按钮,打开用词类型(
P
atterns
)窗口,显示临近检索词的单词的统计
资料。这
些单词按出现频率的高低从高到低排列。例如:
?
取消检索词
按空格键或选择窗口
View
选项中的
Blanked out,
p>
语境共现检索的结果中的检索词
将被一行星号代替。要恢复检索词,
重复一次前面的操作。
?
对语境共现检索的结果重新排序
?
语境共现检索进行
时,检索的结果是以语境在文本中的出现顺序排列的。当语
境共现检索一完成,它就会以
当时的缺省设置进行重新排序。如果不想重新排
序,
将缺省值设
定在
File, File
位置。
语
境共现检索的结果重新排序有以下几种
方式:
A.
根据检索词的左或右的某个位置的单词进行排序。
B.
根据检索词本身进行排序。
C.
如果有语境词,可根据语境词进行排序。
D.
根据最近的标码符号进行排序。
E.
根据与最近的标码符号的距离进行排序。
F.
根据用户自己的分类进行排序。
G.
根据在文本中的出现顺序排序。
?
语境共现检索结果
的重新排序,可以根据三重标准同时进行。这三重标准分别
在
M
ain Sort, then by, finally by
三个对话框中设定。
另外,
重新排序时,
可以设
置区分或不区分大小写,按升序还是降序排列,既可以将所有的检索项重新排
序,也可以设定将一定范围内的检索项重新排序。
?
保存和打印语境共现检索结果
可以将
语境共现检索的结果保存为文本文件或是可以在
Concord
再打开的文件。
按下
F3
或选择
File
的
< br>Print
选项,将打印语境共现检索的结果。
3
)参数设置:
?
检索词(
search
word
):
A.
检索词可以是一
个单词,一个短语或是一个包含许多检索词的文本文件。
B.
按照缺省设置,
Concord
进行的是不区分大小写的整词检索。格式如下:
结
果
book
Book
or
book
or
BoOk
book
book, books,
booking,
booked
*book
textbook
(but not
textbooks
)
bo* in
book
in,
books in, booking
in
(but not
book
into
)
book *
hotel
book a hotel, book the
hotel, book my hotel
bo* in*
book
in,
books in, booking
in,
book
into
book?
book, books, book; book.
book^
book,
books
b^^k
book, back, bank,
etc.
==book==
book
(but
not
BOOK
or
Book
)
book/paperback
book
or
paperback
符号
意义
*
代表多个任意字符
例子
book*
?
代表单个任意字符(包括标
Engl???
点符号)
^
代表单个任意字母
==
区分大小写
Fr^nc^
==French==
==Fr*==
:
表示一个可包含多达
500
c:textfr
个检索词的文本文件
(
参看
帮助中的
file-based
search words)
/
分
隔多个检索词。你可以选
may/can/wi
择多达
15
个检索词,
但字符
ll
的总数不能超过
80
。
如果要使用
*,
? , == , ^ , :
or
/
作为检索词中的一个
字符,要将这些符号放到双引号内,例如:
Why
and
?
语境词
(context word):
A.
为了限制语境共
现的检索,可以指定一个语境词在检索词的规定的语境范围内
出现或不出现。
B.
语境词的输入格式与检索词的相同,
只有一个不同的符号
~ <
/p>
。
~
表示该词在规定
的语境范围内不出现。例如:
当
search
word
是
book
而
context word
是
hotel
*
时,
Concord
将只会找到
hotel
or
hotels
出现在其
语境范围内的
book
。
当
search
word
是
book
而
context word
是
~paper
*
时,
Concord
将只会找
到
paper
or
papers
不出现在其
语境范围内的
book
。
?
语境范围
(horizons):
语境范围设置限定在语境共现中检
索词的左右两边各可以出现多少个单词。最高
值是
左右两边各可出现
25
个单词。
< br>
?
检索项的数目(
entries
wanted
)
:
语境共现中检索项的数目的最大值
可达
16
,
368
行。
但用户可以在
Controller
的
Adjust Settings | Concord
p>
选项中对检索项的数目自行定义,还可以设定
Concord
对检
索项进行随机抽取。
?
搭配词
(collocate):
搭配词的最短长度为一个字母,最
低出现频率为一次。但是在语境共现中出现一
两次的搭配词是不能说明什么问题的。用户
可以在
Controller
的
Adjust Settings |
Concord
选项中对搭配词的最短长度和最低出现频率自行定义。
2
.
Wordlist
1
)
基本操作过程:
?
在
WordSmith Tools Controller<
/p>
窗口中选择
Tools
选项。
当该选项打开,
你就
会看到
WordList
。单击它,
WordList
的窗口将打开。
?
按下
按钮,将出现一个对话框,选择一个或多个文本文件。
p>
?
按
Make a word
list now
按钮,检索开始。窗口上出现检索进行的状态条。
< br>检索结束,
WordList
出现三个窗口显示检索结果
。
这三个窗口分别显示以字
母为序的词频列表,以频率为序的词
频列表以及综合统计数据。
?
如果要保留词频列表的结果,按
2
)
主要的功能:
?
创建词频列表
(word lists):
?
词频列表
(word
lists)
的窗口显示:
按钮存盘
。
?
以字母为序的词频列表的窗口(部分)显示如下:
-
-
-
-
-
-
-
-
-
上一篇:英语复习资料+中文翻译
下一篇:汉语小故事[篇]