-
NCBI
的检索
NC
BI
包括五个部分,
第一部分是欢迎进入
NCBI
,包括
NCBI
的最新信息
、
计划与活动、读者
来信、服务地址和用户评论等。第二部分是
基因序列数据库
(
GenBank
)<
/p>
,包括基因库概述、
检索与投稿。第三部分是数据库服务,包括免
费的
PubMed
检索
、
Entrez
检索、
BLAST
序列
族性检索、电子邮件服务(详见本章第四节)、匿名
F
TP
服务。第四部分是
NCBI
的
p>
其它资
源
。
GenBank
的检索
在
NCBI
主页的第二部分点击
“
Searching
GenBank
< br>”
,
即可进入
GenBank<
/p>
的检索屏幕。
NCBI?
提供了五种检索
,即
Entrez
浏览检索、
BLAS
T
序列类似性检索、
dbEST
检索、
dbSTS?
检索和
文本检索
(Text Searching)
。
一、
Entrez
浏览检索
< br>
检索的数据库及其检索信息
Entrez
浏览器
(Entrez
Browser)
可以检索以下与
NC
BI?
链接的基因序列数据库的分子生物数
据和书目文献资料。
????(1) GenBank
、
EMBL
、
DDBJ
< br>中的
DNA
序列;
????(2)
SWISS-PROT
、
PIR
、
PRF
< br>、
PDB
中的蛋白质序列以及
D
NA
序列数据库中翻译的蛋白质
序列;
????(3)
基因和染色体图像数据;
????(4) PDB
以及收入
NC
BI
分子模型数据库
(MMDB)
的蛋
白质三维结构;
????(5)
通
过
PubMed
检索
Medline<
/p>
和
PreMedline
数据库。
????
检索功能
????Entrez
提供了以下三种检索功能。
????(1)
自由词检索功能
p>
????
用户可以通过文本词、关键词、截词、期刊名或文献的作者
检索
Entrez
数据库。截词
用
p>
*
号,
期刊名必须用
Medline
刊名缩写,
作者姓名必须是姓在前,
名在后,
用首字母缩写。
????(2)
索引词表
(List
Terms)
检索功能
????
p>
索引词表检索是当你键入检索词,
Entrez?
< br>在你选定的字段中显示从该检索词开始的一
个索引词表窗口,
这时,
你可以选择一个或几个词进行检索,
这对单词拼写不
准确时非常有
用。
?
例如:在输入框中
键入“
P53
”,选择文本字段
(Te
xt
Words)
和索引词表
(List
Terms)?
检索功能,再点击“
S
earch
”,这时返回一个以“
P53
”开始的索引词表窗口,浏览选择一
个或几个索引词,点击“
Search
”,
Entrez
将返回
检索结果。
????(3)
自动检索功能
????
自动检索功能就是
Entrez
p>
浏览器根据用户输入的检索式自动进行检索,返回当前检索
式检出的
文献数,
如满意,
可进一步取得检索结果,
如不满意,
则可对当前检索式进行修改,
直到用户满意为此
。例如在输入框键入“
P53
”,
?<
/p>
选择所有字段和自动检索功能,
?
点击<
/p>
“
?Search?
”,
?Entrez
返回一个
Web
页,包括当前检出文献数、加词检索和修改当前检索
三个部分。
如果你对检出文献数不满意(过多或过少),
可以在加词检索部分增加更专指的
检索词,
以提高查准率,
也可以在修改当前检
索部分选择某一布尔算符
(AND
、
O
R
、
NOT
、
ANDNOT)
,
对当前的检索策略进行修改,直到你满意为止
。
????
对于检出文献,用户可以
选择浏览格式进行浏览,也可以打印或存盘。
????3
Entrez
检索规则
????(1
)Entrez
支持“
*
”号截词检索
;
????(2)Entrez
对你
键入的词可以进行逻辑识别。
例如:
键入
“
Lipman
DJ
Genom
ics
”
,
Entrez
将它识别为作者的姓名
Lipman
DJ
和自由词
?Genomics?
,
?
并将提问式转换为
“
?L
ipman
?DJ?
”
?AND G
enomics
。对于
Entrez
不
能识别的提问式,如
bac 1
,必须加双引号,
?
系统就会将
它们作为一个词进行检索;
(3)Entrez
支持复杂的布尔逻辑检索
;
(4)Entrez
支持限定字段
检索;
字段标识符的全称如下:
WORD=Text Word, TITL=Title Word,
MESH=Mesh Term, MAJR=MeSH ?Major ?Topic,?
AUTH=Author Name, JOUR=Journal Name,
ECNO=EC/RN Number, GENE=Gene Name,
DATE=Publication Year,
PDAT=Publication/Creation Date, MDAT=Modification
Date,
PAGE=First Page, VOL=Volume,
KYWD=Keyword, ORGN=Organism, ACCN=Accession
Number,
PROT=Protein Name,
SUBS=Substance,PROP=Property, FKEY=Feature Key
和
PTYP=Publicaton
Type
二、
BLAST
序列类似性检索
序列类似性检索就是将新测定的
核酸或蛋白质序列对核酸或蛋白质序列数据库进行检索,
找
出与
之相似的序列,
从而评判新测定的序列是重复别人的工作,
还是
在前人的基础上有所创
新,或是发现了新的序列。现在用于序列类似性检索的软件很多,
下面主要介绍
GenBank
的序列类似性检索工具棗
BLAST
。
1.
BLAST
简介
BLAST
是
Basic Local
Alignment Search Tool
的英文缩写,意即碱基局部对准检索工具
,
是一种序列类似性检索工具。
它采用统计学记分系统,
能将真正配对的序列同随机产生的干
扰序列区别开来;同时采用启发式
算法系统,即采用的是局部对准算法
(Local Alignment
Algorithm)
,而不是全序列对准算法
(G
lobal
Alignment
Algorithm)
p>
。全序列对准算法是在
检索结果中两个被比较序列所有片断均类似;
而局部对准算法是找出两个被比较序列的
“最
< br>类似”片断,并得出可能只包含两个序列的某个部分的对准结果。
在
BLAST
的基础上,
N
CBI
又开发了
BLAST
2.0
、
Gapped
BLAST
和
PSI-
BLAST
。
BLAST 2.0?
是
一种新的
BLAST
检索工具,它对
B
LAST
作了改进,运行速度更快,灵敏度更高,
同时具有
p>
Gapped BLAST
和
PSI-
BLAST
两种软件的新功能。
Gapped BLAST
p>
允许在对准的序列中引入空
位
(?
碱基缺失或插入
)
,引入“空位”
(Gaps)
意味着在比较两个相关序列时不会出现中断
(Break)
现象。这些空位对准的记分系统更能反映相关序列的类似程度。
p>
PSI-BLAST
的全称
是
Position-Specific ?Iterated BLAST
,
意即特殊位置重复
BLAST
,它提供了自动、易用
的概貌
(Profile)
检索,是查找序列同源
(Sequence
Homologues)
的有效方法。目前,
PSI-BLAS
T?
仅用于比较蛋白质查询序列与蛋白质数据库中的序列的类似程度。
< br>
2.
使用
NCBI
BLAST
服务的四种基本方法
(1
)
经由
WWW
使用的
< br>BLAST
使用
BLAST<
/p>
最容易的方法是
WWW
方式。在用户的浏
览器中键入
NCBI
的
URL
地址:
http//
,进入
NBCI
主页,然后链接到
BLAST
主页。
BLAST?
主页提供
了好
几种
BLAST
检索软件,包括
BLA
ST
、
BLAST
2.0
、
Gapped
BLAST
和
PSI-BLAST
等,
其中
BLAST
和
BLAST
2.0
提供了基本检索和高级检索两种模式。
(2)
网络版的
BLAST
BLAST2
是标准的网络
BLAST
客户软件,它可以通过
NCBI
匿名的
FTP
服务器
(ftp://)
下的
/blast/network/blast2/
获取。
PowerBlast
是用于大规模分析基因序列的网络
BLAST
客户应用软件,
它可以通过
?NCBI?
匿
名的
FPT
服务器
(ftp://)
下的
/blast/network/blast2/powerBLAST
/
获取。
(3)
独立运行的
BLAST
BLAST 2.0
可以在本地计算机上独立运行,也可以在自
建的序列数据库中进行
BLAST
检索,
?
还可以下载
NCBI
数据库中的记
录。
BLAST
运行的软硬件环境为
I
RIX 6.2
、
Solaris
2.5
、
?PEC OSF1(
第四版
)
和
Win32
系统。可独立运行的
BLAST 2.0
在
< br>NCBI
匿名的
FTP
服务器<
/p>
(ftp://)
下的
/blast/e
xecutables/
获取。
(4)
电子邮件的
BLAST
通过电子邮件对基因库进行
BLAST
检索(详见本
章第四节二)。
3.
BLAST
的检索方法
(1)
BLAST
数据库的选择
BLAST
检索的数据库包括两大类:一类是肽序列数据库,另一类是核酸序列数据库。
①
肽序列数据库包括:
nr:
所有无冗余基因库
CDS
转录产物、
PDB
、
SwissProt
< br>以及
PIR
序列
month:
最近
30
天注释的所有新增的或修订的基因库
CDS
转录产物
、
PDB
、
SwissProt?
p>
和
PIR
序列。
SwissProt: SwissProt
蛋白质序列数据库
中最新的主要注释
(
无更新
)
序列。
yeast:
Yeast(Saccharomyces
Cerevisiae)
蛋白质序列。
:
基因
CDS
转录产物。
pdb:
从
Brookhaven
蛋白质序列数据和三维结构衍生出来的序列。
p>
Kabat [Kabatpro]:
免疫学上感兴趣的蛋白质序列
Kabat
数据库。
alu:
从重复序列数据库
(REPBASE)
选取的
Alu
重复序列,
适用于过滤查询序列中
Alu
重复序
列。通过匿名
FTP
从
下的
/pub/jmc/alu
目录中获取。
②
核酸序列数据库包括:
nr:
p>
所有无冗余的
GenBank+EMBL+DDBJ+PDB
序列;但不包括
EST
、
STS
、
GSS
或
HTGS
序列。
month:
最近
30
天注释的新增加的或修订的
GenBank+EMBL+DDBJ+PDB<
/p>
序列
dbEST: GenBank+
EMBL+DDBJ+PDB
中
EST
部分的无冗余数据。
dbSTS: GenBank+EMB
L+DDBJ+PDB
中
STS
部分的
无冗余数据。
htgs:
高允许能力
(High
Throughput)
基因序列。
yeast: yeast(Saccharomyces
Cerevisiae)
基因核酸序列。
:
大肠杆菌
()
基因核酸序列。
pdb:
蛋白质数据库。
Kabat[Kabatnuc]:
免疫学上感兴趣的核酸序
列
Kabat
数据库。
Vector:
GenBank
载体数据库。
mito:
线粒体序列数据库。
alu:
从重复序列数据库
(REP
BASE)
选取的
Alu
重复序列,<
/p>
适用于过滤查询序列中
Alu
重复序
p>
列。通过匿名
FTP
从
下的
/pub/jmc/alu
目
录中获取。
epd:
真核生物的启动子数据库。
gss:
基因搜寻序列,包括单递基因数据、外切核酸酶捕获序列和
Al
u PCR
序列。
(2)
BLAST
程序的选择
BLAST<
/p>
是一种碱基局部对准检索工具,
实质上是一种序列类似性检索工具
,
它运行
?blastp?
、
blastn
、
blastx
< br>、
tblastn
、
?tbla
stx?
等五种程序的启发式检索算法;这五种程序是利用改
进
的
Karlin
和
Altschul<
/p>
的统计学方法来描述检索结果的显著性。
这些程序不支持主题形式
检索,也就是不支持主题词、自由词、文本词等检索。
下面介绍五种程序的基本功能。
bl
astp:
将待查询的蛋白质序列及其互补序列一起对蛋白质序列数据库进行查询;
p>
blastn:
将待查询的核酸序列及其
互补序列一起对核酸序列数据库进行查询;
blastx:<
/p>
先将待查询的核酸序列按六种可读框架(逐个向前三个碱基和逐个向后三个碱基读
码)翻译成蛋白质序列,然后将翻译结果对蛋白质序列数据库进行查询;
tblastn:
先将核酸序列数据库中的核酸序列按六种可读
框架翻译成蛋白质序列,
然后将待查
询的蛋白质序列及其互补序
列对其翻译结果进行查询;
? tblastx:?
先将待查询的核酸序列和核酸序列数据库中的核酸序列按六种可读框架翻译成
蛋白质序列,然后再将两种翻译结果从蛋白质水平进行查询。
因此,根据你查询的目的和序列选择合适的
blast
程序
,有助于获得满意的检索结果。
(3)
BLAST
参数的设置
BLAST<
/p>
提供了许多参数可限制你的检索,以达到满意的结果。对于
BLA
ST
基本检索,
?
系统
预设的参数默认值即可满足需要,
不需要你重新设定。
但是对于
BLAST
高级检索,
可开窗
选
择如下几种参数,也可在输入框增加其它参数。
①直方图
(Histogram)
:显示每次检索
评分的直方图。有
yes
、
no
两种选择,默认值为
yes
②描述
(Descriptions)
:
限定描述性类似序列的条数。
有
default
p>
、
0
、
10
、
50
、
100
p>
、
250?
、
50
0
等七种选择,默认值为
100
。
p>
③对准
(Alignments)
:限定检出高积分片断配对
(High-scoring
Segment Pairs,HSPs)
的数
据库序列的条数
,有
default
、
0
、
10
、
50
、
100
、
250
、
500
等七种选择,默认值为
50
。如
果检索到的数据库序列超出设定值,
BLAST
仅显示最具统计学意义的配对序列,
直到设定值。
④期望值
(Expec
t,E
值
)
:
它是期望数据库中具有某一统计学意义配对序列的值。
有
def
ault
、
0.001
、
0.01
、
0.1
、
1
、
10
、
100
、
1000
等选
择值,
?
默认值为
?10?
,一般地,期望值越低,
限制越严格,甚至会导致无随机配对序列。
⑤
Cutoff
:
设定高积分片断配对
(HSPs)
的
C
utoff
值。有
default
、<
/p>
60
、
70
、<
/p>
80
、
90
、<
/p>
100
、
110
等七种选择值,
其默认值一般通过期望值来计算得出。
一般地,
Cutoff
值越高,
其限制
就越严格,甚至会导致无随机配对序列。
⑥矩
阵
(Matrix)
:为
BLAST<
/p>
、
BLASTX
、
TBLASTN
和
TBLASTX
程
序指定一个交替记分矩阵。其
默认值为
BLOSUM62
,有
PAM40
、
P
AM120
、
PAM250
和
IDENTITY
等四种有效选择。但交替记分
矩阵对
BLASTN
不起作用。
p>
⑦股
(Strand)
:
< br>把
BLASTN
检索限定在数据库序列的股的首端或末端
;
或者把
BLASTN
、
BLASTX
、
TBLASTX
检索限定在查询序列股的首端或末端的机读部分。
?
p>
⑧过滤器
?(?Filter)?
:
过滤器可以过滤查询序列中低成分复杂性
?(?Low
?Compositional?
Complexity)<
/p>
片断。
它只过虑查询序列及其转录产物中的低成分复杂性片断,<
/p>
?
不能过虑数据
库序列中的低成分复杂性
片断。用户可以在
BLAST
和
BLA
ST 2.0?
的高级检索中选择相应的
过滤程序以消除对检索
结果的干扰,
如不用过滤功能则选择
“
NONE
”
。
但是在
< br>BLAST
和
BLAST
2.
0?
基本检索中,
因为,
系统对于不同
的
BLAST
程序设定了默认值,
例如
对于
blastn
程序,
其默认值为“
DUST
”,对于其他程序,默认值为“
SEG
”,所以用户只须选择用不用过虑功
能,而不必设定过
虑程序。
值得注意的是,
过滤器中的
SEG
和
XUN
程序不能过滤
SWISS-PROT
数据库中的低复杂性片断
,
因此,虽然过滤器可以应用于
SWISS-
PROT
数据库序列,但并未起作用。
⑨
NCBI-
GI
:在输出结果中除存取号和位点名称
(Locus
Name)
外,还可以选择
NCBI-
GI
标识
号。有
yes
和
no
两种选择,其默认值为
no
。
(4)
BLAST
检索结果
BLAST
p>
程序用大致相同的格式显示检索结果,它包括四个部分:一是程序的介绍;二是一系
列配对数据库序列的描述,从积分高到低排列,一行描述一条序列;三是实际的序列对准;
四是检索中设定的参数及其它统计数据。
????
?
三、
dbEST
检索
dbEST
是基因
库的一部分,主要收录核酸序列数据库的表达序列标志以及“单递”
(Single
Pass) cDNA
序列等信息。
dbEST
使用的提问式是
IRX
p>
格式,其通用的
IRX
格式是:
Term[Field
List]
,这里的
[Field <
/p>
List]
可以是一个或几个用空格分隔的字段标识符。“
Term
”可以是词或词组。
???? dbEST
中的字段:
???? DBID EST
登记号
LIBX
馆藏描述
????
IDS EST
名称或
GenBank
存取号,
GI
号
SUB
发送者信息
???? CLIN
克隆信息或来源信息
CIT
引文信息
???? COM
评论
MAP
图谱数据
???? LIB
馆藏名称及机构
NBR
同源
(
相邻
)
信息
在输入框按照
IRX
格式输入一个提问式,点击“
Submit
Query
p>
”,系统进行检索并返回检索
结果。
?
四、
dbSTS
< br>检索
dbSTS
是
?NCBI?
一种新的数据库,
?
主要收录基因标志序列或序列标志位点和图谱数据。虽
然
dbSTS
序列将并入
GenBank
,但是
dbSTS
中的注释更具综合性,包括有关实验者、实
验条
件和基因图谱定位等更为详细的信息。
< br>dbSTS
检索方法和步骤与
dbEST
相同。
五、文本检索
(Text
Searching)
NCBI
提供
文本检索服务。可通过两种形式进行检索,一种是表格式的客户机检索,
?
另一种
是非表格式的客户机检索。
(1)
基于表格式的客户机检索
(Search
with Forms-Based Clients)
它可
以检索
GenBank
以及
GenBa
nk Updates
最近注释的新增的和变更的记录。
p>
查询表格有四个输入框,每个输入框前面冠有“
FR
”
(Field
Restriction
字段限定
)
,后面
带有
布尔算符
(AND,OR,BUTNOT)
,布尔算符描述相邻
两个输入框中词或词组的逻辑匹配。在
第四个输入框的下面左边有一个“
Run Query
”按钮,右边有一个“
Clear
Input
”按钮,
?
它可清除当前的
输入,回到初始的状态,
在上述两个按钮之间,有一个下拉式菜单按钮,可
开窗选择检索后每页返回的记录数。
在按钮行的下
面,
有数据库选择区,
允许你选择当前检索的
< br>?GenBank?
数据库,
有三种选择:
GenBank
、
GenBank Updates
和
Both
。
在数据库选择区的下面有可供选择的限定字段,如
Locus<
/p>
、
Definition
、
Accession No.
、
NID
、
Keywords
、
So
urce
、
Reference
、
p>
Comment
和
Features
等,可选择其中的字段限定你
的检索式。
(2)
非表格式的客户机检索
它可以检索
GenBank
、
GenBank Updates
、
Swiss-Pr
ot
和
PIR
等数据库。这些数据库均
带有
下划线,点击某一数据库,则可进入该数据库的文本检索界面。在输入框中,输入检
索词,
词组或布尔表达式,然后点击发送检索按钮,即可检索到所需要的文献。
PubMed
Pu
bMed
医学文献检索服务系统,其检索内容包含
MedLin
e
,
PreMedline
(不含
p>
Mesh
检索主题词)医学文献数据库及其他电子出版文献。
PubMed
覆盖了全世界
70
多个国家
4300
多种主要生物医学期刊的摘要和部
分全文。年收编量为
30
多
万条,以题
录和文摘形式进行报道。其中
75
%是英文文献,
70
~
80
%文献含有
p>
英文文摘。
1973
年,
< br>MEDLINE
开始收编我国期刊,现收编中文期刊
40
多种。文
献题录和原文发表的时差一般为
1
~
3
个月。其覆盖的时间段也非常
长,早的可
以追溯到
20
世纪
60
年代。
页面上方
的检索框和功能键:一框五键
(检索框,
Limit
键
,Preview/Index
键
,History
键,
Cl
ipboard
键和
Details
键
)。
主界面的左侧框:
·
Journal
Browser
期刊浏览
·
MeSh Browser
可以用它
来分层流览
MeSH
表
·
Single Citation Matcher
输入期刊的信息可以找到某单篇的文献或整个期刊
的内容。
·
Batch Citution Matche
r
用一种特定的形式输入期刊的信息一次搜索多篇文
献。
·
Clinical Queries
p>
这一部分为临床医生设置,通过过滤的方式将搜索的文献
固定在
p>
4
个范围:治疗、诊断、病原学与预后。
·
Old PubMed(
使用旧式的
PubMed
查询方式
)
Related
Resources
:
·
Order
Documents
可以使用户在当地得到文献的全文,
p>
但这是要收费的,至
于如何免费获得文献全文,我将在后面的有关章
节中详述。
·
Grateful M
ed
是对另一个
NLM
基于网络的查询
系统的链接。
Grateful Med
也
提供
MEDLINE
的接入,
并且
还有一些其他的数据库如
AIDSLINE
、
< br>HISTLINE
等等。
·<
/p>
ConsumerHealth
提供与
M
EDLINEplus
的链接,
MEDLINEplus
是与消费者健康信
息相关的国家医学图书馆的网络节点。
·
ClinicalAlerts
此部分的目的是加快
NIH
资助的临床研究成果的发布
。
PUBMED
简单检索技巧
明确要检索的关键概
念及词语,
即关键字;
考虑到关键字的类似说法,
即有可能
出现的同义词;
通过限定
DATES,STUDY
GROUP
等,精炼检索范围;
词语
(主题)
检索
这时我们在
PubMed
主页的检索框中键入的是英文单词或
短语
(大写或小写均可)。然后回车或点击
,
PubMed
即使用其词汇自动转换功
< br>能进行检索,并将检索结果直接显示在主页下方。
词与
词间可用
AND
、
OR
或
NOT
逻辑进行连词检索。
对
PubMed
不能识别检索的词组,
需加引号强调,如键入:“
Insight
II
”
检索时可在词尾加“
*
”号检索所有具有同样词头的词
。如键入:<
/p>
biolog*
可查
得
biology
或
biological
等词。
著者检索:
著者姓
空格
p>
名字首字母缩写
,例如
smith ja
。
刊名检索:
刊名全称或
MEDLINE
形式的简称、
ISSN
号。
日期或日期范围检索
可以在检索框中
键入日期或日期范围,
然后回车或点击
Go
,
系统会按日期段检索,并将符合条件的记录予以显示。日期的录入格式为
YYYY/MM/DD
;如:
1999/09/
08
也可以不录月份和日子,如:
2000
或
1999/12
。
检索期刊子集(辑)
检索的格式为:检索词
AND
jsubseta,
如:
neoplasm AND
jsubseta
。可供检索的期刊子库有
3<
/p>
种:
Abridged Index Medicus(
有
120
种重
要核心期
刊
)
、
Dental
< br>和
Nursing
。
分别使用<
/p>
jsubseta,jsubsetd,jsubsetn
进行<
/p>
限定。
检索带文摘的记录
检索的格式为:
检索词
AND
has
abstract,
如:
liver
cancer
AND has abstract
。要注意的是在
1975
年前出版的文章,其
MEDLINE
p>
记录中没
有文摘。
布尔逻辑检索:
PubMed
系统允许使用布尔逻辑检索,只
要在检索框中键入布尔
逻辑运算符(
AND
,
OR
或
NOT
< br>)。
处理检索结果:
p>
符合检索要求的项目以
SUMMARY
(简
要格式)显示出来的,就是列出作者,文章
题目,以及文章来源的一些信息。
在
DISPLAY
键后
还可以选择别的显示格式,
点击
DISPLAY
键后,
系统按所选格式
全部检索结果。
如果只需要显示其中一部分记录,
则需点击该记录左
边的查询框,
使标记后,
再
点击
Display
键;
如果只需显示一条记录,
则可直接点击该记录中的作者姓名超
链接,系统会自动显示该记
录的文摘格式。
还有一点,
系统所设
定的默认值为每页显示
20
条选项,
这
点可以在
SHOW
后的下
拉菜单处选择
。
如果选中所感兴趣的内容,即可进行保存,打印等等操作。
PubMed
系统允许最
多可保存
p>
5000
条记录。要保存全部检索结果时,打开
Summary
下拉菜单选择其
中一种格式,然后点击
p>
Save
键;要保存特定记录时,点击记录左边的选择框予
以标记后,再点击
Save
键。
使用浏览器的打印功能,
即可把感兴趣的内容打印出
来。
系统允许每页最多显示
500
条记
录。如果想打印成文本格式,请先点击
Text
键,然后再打印
。
PUBMED
高级检索技巧
即
Limits
按钮
,Preview/Index
按钮
,History
按钮
,Clipboard
按钮
,
及<
/p>
Details
按钮。
1. Limits
按钮
2
.
Preview/Index
按钮
在按下
Preview
/Index
按钮之后,我们可以进行的设定有:
在显示条目之前显示所查到的文献数。
随时通过增加查询单词来修改查询方案。
在特定的搜索域中向方案里加入查询词。
从
Index
中查看并选择词语来修改查询方案。
在你修改查询时查看方案。
Preview(
预览
)
使用此功能可以在显示条目之前显示所查到的文献数。使用时,
在输入框中
键入搜索词,然后单击
Preview
,
PubMed
返回的信息是条目的数量。
Index
(索引)
使用此功能
,
可以从特定域中选择以索引的单词,并把
他们加入
查询方案之中
;
可以查看某一
个特定搜索域中词语列表;也可以使用布尔运算符
来建立一个查询方案。
3
.
History
按钮
History
(历史记录):作为
PUBMED
的“四大金刚”之一,至少
有
50
%的人忽
略了它的好处。
历史记录中保存的是你所有的查询方案与查询结果,
只有当你运行了一次查询之
后,
History
中才有内容。
History
屏幕将会显示:
你的查询方案、查询时间、
查询到的文献数量。
Preview
显示的是历史记录中最近的三条记录,而使用
History<
/p>
可以看到最近
100
次的查询结果。一旦
查询数量超过
100
,
PubMed<
/p>
会将
最早的查询除去,加进最新的一次查询。如果两次查询内容相
同,
PubMed
会将
头一次的去除。
此外,如果你打开的
PubMed
(或者
Entrez
提供的其他数据库)
有一个小时都没有任何检索
动作,系统也会自动清空历史。
显而易见的是,通过
History
,我们可以对本次检索过程一目了然,你只要点击
每个条目后面的
Results
,就可以直接
看到该条目的检索结果。更重要的是,你
可以根据
Histor
y
所提供的信息,
决定如何进一步调整检索策略,
以便得到尽可
能满意的结果。以上图为例,你发现在
9:23
分的那次检索中,用
chicken,
pox,vaccine
为关键字,
Limits<
/p>
中设置为英语和综述,
得到了
113
p>
条结果。
但你
可能发现其实你的研究主要以
儿童为对象,
需要进一步对此加以限制,
那么你该
怎么办呢?其实在
History
中非常简单,
p>
只需在检索框里输入那次检索对应的序
列号
#3
,
AND child
。这就表示
其他检索条件不变,仅在原来基础上增加了一个
关键字
chil
d
。这样是不是很方便呢?同样,如果你希望把某两次检索条件合并
去重新检索(如
#2
和
#6
),只要输入
#2 AND
#6
即可。
需要特别强调的一点是,如果你发现你的系统不能使用
History
,那么很可能
是因为你的浏览器设置成
Disable
Cookies
。遇到这种情况,只要到浏览器的功
能设置界面中取消这一限制即可。
(注意
:
在
HISTORY
中输入检索式后按回车的效果与按
PREVIEW
按钮是一样的
,
即仅显示检索结果有多少篇,但按
GO
按钮之后就会跳出
HISTORY
进入题名或文
摘界面
,
再进
HISTOR
Y
时就需切换一下
,
有点麻烦)
4
.
Clipbo
ard
按钮
剪贴板可以帮助你保存或
查看在一个或多个查询中选择的条目,
然后就可以打印、
保存、
订购剪切板中的内容了。将条目左边的复选框选中,单击
cli
pboard
就可以将其加入剪切板中。当点击
Clear H
istory
可以将
History
中
的所有内容清除。
剪切板中最大的储存数是
< br>500
条。
而放在剪切板中的内容如果在一小时内没有任
何操作,将会自动消失。
点击
Features Bar
(特征
条)上的
Clipboard
则可以查看剪切板中的内容,如<
/p>
果要删除剪切板中的某些条目,
先将其左面的复选框选中,
然后点击
Remove
from
clipboard
按钮;
要想清空剪切板,<
/p>
不选任何条目,
单击
Remove
from
clipboard
按钮。
如果要保存剪切板中的内容,
首先选择一种显示方式,
< br>选中你想要的条目
(如果
想保存所有的条目,则哪个也不
选),点击
Save
按钮即可。
p>
5
.
Details
按钮
Details
是用于帮助
你查看
PubMed
的检索策略。即在提问框中键入的检索词被
PubMed
自动地转换成了那些词,
并使用了什么样的检索规则和检索语法。
此外,
使用
Details
键可以对检索策略进行编辑,然后再一次检索。在
PubMed Query
框内显示的是
Pub
Med
实际使用的检索策略和语法。该框下有四个区域:
Res
ult
区显示检索结果的记录总数,点击这个数字,可回到检索结果显示屏;
Translation
区显示检索词转换的详细情况;
< br>Database
区显示检索的数据库;
User
Query
区显示用户键入的检索词或检索式。
要对检索策略进行编辑可直接点击
PubMed Query<
/p>
框中的检索策略,将其增加、
删除或修改后点击
< br>Search
键。
除了以上
五个主要功能键以外,利用
PubMed
提供的其他一些功能,
如
MeSH
等,
也可以在很大一部分程
度上提高我们的检索效率。
在以后的若干章里,
我们将会
以详尽的笔墨来系统的剖析这些功能用法。
显示检索文献
(Retrieving
Documents)
当检索结果的
文献数目较少,且能满足需要时,按“
Retrieve
(检索
)”按钮即显示检索到
的文献内容列表,包括文献的标题
(ti
tle)
,作者
(author)
及出
版杂志、页码及日期
(
年
)
,
这个列表称为文献摘引列表
(Document
Summary
Page)
。
可根据需要显示详细内容,每条文献均有好几种显示格式: