-
关于
RefSeq
:
N
CBI
参考序列
< br>NCBI
的参考序列计划(
RefSeq
)将为中心法则中自然存在的分子,从染色体到
mRNA
到蛋白提供参考序列
标准。
RefSeq
标准为人类基因组的功能注解提供一个基础。它们为突变分析,基因表达研究,和多态发现
< br>提供一个稳定的参考点。
范围:目前,
RefSeq
记录为下列分子类型和基因组提供:
<
/p>
范围:目前,
RefSeq
记录为下列分
子类型和基因组提供:
分子
Complete Genome
完整基因组
登录格式
NC_######
NC_######
基因组
Archaea,
Bacterial, Organelle, Virus, Viroid
原核生物,细菌,细胞器,病毒,疫苗
Eukaryote
真核生物
Plasmid
质粒
Homo sapiens
人类
Limited
Vertebrate
,
Homo <
/p>
sapiens
,
Musmusculu
s
,
Rattus
Complete
Chromosome
NC_######
完整染色体
Complete
Sequence
完整序列
Genomic Contig
基因组
Contig
NC_######
NC_######
NC_######
NT_######
NT_######
mRNA
NM_######
norvegicus
mRNA
Protein
蛋白
NM_######
NP_######
NP_######
有限的脊椎动物,人类,小鼠,大鼠。
All of the above
所有以上的
脊椎动物
mRNA/
蛋白构建步骤:
RefSeq
记录通过以下步骤创建:
确定代表不同基因的序列
建立正确的基因名字到登录号的联系
确定完整范围的可以获得的序列数据
创建一个新的有以下状态的参考序列
(RefSeq)
记录
p>
预测的
临时的
临时的
RefSeq
记录被一个生物学家再检查,
他确定一开始的名
字到序列的关联,
加上一些包括基因功能概
要的信息,更重要的
是用其他可获得的
GenBank
记录来更正,重新注解,或扩
充序列数据。预测的,临时
的和检查过的
RefSeq
记录通过
NCBI Entrez
检索系统,<
/p>
BLAST
数据库,
FTP
,和
LocusLink
网站让公众获
得。
最近发表的文章
1.
Introducing
RefSeq
and
LocusLink:
curated
human
genome
resources
at
the
NCBI.
Pruitt
KD,
Katz
KS, Sicotte H, Maglott
DR Trends Genet. 2000 Jan;16(1):44-47.
2. NCBI's LocusLink and RefSeq Maglott
DR, Katz KS, Sicotte H, Pruitt KD Nucleic Acids
Res 2000
Jan 1;28(1):126-128
FAQ
什么是参考序列?
NCBI
参考序列计划提供了校正的序列数据和相关的信息,给同行提供
使用的标准。
GenBank
是一个序列的
存储池,
RefSeq
数据库将是一个参考序列的非冗余集
合,包括构建的基因组
contig
,
mRNA
,蛋白,和,在
未来,整个染色体。
< br>RefSeq
记录是有三种可以获得的状态:预测的,临时的和检查过的。检查过
的记录代
表了我们目前关于一个基因和它的转录子的知识的汇编。在检查的过程中,我们
整合了更多的信息,只要
是可以获得,如序列数据,发表物,命名,和特征注解,都来自
于很多
GenBank
记录,人类基因组命名委
员会,和
OMIM
。
The initial release of RefSeq records
includes human mRNA and protein reference
sequences. The
current scope is limited
to human sequences but other organisms will be
added in the future.
最开始的
Ref
Seq
记录版本包括人类
mRNA
和蛋
白参考序列。目前的范围只局限于人类序列,但是其他物种
的将在未来加入。
我如何引用
RefSeq
记录?
引用
RefSeq
登录号和
LocusID
以及
< br>RefSeq
网页(
/LocusLink
/
)是恰当地。特定的使用
RefSeq
网页的引用格式依据你文章将发表的刊物的编辑方法而定。
可以参考这个
网站,列出了许多电子文件引用指南:
/I/training
/citation/
。
我如何访问
RefSeq
记录?
< br>
RefSeq
记录可以通过各种
NCBI
资源来访问,包括:
BLAST
NM_######
记录是在核苷酸非冗余数据库中
NP_######
记录是在蛋白非冗余数据库中
Entrez NM_######
和
NT_######
记录是在
Entrez
核酸中
NP_######
记录是在
Entrez
蛋白中。
Entrez
基因组部分
NC_######
记录代表完整的基因组,和染色体,完成的和正在进行的,出现在基
因组页
面上。
FTP NM
_*
和
NP_*
记录是在
/refseq
目录下;对人类的
NT_*
记录可以按染色体数字从
/genbank/genomes/H_sa
piens/*
目录下下载,当第一次的完整版本建立后还将
加
到
refseq
目录下。将来
NC_*
记录将被加入。参考
FTP
README
文件获得更多
的信息。
人类基因组测序
为人类
contigs
的
NT_######
记录只有在人类基因组测序页面上通过
BLAST
查
询可以被图
形的看到,下载,或访问
LocusLink LocusLink
记录提供
链接到
NM_######
和
NP_#
#####
记录。
LocusLink
可以通过文本条件的
RefSeq
登录号被查询,参见
LocusLink FAQ
取得查询技巧。
通过
Entrez
查询检索
NM_
和
NP_
RefSeq
记录:
RefSeq<
/p>
记录可以被通过不同的
Entrez
查询
来检索:
查询结果样本
NM_003988
一个关于
PAX2
,
< br>isoform c
的
RefSeq
< br>记录被返回。
PAX2[Gene Name]
这返回
17
记录包括
< br>5
个
PAX2
RefSeq
记录。
PAX2[Gene Name] AND
srcdb_refseq[properties]
这个查询仅检索含有
5
个不同剪切本的
PAX2
RefSeq
记录的集合。
srcdb_refseq[prop] AND provisional[all]
这个查询返回所有临时的
RefSeq
记录集合。
srcdb_refseq[prop]
AND
biomol_mRNA[prop]
NOT
provisional[all]
这个查询返回所有检查过的
RefSeq
记录集合。
确定在
BLAST
< br>结果中的
NM_
和
NP_
RefSeq
记录:
这个不同的
p>
RefSeq
登录号的格式
(它们包括一个
下划线)
提供一个快捷的指示:这个
BLAST
结果包括了一
个
RefSeq
记录。
Score E
Sequences producing
significant alignments: (bits)
Value
ref|NM_000014.1|A2M| Homo
sapiens alpha-2-ma... 9073 0.0
^ ^
| |
|
RefSeq
登录号有一个不同的格式
“ref”表明了
RefSeq
数据库
什么是一个
< br>RefSeq
记录与其他区别的特点?
RefSeq
记录区别与其他
GenBank
记录在:
使用一个特殊的登录号
显示来源信息
,由
RefSeq
打头,在
Comme
nt
字段的第一行
一致的使用可获得的官方命名
包括<
/p>
OMIM
和
LocusLink
dbxrefs
在基因特性中
蛋白记
录指明
RefSeq
作为
DBSOUR
CE
登录号格式
序列类型
NT_123456
构建的基因组
contigs
NM_123456 mRNAs
NP_123456 proteins
NC_123456 chromosomes
我如何在
BLAST
和
Entrez
搜索结果中快速的确定
RefSeq
?