汉恒生物-慢病毒载体-腺相关病毒包装-自噬-双荧光素酶-转染试剂-细胞支原体污染-无缝克隆-cas9-稳定细胞株-IncRNA-环状RNA

在线客服

QQ客服

扫一扫，查询项目进展

如何获得基因序列文件下载

如何获得基因序列？——在NCBI中查找目的基因实例

基因，即具有遗传效应的DNA片段，是控制生物性状的基本遗传单位。基因有两个特点，一是能忠实地复制自己，以保持生物的基本特征；二是基因能够“突变”，突变绝大多数会导致疾病，因此研究某种疾病的病理要从基因开始，研究基因当然就要知道该基因序列了，如何查找基因就是关键问题了，这里，我们将举例详细讲解一下如何查找基因。

1. 首先可以根据文献获得目的基因序列

通过阅读文献，找到你感兴趣的基因，根据文中提到的该基因在NCBI中的ID号，直接打开http://www.ncbi.nlm.nih.gov ，在All Databases后的下拉框中选择Nucleotide，把基因 ID号输入Search前面的文本框中，点“Search”，就可以找到该基因了。

举例说明，例如：在2003年JBC的文章（Conditional Knock-out of Integrin-linked Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation）中出现了“calreticulin (GenBank accession number gi 16151096)”，那么把“16151096”输入Search前面的文本框中，点“Search”，就可以找到该基因了（当然包括基因序列等相关信息），见下图。

检索结果界面如下图，可以看到GenBank号为AY047586的CALR基因的相关信息了。

里面有很多基因的信息，再往下是基因的的核酸序列（ORIGIN之后）。

基因的翻译区（CDS）点击 CDS即可得到。

下图标示的褐色区域序列即为基因的编码区序列。

这里需要指出一下，在显示基因的页面右下侧有一个LinkOut to external resource，里面是与该基因相关的链接，对于该基因的相关研究是很有用的。

如果你只想获得序列（例如去设计PCR引物的时候），那就可以选择FASTA，这样就得到了FASTA格式的序列文件，没有其他数字和格式的干扰。

这就是FASTA格式的序列：

2. 根据已经获得的基因的相关信息进行查找

如果只是知道基因的名字，怎么查序列呢？还是举例说明，比如研究的基因名称是人的VEGF基因，那么怎么在NCBI中找到它呢？首先打开http://www.ncbi.nlm.nih.gov/
在All Databases的下拉框中选择Gene，然后在中间的文本框中输入基因名称“VEGF”，点击Search...