NCBI如何查找序列..docxVIP

下载本文档

47
0
约4.77千字
约 11页
2016-12-31 发布于重庆
举报
版权申诉

NCBI如何查找序列..docx

1、本文档共11页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

1、利用Map viewer?查找基因序列、mRNA?序列、启动子（Promoter）下面以人的 IL6（白细胞介素 6）为例讲述一下具体的操作步骤1．打开Map viewer 页面，网址为： /mapview/index.html 在 search 的下拉菜单里选择物种，for 后面填写你的目的基因。操作完毕如图所示：2．点击“GO”出现如下页面：3．在步骤二图示的右下角有一个Quick Filter,下面是让你选择的几个复选框，在Gene前面的小方框里打勾，然后点击Filter. 出现下图：说明一下：1、染色体的红色区域即为你的目的基因所处位置。2、下面参考序列给出了三个，是不同的部门做出来的，经我验证，序列有微小的差异，但总体来说基本相同。尽管你分别点击后，序列代码、序列代码等有所差异，但碱基基本一致，不影响大家研究分析序列。现在普遍采用的是最上面的那个序列，这一条是世界范围的生物科学家用计算机合成的一个序列。我也推荐大家使用这个序列。4．点击上述三条序列第一条序列（即 reference）对应的Genes seq，出现新的页面，页面下方为：5．点击上图出现的“Download/View Sequence/Evidence ”，即下载查看序列等功能，结果如图所示：先对上面这张图做点简要的说明，在 Sequence Format（序列输出格式）后面是一个下拉式选择菜单，默认的为 FASTA 格式，还有一个是 GenBank 格式。我推荐大家选择 GenBnak格式，因为这个格式提供了很多该基因的信息，而 FASTA格式只有基因序列。 6．在 Sequence Format 后选择 GenBank，然后点击下面的 Display，目的基因的相关信息和序列就出现在眼前了。点击后如图所示（网页较大，只抓取一小部分以作示范）：在上述打开的网页中，你可以看到基因长度，基因序列，以及这个基因是如何被报道出来的等各种信息。你会看到: mRNA join(3598..3678,3841..4031,5090..5203,5911..6057, 7803..8394) 这代表了从基因的 3598位开始就是转录区了，即我们常说的 mRNA 片断，由于内含子的存在，所以 mRNA 在DNA 序列上分成了几段。 CDS join(3660..3678,3841..4031,5090..5203,5911..6057, 7803..7970) CDS 代表编码序列，即蛋白编码区是从 3660 开始的（ATG），由于剪接作用所以 CDS 区也是不连续的。说到这里，可能很多朋友都已经明白了 promoter 即启动子区域在哪里了。但我还是再唠叨几句：转录起始位点前面是基因的调控区，启动子区没有明显的位置定义，大家也只是猜测它的大体位置，如果你要研究 promoter 区的话，建议你选择转录起始位点前的 2000个碱基进行研究，一般默认的是这样。当然你如果觉得长度太长不好研究的话，也可以只研究-1000 到0这一千个碱基，因为一般情况下，启动子区的变异都在这个区域内。这样大家就可以找到自己的目的基因序列和启动子了，这种方法可能使用的人不是很多，但我个人比较喜欢，因为它最大的优点是可以找到启动子区域和其他调控区域。希望大家可以发帖交流，让我们把 NCBI 用的更好！ 2、如何查找连续的mRNA、cDNA、蛋白序列（依然以人类的?IL6?为例）1．进入NCBI 主页：/ 在 search 后面选择 Gene，在 for 后面填写需要查找的基因的名字。如图所示：出现了很多基因序列，在每个序列的右边还有“Order cDNA clone” 的链接，这些序列中有些序列是跟你的目的基因同名的，有些是别名（Other Aliases）与你的目的基因一致，根据每个序列的介绍认真选择你的目的基因。上图中我需要的 IL6 是标号为2的序列。 2.1 查找 cDNA 序列 2.1.1 点击Order cDNA clone, 出现目的页面如图所示：2.1.2 点击Clone Sequence 后面的链接即可得到cDNA 序列。点击后如图所示（只抓取其中一部分）2.2 查找 mRNA、蛋白序列回到步骤 1 点击“Go”之后出现的页面，点击目的基因的名字，出现以下页面 (只抓取相关部分)：页面的下半部分，即可以获取 mRNA和蛋白序列的部分：找到“NCBI Reference Sequences (RefSeq)”，它分为几个板块，第一个“mRNA and Protein ”区可以让我们找到连续的编码 mRNA 序列和蛋白序列。在 mRNA and Protein下面有两个序列代码（中间划有一个箭头），这代表了 mRNA序列和蛋白序列。分别点击就可以得