生物信息学常用工具介绍课件.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 计算机文件系统被组织为层次结构,它有一个根目录。在根目录下包括很多子目录的分支,而子目录下面可能又包含着其他的子目录。Unix树状结构有一个根目录,用/表示 * * * * * * * * * * * * * * * * * * * * * * 从前面一些章节中我们已经了解到有很多软件可应用于生物信息学,尽管可能已有人编制出了我们需要的软件但我们还是时常会碰到最好是自己解决问题的时候。在生物信息学中,这常常意味着自己编写从海量数据中提取出恰恰是需要的信息的程序 * * * 正则表达式 ——sed与awk的基础 正则表达式是一些特殊或不很特殊的字符串模式的集合。 字符集包括:普通字符集和元字符集(通配符) 普通字符集:大小写字母、数字、空格、下划线 ^ 行首 $ 行尾 * 一个单字符后紧跟*,匹配0个或多个此单字符 [ ] 匹配[ ]内字符,可以是一个单字符,也可以是字符序列。 可以使用”-“来表示[ ]内范围,如[1-5]等价于[1,2,3,4,5]。 \ 屏蔽一个元字符的特殊含义,如\$表示字符$,而不表示匹配行尾。 . 匹配任意单字符 几个常见的例子: 显示可执行的文件:ls –l | grep …x...x..x 不包括文件夹:ls -l|grep \-..x..x..x 只显示文件夹:ls –l | grep ^d 匹配所有的空行:^$ 匹配所有的单词:[A-Z a-z]* 匹配任一非字母型字符:[^A-Z a-z] 包含八个字符的行:^……..$(8个.) Sed命令 命令格式 sed ‘/pattern/ action’ files pattern: 正则表达式 action: 操作,包括p、d、s 示例: 打印行:sed –n ‘/ 0\.[0-9][0-9]$/p’ fruit_prices.txt 删除行:sed ‘/^[Mm]ango/d’ fruit_prices.txt 执行替换/pattern1/s/pattern2/pattern3/g: sed ‘s/paech/peach/g fruit_prices.txt’ 使用多重sed sed –e ‘cmd1’……-e ’cmdN’ files: sed –e ‘s/paech/peach/’ –e ‘s/ *[0-9][0-9]\.[0-9][0-9]$/\$/’ fruit_prices.txt 在管道中使用sed awk命令 命令格式 awk ‘/pattern/ {actions}’ files 示例: 字段编辑:awk –F: ‘{ print $1,$3}’ inputfiles 或:awk –F: ‘{ printf “%s is %s\n”,$1,$3}’ inputfiles 执行指定模式的操作: awk ‘/ *\$[1-9][0-9]*\.[0-9][0-9] */ {print $0; next} /*\$0\.[0-9][0-9] */ {print $0}’ fruit_prices.txt 比较操作符:、、=、=、==、!=、value ~ /pattern/、value !~ /pattern/ (相关:、||) awk ‘($2 ~ /^\$[1-9][0-9]*\.[0-9][0-9]$/) ($3 75)’ { printf “……”}’ input_f 利用管道符将标准输入作为输入 如果记不住命令的用法 查看帮助文档: man 用法:man command 为什么要学习编程? 许多宣称自己在做生物信息学的研究者使用他人提供的工具,且从不编程 那么,研究生物信息学是否需要编程? 太复杂了,学不会? 什么是Perl Practical Extraction and Report Language — 实用提取报表语言 为什么选择Perl 1.脚本语言,与PHP,Python同类 2.不需要编译器,直接运行 3.强大的文本处理能力 4.简单易学容易掌握 5.强大的正则表达式功能 6.胶水语言 缺点:代码执行速度时间偏慢,约为C语言的五倍 如何获得Perl Windows环境:ActivePerl 安装:直接双击安装程序图标 Linux:默认安装 如何运行perl Windows命令行基本目录 1. cd , 进入目录 cd .. 进入上一层目录 2.. C: D: E: …改变盘符,进入其他硬盘分区 3. dir 察看目录中的文件内容 4. cls 清除屏幕 进入Perl的安装目录 一个简单的例子 一个生物信息学的例子 一串序列中查找是否存在非DNA字符

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档