化学信息学课件.docVIP

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
化学信息学课件

第一章化学信息概论 一、化学信息学的产生和发展 信息:实物的存在方式和运动状态的记录,它精确地描述物体或事件,并且可借助于一定的物质载体进行存储和传播。 化学学科的重要性 化学信息量的快速增长 化学信息学:是应用信息学方法解决化学问题的学科。(化学信息学是信息科学与化学的交叉学科。) (利用数学、统计学与计算机科学的理论、方法和网络技术作为手段,研究化学信息的获取、表示、管理、传播、分析、加工和应用,在此基础上进行知识创新,促进化学学科的发展。) 二、化学信息学的研究领域 应用现代信息技术构建信息处理系统,处理长期积累的大量化学信息资源,帮助化学家组织、分析和理解已知的科学数据,正确地预测化学物质的性质,开发新化合物、材料和方法。 应用计算机科学方法或信息学解决化学问题,对化学信息进行有效的存储、操作和处理,使化学信息合理地提升为化学知识。 研究内容:化学、化工文献学;化学知识体系的计算机表示、管理与网络传输;化学图形学;化学信息的解析与处理;化学知识的计算机推演;化学教育与教学的现代技术与远程信息资源。 三、信息资源检索的意义与作用 ? 启迪创新:科研工作具有继承和创新两重性,要求科研人员在探索未知进行创新之前,应该尽可能地继承和利用与之相关的信息。 ? 拓宽视野:21世纪信息与知识的积累日新月异,出现了大量的边缘科学和交叉科学。面对知识频繁更新的世界,需要接受终身教育,在不断的教育中更新知识,适应环境的变化。 ? 培养能力:现代教育不单纯是知识的传授,更重要是要大力进行各种能力的培养,其中包括自学能力、思维能力、研究能力、表达能力、创新能力、终生教育能力、组织管理能力和收集处理信息的能力。 ? 提高素质:信息素质是信息社会中实现对知识的探索和发现的综合能力,它是进入信息社会赖以生存的通行证。 四、化学信息学的课程内容 化学信息的产生和获取(重点) 利用检索工具 通过实验方法 ... … 化学信息的表达、存储和管理 化学运筹学 数据整理可视化 数据库管理技术 ... ... 化学信息的加工和处理 化学计量学 化学软件 目的是获取更多的信息 化学信息的深化 计算机模拟设计 化学结构的可视化以图形的方式对化学信息进行描述 1.2 电子信息和数据库 一、电子信息 指通过计算机等设备以数字信号传递的数字信息资源组成的数据库。 1、联机信息资源,如:Dialog, STN, OCLC数据库 2、光盘信息资源,包括单机版、网络版、联机版 3、Internet网络信息资源 二、数据库 数据库是以特定方式合理地组织相互关联的数据集合。 (一)数据库的结构 1、记录型文献数据结构 常用的字段:标题、作者、地址、期刊名、学科、文件类型、语种和摘要。如表1-1(p7) 2、记录的排序和索引 (1)顺排文档:按记录号顺序排列; (2)倒排文档:各个记录按照某一字段的值进行排列。 1.3 信息检索的方法和步骤 二、信息检索的评价 1、评价指标:查全率、查准率、漏检率、误检率、响应时间、用户负担、输出形式等。 2、查全率和查准率 (1) 查全率(R):检索出的相关信息量(w)与该系统信 息库中存储的相关信息量(x)的比率称为查全率, R=w/x × 100 % 。 (2)查准率(P):检出的相关信息量(w)与检出信息总量(m)的比率称为查准率, P= w/m× 100% 。两者之间存在互逆关系,即查全率高时,查准率较低,反之亦然。 (3)漏检率(O) :O = 1 – R = 1- w/x × 100 % 。 (4)误检率(N): N = 1 - P = 1-w/m × 100 % 。 如果一个检索系统中与某一课题相关的信息共250 条。检索操作后,实际检出了400条信息,其中相关信息为200条,此次检索效率可计算为: R = [200 /250] × 100 %=80% O = 1-80% = 20% P = [200/400] × 100%=50% N = 1-50%= 50% 2、位置检索: With (W、nW),表示算符两侧的检索词按此前后衔接的顺序排列,词序不可颠倒。 Near (N、nN)表示算符两侧的检索词必须紧密相连,两词词序可变。 Subfield ( S )表示算符两侧的检索词必须同时出现在文献记录的同一子字段(句子、短语)。 Field(F)表示算符两侧的检索词必须同时出现在同一个字段中。 Citation( C)表示算符两侧的检索词必须同时出现在一条文献的记录中。 Link( L)表示算符两侧的检索词之间有一定的从属关系。 4、限词检索 基本检索字段:题名、文摘、主题词、标识词 辅助检索字段:作

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档