- 1、本文档共72页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * 对于含有N个化合物的训练集来说,随机抽取若干(j)化合物作为测试集,然后Bootstrapping 从N-j 个化合物中随机选择j 个化合物填充到训练集中,使训练集化合物数目保持在N个,这样,有些化合物就会在训练集中出现两次甚至多次(=2)。此时用重组后的训练集建立模型预测 j 个化合物的生物活性,计算j 个化合物的预测残差的平方和(PRESS)。此过程重复若干次,可以得到上千个PRESS值,最后将PRESS值求和,取平均值进行计算: Bootstrapping 该方法和Bootstrapping的区别在于,在抽取j个化合物作为训练集后,OOT并不会随机在N-j个化合物中选择一些化合物进行重复以保证训练集化合物数目保持不变,只是用N-j个化合物直接建立QSAR模型并进行活性预测。 Out-of-train (OOT) 随机模型检验(Stochastic Model Validation,SMV)是另一个新的检验技术,可以用来估测所有数据对于模型建模能力和交互预测能力的影响。 这种技术也是要产生许多临时的训练集和测试集(Nv=1 or many),但其旨在穷举化合物作为临时训练集(N-Nv)和临时测试集(Nv)所有可能的组合,即SMV 会给出N!/(N-Nv)!种可能的组合,也就会建立这么多的模型。很容易可以想象,这种方法实际上是LOO 和LMO 的结合。 Stochastic Model Validation (SMV) 该方法将响应值如生物活性随机打乱顺序,而保持描述符的顺序不变,从而建立新的QSAR模型。 该过程重复若干次后,与原来模型的统计信息进行比较,希望所得到的平均R2和Q2等比较低,如果R20.50,那么这个模型有可能就有随机相关的嫌疑,该QSAR 模型的可靠性是值得怀疑的。 是检验模型是否存在偶然相关的有力工具。 Y随机检验 * 外部检验 测试集(test set)的预测: 从研究的化合物中挑选出足够多的样本组成预测集,预测集中的样本不参加模型的构建,然后通过模型对预测集中的分子的预测结果来检验模型真实的预测能力。 * * 2002年在葡萄牙的 Setubal召开的一次国际会议上,与会的科学工作者们提出了关于QSAR模型有效性的几条规则,被称为“Setubal Principles”;这些规则在2004年11月得到了进一步详细的修正,并被正式命名为“OECD Principles”。规定,一个QSAR模型要达到调控 (regulatory purpose)目的,必须满足以下5个条件: 1) a defined endpoint; 2) an unambiguous algorithm; 3) a defined domain of applicability; 4) appropriate measures of goodness-of–fit, robustness and predictivity; 5) a mechanistic interpretation, if possible。 实际上这五个条件就已经全面概括了QSAR研究工作的基本步骤。 QSAR的主要步骤 * 结构输入 ISIS/Draw, ChemDraw, PC model 等 结构优化 分子力学: 量子力学(半经验,从头算): PC model,Sybyl等 MOPAC,AMSOL Gaussian 分子描述符的计算 CODESSA, DRAGON 等 分子描述符的选择 模型的评价与 解释 模型的建立 * * * * * * * * * * * * * * * * * * * * * * * * logP与p p = log PX - log PH PH = 母体化合物的分配系数. PX = 取代的母体化合物的分配系数. logP: 化合物的疏水性 :取代基的疏水性 p是正的,取代基比氢疏水 p是负的,取代基比氢亲水 * * * 一维(结构的线性表示, 将化合物的结构图转化成计算机容易识别和有哪些信誉好的足球投注网站的字符串, WLN) 二维(如连接表, 容易表示分子的拓扑特征) 三维(可以表达空间结构) 其他 理论描述符的计算 * 1 D descriptors - Constitutional descriptors number of atoms absolute and relative numbers of C, H, O, S, N, F, Cl, B
您可能关注的文档
- 质量控制讲义.doc
- 中级会计一到五章题目整理.doc
- 中小学技术教育考试10套理论.doc
- 中压燃气管道.doc
- 中医基础理论_重点复习资料.doc
- 株洲市园林绿化建设工程施工质量验收标准.doc
- 注税会计-强化班学习讲义(全).doc
- 专科毕业生实习和设计(论文)相关规定及用表1.doc
- 砖混施工组织设计淇滨区.doc
- 庄河市新华路延伸改造工程道路组织设计.doc
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
文档评论(0)