- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于结构聚类的化合物熔点QSPR分析
基于结构相似性聚类的化合物熔点 QSPR 分析 周新奇,梁逸曾* 中南大学化学化工学院, 长沙, 410083 E-mail:zhouxinqi2000@163.com 摘 要:采用两种结构相似性聚类分析的方法对Robert C. Glen and Andreas Bender报道[1] 的一个结构多样性药物数据库中化合物进行筛选,一种是基于分子结构碎片相似的统计学方 法,另一种是基于分子基本骨架(MCS)相似的聚类方法。筛选出聚集在一起的化合物数据 集,采用PCR蒙特卡罗方法建立模型,训练集的拟合相关系数R为 0.9,检验集的相关系数R 在 0.8 以上,预测偏差降低到 25K。文献采用人工神经网络方法建模,所得到的相关系数都 只有 0.65 左右,预测偏差达到 40K。 关键词:熔点,QSPR,结构相似性,聚类,PCR 引言: 熔点描述的是一种化合物由固态变成液态转化温度,是晶体化合物的一种基本性质,可 以用于快速的分析物质的纯度等。但是还有很多化合物的熔点没有测出来,或者测出来的熔 点温度是一个大概的范围值[2]。在研究化合物的性质问题时,一个重要研的内容是通过化合 物的结构来计算化合物的性质。化学计量学中的QSPR被赋予了这样一种使命。这种基本的函 数表达式为: A/P=f(molecular structure)=f(molecular descriptors)[3] 在上述的表达式中分子结构由分子描述子表示。目前应用得比较广泛的描述子有:拓扑指数 描述子,量子化学描述子,经验物理化学描述子等等。A/P 描述的是物质的生物活性或者它 的某种性质。f(.)刻画结构与性质或生物活性之间的关系。 前面很多的关于熔点与结构之间的QSPR研究一般都是针对某一种化合物,Dearden JC 等报道了用氢键供应能力、疏水常数、mol折射率、Sterimol宽度参数B2和m-取代指示变量 五个参数对42种苯胺化合物的熔点进行建模,得到比较好的结果,r=0.941,s=24.6[4]。Alan R. Katritzky等,对443个单取代和二取代的苯化合物熔点进行QSPR研究,采用6个描述子进 行建模,其拟合系数0.8373,成功地应用于预测模型[5]。蒋明谦先生提出了同系物的线性规 律[6] [7] 之后,很多学者对同系化合物的熔点的关系也作了研究:仇明华 对烷烃同系物考虑分 子的端基效应,提出了熔点计算方法,得到的平均相对误差为2. 59 %。James S. Chickos and Gary Nichols[8]也对一大批同系物的熔点做了研究。对于比较大型的数据,可以采用两步的 策略来进行数据挖掘:有哪些信誉好的足球投注网站出化学模式并且给出结构和性能之间的详细的关系[9]。一般采用 相似性比较的方法或者聚类的方法来分析化合物的模式。然后用所得到的化合物的模式进行 建模对未知的样本进行预测。采用相似度聚类的方法已经报道的有基于图形相似和基于指纹 图谱相似性对数据库进行虚拟筛选[10]。 1 数据和方法 -1- 1.1 数据集 化合物的结构和熔点的数据来自于Robert C. Glen and Andreas Bender的报道,在网 站[11]下载原始数据,但其中有一个数据有误,在我的实验中将其剔除。所得到的结构数据为 smiles编码,我们利用网上[12]在线结构文件转换软件将其转换成sdf文件格式,得到sdf的结 构文件以后我们将它导入ISIS/Base软件中,可以很清晰地看到分子的二维结构,它包含有 多种多样的结构 (见图一)。下载的分子结构我们有的无法将它进行转化和识别,因此将不 能够识别的分子去掉。得到 3613 个分子。 1.2 描述子 我们采用了 202 个 2D 和 3D 描述子,包括疏水常数,分子的表面积,分子的极性,量 子化学描述子等等,这些描述
您可能关注的文档
- 国家鼓励发展循环经济的主要优惠政策.doc
- 国庆期间化学作业1.doc
- 国庆节假期作业第一章化学反应与能量&21化学反应速率.doc
- 国道319线上杭吊钟岩古滑坡体综合治理.pdf
- 国防焊接技术研究应用现状与发展.pdf
- 国际视野下创新人才的培训基础教育篇专业课.doc
- 图们江下游的景观特点及其变化.pdf
- 图像的自适应模糊阈值分割法.pdf
- 图示法是一种行之有效的历史学习方法下图描述了解放战....doc
- 图形处理器在通用计算中的应用.pdf
- 基于能量解耦法的动力总成悬置系统优化设计.pdf
- 基于荧光示踪技术的水质稳定剂在线自动监测仪.pdf
- 基于聚集诱导荧光增强机制分子识别检测探针的相关研究北京科技大学邓玉豪王建新廖敏杨运旭.pdf
- 基于贝加莱可编程计算机控制器(PCC)的新型水轮机调速器.pdf
- 基于聚光装置的新型太阳能电池对发电量的影响.pdf
- 基于视觉选择性注意与IHOG—LBP特征组合的行人目标快速检测.pdf
- 基于背散射电子图像的矿渣水泥复合体系反应程度的定量分析.pdf
- 基于路面温度频率分布的沥青P高温等级选择G.pdf
- 基于轮胎磨损的外倾角与前束值匹配研究宋年秀.pdf
- 基于遗传算法优化神经网络的直驱式风力发电机变频器故障诊断研究胡立锦.pdf
文档评论(0)