- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
测井曲线自动分层模型的研究
测井曲线自动分层模型的研究
组长:卓俊慧
组员:袁蕴英
组员:吴天增
测井曲线自动分层模型的研究
摘要
本文利用测井曲线进行了地质分层,我们首先采用了格罗伯斯(Grubps)检验法、滑动平均法、归一化处理等方法对原始测井数据进行了预处理,并利用R型聚类法把变量聚类分成了3类,每类中选取一个离散系数最大的变量作为进一步分析的主动曲线。选取的三条曲线为GR(自然伽玛测井16.39%,平均层间误判率降为22.94%,并以1号井为例,对分层的依据进行了说明。最后,我们利用改进后的自动分层模型,对8—13号井实现了自动分层。
关键词:聚类分析、层内差异法、自动分层
问题的重述
本题所涉及到的是在地球物理勘探中利用测井曲线进行地质分层的相关问题。通常,在前期地质研究中,地质工作人员都会通过经验,分析测井数据反映的地层特点,从而进行分层。这种人工分层法受测井分析人员的经验知识和熟练程度影响程度较大。
题中给出了1—13号井的测井曲线数据,并已知1—7号井的的人工分层结果。题目一希望我们将1号井作为标准井,依据其分层结果,总结出分层井点数据的变化特点,以此建立起合理的数学模型,实现井位分层人工智能处理。同时,利用该模型对2号井至7号井进行自动分层,并与其人工分层结果相比较,提高分层精度,并对分层结果做出说明。
题目二希望我们利用完善后的数学模型以及已给的各种测井曲线数据,对第8号井至13号井进行自动分层,并分析分层后的结果。
问题的分析
因为部分测井曲线数据中缺失值所占比例较大,对分层的影响不大,我们将缺失值所占比例较大的变量不予考虑。同时,我们发现数据中含有不少异常点且存在着噪声等问题,采用格罗伯斯(Grubps)检验法、滑动平均法、归一化处理等方法对原始测井数据进行了预处理。题中共给出了66个变量,为了避免重复考虑性质相似的曲线对分层的影响,我们利用R型聚类法把所有变量聚类分成了3类,再通过比较他们的离散系数,挑选出值最大的作为主动曲线。
然后,我们根据1号井的人工分层结果,将其每一层的均值作为其他井聚类分析的初始聚心,经过验证,发现它能较好得表现出数据的特点。利用此模型,我们对2—7号井进行了做K—Means聚类分析,得出分层结果,并与人工分层结果进行比较,用层内误判率和层间误判率为指标对自动分层划分的准确程度进行了评价,发现其中的问题,然后对模型进行了优化,在聚类分析前,加入层次分析法,防止数据出现跳层的现象。
最后,我们用新的模型在此对2—7号井进行聚类分析,得出分层结果,仍使用层内误判率和层间误判率对其自动分层划分的准确程度进行了评价,发现结果较为理想。于是,我们利用该模型对对8—13号井实现了自动分层,并对分层的结果做出了说明。
模型的假设
1.假设地层是横向各向同性的。
2.不考虑非地层因素(如测量数据、测量条件等)对分层结果的影响。
定义与符号说明
为均方根误差
为该层的某个采样值
为第i层测井均值
为非地层因素引起的允许误差
第i层聚心与其相邻的聚心之间的距离
表示密度DEN在第i层的聚心
表示4M电阻率在第i层的聚心
表示PW在第i层的聚心
第m口井在第i层的层内误判率
第m口井的层间误判率
表示第m口井在第i层中被错误的聚类为非i层的测井曲线数据的个数
表示第m口井在第i层中总的测井曲线数据的个数
表示在第m口井的分层结果中,分层错误的深度
表示第m口井的总深度
模型的建立与求解
5.1数据的预处理
首先本题中几乎每条测井曲线数据中都含有无效值,有的测井曲线的无效值甚至占到该曲线总数据量的80%以上的比例(具体数据见附件一)。无效值比例过高,会使得有效样本所占比例大大减少,损失大量信息。所以,我们认为缺失值过高的测井曲线数据对分层的贡献不大,不考虑PDRO等11条无效值比例超过80%的曲线,再对剩下的测井曲线数据进行如下处理:
5.1.1异常点处理
异常点指的是严重偏离数据平均值的失真数据。我们采用格罗伯斯(Grubps)检验法对数据进行处理。将原始数据集合按从小到大的顺序排列,得到新的数据集合。假设服从正态分布,可用极值减去均值形式统计量U来校验数据是否为异常点。
(1)
(2)
(3)
当时,为异常点。其中为不同的显著性水平在不同的下的临界值,可以通过相关手册查到。
由于异常点不但对数据有干扰,而且会影响后面数据处理如归一化等,所以对异常点一般不能随便舍弃,我们选择采用邻近数据平均值代替法处理这些异常点。
5.1.2滑动平均消除毛刺干扰
无论通过什么观测途径所得到的曲线数据,总不免有噪声。为了了解事物的变化规律,可以通过平
文档评论(0)