PDSKNN:一种针对不完整数据集的测井岩性识别方法

尹璐, 周全, 王猛, 郭宇航, 李岩

世界地质 ›› 2025, Vol. 44 ›› Issue (3) : 446 -454.

世界地质 ›› 2025, Vol. 44 ›› Issue (3) : 446 -454.

PDSKNN:一种针对不完整数据集的测井岩性识别方法

    尹璐, 周全, 王猛, 郭宇航, 李岩
作者信息 +

Author information +
文章历史 +

摘要

利用机器学习技术,根据测井数据集中各样本的特征向量对岩性进行分类时,通常需要先对数据集进行清洗和预处理,发现其中缺失的数据集和异常值。受测井曲线失真或井间曲线数量差异的影响,用于岩性识别的测井数据集通常是不完整的,存在大量缺失数据和异常值,使得大多数机器学习方法难以直接应用。针对这一问题,提出了基于部分距离策略的K-近邻算法(PDSKNN)。该算法基于一种能够计算含有缺失值的特征向量间距离的方法(PDS)改进传统的K-近邻算法(KNN),实现了对不完整数据集的直接应用。在某地区复杂火成岩储层的岩性识别任务中,对PDSKNN算法进行了实际应用测试。当数据缺失率为2.7%时,PDSKNN算法岩性识别准确率高达91.90%。这一结果表明,PDSKNN算法在算法层面有效地解决了数据集不完整的问题。为了进一步验证PDSKNN算法的有效性,通过随机删除数据集部分数据来提高缺失率,并观察识别准确率的变化。实验结果显示,随着缺失率的升高,识别准确率逐渐降低。但即使缺失率达到20%,PDSKNN算法的识别准确率依然保持在80%以上。这一结果证明了PDSKNN算法能够在数据缺失较为严重的情况下保持较高的识别准确率。最后,通过模拟不同井中曲线缺失情况,对PDSKNN算法的识别效果变化进行了对比分析,随着曲线缺失数量的增加,井中岩性识别效果有所降低,但依然保证了大部分井段的识别效果,表明PDSKNN算法对井中曲线缺失有着较强的鲁棒性。

关键词

岩性识别 / 不完整数据集 / 部分距离策略 / K-近邻 / 测井曲线

Key words

引用本文

引用格式 ▾
尹璐, 周全, 王猛, 郭宇航, 李岩. PDSKNN:一种针对不完整数据集的测井岩性识别方法[J]. 世界地质, 2025, 44(3): 446-454 DOI:

登录浏览全文

4963

注册一个新账户 忘记密码

参考文献

基金资助

国家重点研发计划项目(2023YFC3707901); 国家自然科学基金(42072323)

AI Summary AI Mindmap

0

访问

0

被引

详细

导航
相关文章

AI思维导图

/