张驰 潘懋 胡水清 胡亚斐 阎逸群

张驰, 潘懋, 胡水清, 胡亚斐, 阎逸群. 融合储层纵向信息的机器学习岩性识别方法[J]. 地质科技通报, 2023, 42(3): 289-299. doi: 10.19509/j.cnki.dzkq.tb20220289
引用本文: 张驰, 潘懋, 胡水清, 胡亚斐, 阎逸群. 融合储层纵向信息的机器学习岩性识别方法[J]. 地质科技通报, 2023, 42(3): 289-299. doi: 10.19509/j.cnki.dzkq.tb20220289
Zhang Chi, Pan Mao, Hu Shuiqing, Hu Yafei, Yan Yiqun. A machine learning lithologic identification method combined with vertical reservoir information[J]. Bulletin of Geological Science and Technology, 2023, 42(3): 289-299. doi: 10.19509/j.cnki.dzkq.tb20220289
Citation: Zhang Chi, Pan Mao, Hu Shuiqing, Hu Yafei, Yan Yiqun. A machine learning lithologic identification method combined with vertical reservoir information[J]. Bulletin of Geological Science and Technology, 2023, 42(3): 289-299. doi: 10.19509/j.cnki.dzkq.tb20220289


doi: 10.19509/j.cnki.dzkq.tb20220289

中国石油天然气股份有限公司科学研究与技术开发项目“深层/超深层油气藏开发技术研究”下属课题“深层/超深层油气藏有效储层预测与高效井优化技术研究” 2021DJ1003


    张驰(1992—), 女, 现正攻读构造地质学专业博士学位, 主要从事信息地质研究工作。E-mail: zhangchi1106@pku.edu.cn


    胡水清(1979—), 男, 高级工程师, 主要从事油田开发地质、油藏工程科研工作。E-mail: hushuiqing@petrochina.com.cn

  • 中图分类号: P631.8+.4;P628

A machine learning lithologic identification method combined with vertical reservoir information

  • 摘要:

    测井资料中包含丰富的岩性信息, 相比于取心资料, 具有连续性强、成本低等优点。用机器学习方法探索测井曲线与实际取心段样本岩性之间的关系, 实现储层岩性的自动识别, 降低岩性识别成本, 提高识别效率和准确性, 可以为储层评价提供有效手段。基于岩性分类依据选择适合样本的分类方案, 选取适合岩性分类问题的机器学习方法设计试验方案, 提出了融合储层纵向信息的机器学习岩性识别方法, 利用深度窗对常规测井数据和已知岩性数据进行了序列采样, 生成了训练样本。用逻辑回归、支持向量机、随机森林、卷积神经网络和Stacking集成学习5种不同方法分别建立模型, 对新疆某油田的强非均质岩层原始样本进行了岩性识别。结果表明, 当深度窗宽度与岩层厚度相匹配时, 在原始样本具有强非均衡性的情况下, 用本方法对其进行预处理之后, 各个机器学习方法获得的岩性识别准确率均有较大提高。深度窗的宽度决定了方法识别岩层厚度的精度, 深度窗越小, 识别精度越高;深度窗越大能够保留的纵向信息越多, 对相应厚度的岩层识别准确率越高。本文的融合储层纵向信息的机器学习岩性识别方法能提升测井资料岩性识别的准确性, 给非均质薄岩层的自动有效识别提供了经济有效的参考方案。


  • 图 1  岩石类别划分方案(据文献[21]修改)

    Figure 1.  Rock classification scheme

    图 2  随机森林算法结构

    Figure 2.  Random forest algorithm structure

    图 3  卷积神经网络基本思想示意图[23]

    Figure 3.  Basic sketch map of convolutional neural network

    图 4  Stacking集成学习算法结构

    Figure 4.  Stacking ensemble learning algorithm structure

    图 5  不同厚度地层的自然伽马曲线[31]

    Figure 5.  Natural Gamma Ray curves of strata with different thickness

    图 6  融合储层纵向信息的岩性识别机器学习模型设计

    Figure 6.  Design of a machine learning model for lithologic recognition combined with vertical reservoir information

    图 7  岩性段分布特征图

    Figure 7.  Lithologic distribution feature map

    图 8  数据样本岩性分布比

    Figure 8.  Lithologic distribution ratio of samples

    图 9  实例数据预处理示意图

    DEPT.深度(m); CAL.井径(cm); DT.声波时差(μs/ft); GR.自然伽马(API); PHIN.中子(%);RHOB.密度(g/cm3); RT.地层真电阻率(Ω·m); RXO.冲洗带电阻率(Ω·m); SP.自然电位(mV)

    Figure 9.  Schematic diagram of instance data preprocessing

    图 10  深度窗宽度与样本数量及模型性能关系图

    Figure 10.  Relationship among depth window width, number of sample size and model performance

    图 11  不同学习器对结果的影响

    Figure 11.  Influence of different classifiers on results

    图 12  预测结果混淆矩阵(a.样品数量;b.识别率)

    Figure 12.  Confounding matrix of predicted results

    图 13  岩层非均质性误差示意图

    Figure 13.  Sketch map of rock heterogeneity error

    图 14  岩层厚度对结果影响示意图

    Figure 14.  Sketch map of influences of rock thickness on results

    表  1  评价标准计算公式

    Table  1.   Formula of performance evaluation

    评价标准 公式
    准确率 $\text { accuracy }=(\mathrm{TP}+\mathrm{TN}) /(\mathrm{TP}+\mathrm{TN}+\mathrm{FP}+\mathrm{FN})$
    马修斯相关系数 $\text { Matthews corelation }=\frac{\mathrm{TP} \times \mathrm{TN}-\mathrm{FP} \times \mathrm{FN}}{\sqrt{(\mathrm{TP}+\mathrm{FP})(\mathrm{FN}+\mathrm{TP})(\mathrm{FN}+\mathrm{TN})(\mathrm{FP}+\mathrm{TN})}}$
    F1分数 $\begin{gathered} \text { precision }=\mathrm{TP} /(\mathrm{TP}+\mathrm{FP}), \text { recall }=\mathrm{TP} /(\mathrm{TP}+\mathrm{FN}) \\ \text { F1 score }=2 \text { precision } \times \text { recall } / \text { (precision }+ \text { recall }) \end{gathered}$
    注:岩性识别预测结果用混合矩阵进行分类。得到的分类类别可归为4种, 即真正例(true positive, 简称TP)、假正例(false positive, 简称FP)、真反例(true negative, 简称TN)、假反例(false negative, 简称FN)。atturacy.准确率; Matthews correlation.马修斯相关系数;precision.查准率; recall.召回率
    下载: 导出CSV

    表  2  超参数选择结果

    Table  2.   Results of hyper-parameter selection

    分类器 超参数
    逻辑回归 penalty=‘l2’;solver=‘saga’;max_iter=700
    支持向量机 C=2;Kernel=‘rbf’;Gamma=10
    随机森林 n_estimators=500;criterion=‘gini’
    Stacking集成学习 基分类器:逻辑回归、支持向量机、随机森林;元分类器:逻辑回归
    下载: 导出CSV
