高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于机器学习的海陆过渡环境中陆源有机质分布预测模型——从沉积模拟实验到地质应用

邵俊哲 李阳 汪勇 吴楠 魏薇 刘海

邵俊哲, 李阳, 汪勇, 吴楠, 魏薇, 刘海. 基于机器学习的海陆过渡环境中陆源有机质分布预测模型——从沉积模拟实验到地质应用[J]. 沉积学报, 2025, 43(4): 1398-1411. doi: 10.14027/j.issn.1000-0550.2024.056
引用本文: 邵俊哲, 李阳, 汪勇, 吴楠, 魏薇, 刘海. 基于机器学习的海陆过渡环境中陆源有机质分布预测模型——从沉积模拟实验到地质应用[J]. 沉积学报, 2025, 43(4): 1398-1411. doi: 10.14027/j.issn.1000-0550.2024.056
SHAO JunZhe, LI Yang, WANG Yong, WU Nan, WEI Wei, LIU Hai. Machine Learning-Based Model for Predicting the Distribution of Terrestrial Organic Matter in a Marine-Terrestrial Transitional Environment: From sedimentary simulation experiments to geological applications[J]. Acta Sedimentologica Sinica, 2025, 43(4): 1398-1411. doi: 10.14027/j.issn.1000-0550.2024.056
Citation: SHAO JunZhe, LI Yang, WANG Yong, WU Nan, WEI Wei, LIU Hai. Machine Learning-Based Model for Predicting the Distribution of Terrestrial Organic Matter in a Marine-Terrestrial Transitional Environment: From sedimentary simulation experiments to geological applications[J]. Acta Sedimentologica Sinica, 2025, 43(4): 1398-1411. doi: 10.14027/j.issn.1000-0550.2024.056

基于机器学习的海陆过渡环境中陆源有机质分布预测模型——从沉积模拟实验到地质应用

doi: 10.14027/j.issn.1000-0550.2024.056
基金项目: 

湖北省自然科学基金 2024AFB243

详细信息
    作者简介:

    邵俊哲,男,2001年出生,硕士研究生,烃源岩评价与油气成藏机理,E-mail: shao413958@163.com

    通讯作者:

    李阳,男,副教授,烃源岩沉积机制与分布规律,E-mail: lyugly@163.com

Machine Learning-Based Model for Predicting the Distribution of Terrestrial Organic Matter in a Marine-Terrestrial Transitional Environment: From sedimentary simulation experiments to geological applications

  • 摘要: 目的 陆源海相烃源岩是我国多个近海盆地的主力烃源岩,其差异性展布特征制约着烃源岩的分布预测精度和油气勘探成效。而陆源有机质的搬运沉积过程决定着陆源海相烃源岩质量和分布。 方法 运用水槽沉积模拟结合三维激光扫描技术,从“正演”的角度动态记录并定量表征不同水体盐度条件下陆源分散有机质的搬运过程并运用机器学习算法建立总有机碳(Total Organic Carbon,TOC)预测模型。 结果 海陆过渡环境中的陆源有机质主要富集在三角洲前缘和前三角洲沉积相带内,随着搬运距离的增大,海陆过渡环境中的陆源有机质丰度呈现先增大后减小的趋势。在盐絮凝作用影响下,咸水环境中陆源有机质搬运距离更靠近物源区,沉积厚度更大。基于三种深度学习算法建立了实验条件下的TOC预测模型,最终优选出基于随机森林算法的预测模型为最优模型。 结论 将实验条件下的TOC预测模型与地质条件相结合,完成了崖南凹陷崖城组三角洲内烃源岩的TOC预测。结果显示,崖南凹陷陆源有机质搬运距离可达50 km,在距离物源区31 km左右处有机质富集程度最高。
  • 图  1  沉积模拟实验主体装置示意图

    Figure  1.  Schematic diagram of the main device for the sedimentary simulation experiment

    图  2  沉积模拟实验底型3D示意图

    Figure  2.  Three dimensional model of the bottom shape for the sedimentary simulation experiment

    图  3  三角洲沉积区切片方案(a)与取样管(b)

    Figure  3.  Slicing scheme (a) and sampling tube (b) for the delta sedimentary area

    图  4  淡咸水条件下有机质搬运情况对比

    Figure  4.  Comparison of organic matter transport under fresh/saline water conditions

    图  5  淡水条件下三角洲纵剖面刻画图

    Figure  5.  Vertical profile characterization of the delta under freshwater conditions

    图  6  淡咸水条件下有机质沉积厚度分布

    Figure  6.  Distribution of organic matter thickness under fresh/saline water conditions

    图  7  淡咸水条件下TOC平面分布

    Figure  7.  Plane distribution of total organic carbon (TOC) under fresh/saline water conditions

    图  8  有机质分布预测模型建立流程图

    Figure  8.  Process for establishing a prediction model for TOC distribution

    图  9  不同参数对TOC分布的影响程度

    Figure  9.  Impact of different parameters on TOC distribution

    图  10  崖南凹陷主三角洲泥岩TOC分布预测及平面展布特征

    Figure  10.  Prediction of TOC distribution and planar distribution characteristics of mudstone in the main delta of the Yanan depression

    图  11  崖南凹陷主三角洲泥岩TOC与陆源有机质搬运距离的关系

    Figure  11.  The relationship between TOC of mudstone in the main delta of Yanan Depression and the distance of terrestrial organic matter transport

    表  1  沉积模拟实验沉积期次和加砂组成数据表

    Table  1.   Sedimentary periods of the sedimentary simulation experiment and composition data values

    来水特征加砂组成/%
    第一沉积期第二沉积期第三沉积期
    粗砂中细砂粉砂粗砂中细砂粉砂粗砂中细砂粉砂
    洪水期254027825402783337237
    中水期20422810204228103035305
    枯水期104632121046321225343011
    下载: 导出CSV

    表  2  淡/咸水沉积模拟实验条件数据表

    Table  2.   Freshwater/saline data for sedimentary simulation experiment conditions

    水体盐度/‰实验期次来水过程历时/min流量/(L/s)有机质添加速率/(L/h)
    0.7(淡水)第一沉积期枯水6000.051.2
    第二沉积期中水—洪水—中水—枯水1 0000.1~0.15~0.1~0.052.4~3.6~2.4~1.2
    第三沉积期中水—洪水—中水—枯水1 0000.1~0.35~0.1~0.052.4~8.4~2.4~1.2
    54(咸水)第一沉积期枯水6000.061.2
    第二沉积期中水—洪水—中水—枯水1 0000.1~0.15~0.1~0.052.4~3.6~2.4~1.2
    第三沉积期中水—洪水—中水—枯水1 0000.1~0.35~0.1~0.052.4~8.4~2.4~1.2
    下载: 导出CSV

    表  3  三种算法最优模型参数和输入特征

    Table  3.   Optimal model parameters and input features of the three algorithms

    模型名称模型参数模型精度/%输入特征
    随机森林(RF)max_depth=11n_estimators':50078.22去异常值+基于经验的相带参数
    人工神经网络(ANN)alpha:[1],'solver':['lbfgs'],'max_iter':[10000]74.67相带独热编码+标准化
    支持向量机(SVM)C': [10]'max_iter':[10000]72.83相带独热编码+标准化
    注:max_depth为决策树最大深度;n_estimators为随机森林算法中森林中的树木的数量;alpha为正则化参数,alpha它的目的是防止过拟合;solver为优化器,用来调整群众参数:max_iter为迭代次数,C为惩罚系数。
    下载: 导出CSV

    表  4  预测模型验证数据表

    Table  4.   Data for prediction model validation

    井号深度/mX坐标Y坐标岩性岩石颜色坡度沉积相实测TOC/%TOC_RF/%误差准确度/%TOC_SVM/%误差/%准确度/%TOC_ANN/%误差准确度/%
    B3 718.562.148.82粉砂质泥岩灰色1.74分流河道0.340.370.025 392.560.440.1070.530.400.063 581.32
    B3 733.002.148.82粉砂质泥岩灰色1.74泛滥平原0.650.690.043 493.320.660.0198.661.380.725 3-11.58
    C3 924.504.579.12泥岩灰色1.74分流河道0.430.180.254 740.770.340.0980.050.400.026 593.84
    C3 930.004.579.12煤层黑色1.74泛滥平原30.9738.217.241 376.6231.860.8997.1233.302.334 792.46
    C4 034.504.579.12碳质泥岩黑色1.74泛滥平原19.0613.795.270 572.3511.877.1962.288.0011.055 242.00
    C4 049.504.579.12碳质泥岩黑色1.74分流间湾5.015.630.615 187.726.031.0279.646.971.955 360.97
    C4 067.564.579.12煤层黑色1.74分流间湾43.5054.4210.919 074.9043.400.1099.7763.4819.975 454.08
    C4 070.504.579.12泥岩黑色1.74分流间湾2.062.810.748 863.653.961.907.964.732.665 5-29.39
    C4 070.604.579.12碳质泥岩黑色1.74分流间湾6.395.830.563 891.186.140.2596.157.020.631 390.12
    C4 137.504.579.12泥岩灰色1.74泛滥平原1.961.520.441 377.481.860.1094.882.510.545 872.15
    D3 820.977.8612.50泥岩灰色1.50分流间湾0.830.990.156 681.131.100.2767.520.580.252 969.53
    D3 821.307.8612.50煤层黑色1.50分流间湾52.1067.1915.092 071.0343.868.2484.1963.7311.629 277.68
    D3 822.207.8612.50碳质泥岩黑色1.50分流间湾6.686.140.545 091.846.780.1098.507.260.583 191.27
    D3 830.127.8612.50泥岩灰色1.50分流河道0.180.240.060 666.330.280.1044.000.400.223 5-24.17
    D3 946.867.8612.50泥岩灰色1.50泛滥平原0.741.010.269 563.580.930.1974.281.991.249 9-68.91
    E4 126.006.869.26碳质泥岩黑色1.70分流间湾6.546.360.180 297.246.640.1098.479.843.304 349.48
    E4 126.996.869.26泥岩灰色1.70分流间湾1.621.370.245 484.851.470.1590.941.590.031 698.05
    E4 127.006.869.26泥岩黑色1.70分流间湾4.234.520.286 193.244.370.1496.695.721.489 864.78
    F3 970.029.0013.24煤层黑色1.40分流间湾45.2156.0110.797 076.1246.911.7096.2365.5720.361 154.96
    F3 997.454.579.12煤层黑色1.74泛滥平原28.1638.2710.105 064.1132.524.3684.5133.685.520 080.40
    F3 807.609.0013.24泥岩灰色1.40分流间湾0.791.000.206 673.851.290.5036.540.630.164 079.24
    下载: 导出CSV
  • [1] 邓运华,兰蕾,李友川,等. 论三角洲对南海海相油气田分布的控制作用[J]. 石油学报,2019,40(增刊2):1-12.

    Deng Yunhua, Lan Lei, Li Youchuan, et al. On the control effect of deltas on the distribution of marine oil and gas fields in the South China Sea[J]. Acta Petrolei Sinica, 2019, 40(Suppl.2): 1-12.
    [2] 李友川,邓运华,张功成. 中国近海海域烃源岩和油气的分带性[J]. 中国海上油气,2012,24(1):6-12.

    Li Youchuan, Deng Yunhua, Zhang Gongcheng. Zoned distribution of source rocks and hydrocarbon offshore China[J]. China Offshore Oil and Gas, 2012, 24(1): 6-12.
    [3] 张功成,王琪,苗顺德,等. 中国近海海陆过渡相烃源岩二元分布模式:以珠江口盆地白云凹陷为例[J]. 天然气地球科学,2014,25(9):1299-1308.

    Zhang Gongcheng, Wang Qi, Miao Shunde, et al. The duality distribution pattern of marine-continental transitional hydrocarbon source rocks: A case study from Baiyun Sag in Pearl River Mouth Basin, China Offshore[J]. Natural Gas Geoscience, 2014, 25(9): 1299-1308.
    [4] 李燕,邓运华,李友川. 河流—三角洲体系微相控烃及机理研究:以珠江口盆地恩平组煤系烃源岩为例[J]. 现代地质,2021,35(4):1065-1077.

    Li Yan, Deng Yunhua, Li Youchuan. Characteristics and mechanism of source rock development controlled by sedimentary microfacies in river-delta system: Case study of coal-measure source rock in Enping Formation in Pearl River Estuary Basin[J]. Geoscience, 2021, 35(4): 1065-1077.
    [5] Wang D D, Zhang G C, Li Z X, et al. The development characteristics and distribution predictions of the Paleogene coal‐measure source rock in the Qiongdongnan Basin, northern South China Sea[J]. Acta Geologica Sinica (English Edition), 2021, 95(1): 105-120.
    [6] El-Gendy N H, Radwan A E, Waziry M A, et al. An integrated sedimentological, rock typing, image logs, and artificial neural networks analysis for reservoir quality assessment of the heterogeneous fluvial-deltaic Messinian Abu Madi reservoirs, Salma field, onshore East Nile Delta, Egypt[J]. Marine and Petroleum Geology, 2022, 145: 105910.
    [7] El Diasty W S, Moldowan J M, Peters K E, et al. Organic geochemistry of possible Middle Miocene–Pliocene source rocks in the west and northwest Nile Delta, Egypt[J]. Journal of Petroleum Science and Engineering, 2022, 208: 109357.
    [8] 李丹,杨香华,常吟善,等. 澳大利亚北卡那封盆地中上三叠统Mungaroo三角洲陆源有机质分布特征[J]. 古地理学报,2014,16(2):193-204.

    Li Dan, Yang Xianghua, Chang Yinshan, et al. Distribution of the Upper Triassic terrigenous organic matter in Mungaroo delta of North Carnarvon Basin, Australia[J]. Journal of Palaeogeography, 2014, 16(2): 193-204.
    [9] 屈童,高岗,徐新德,等. 三角洲—浅海沉积体系泥质沉积规律模拟实验:以琼东南盆地崖南凹陷为例[J]. 岩性油气藏,2022,34(1):24-33.

    Qu Tong, Gao Gang, Xu Xinde, et al. Simulation experiment of argillaceous sedimentary law of delta-shallow sea sedimentary system: A case study of Yanan Sag, Qiongdongnan Basin[J]. Lithologic Reservoirs, 2022, 34(1): 24-33.
    [10] 谢玉洪. 中国海洋石油总公司油气勘探新进展及展望[J]. 中国石油勘探,2018,23(1):26-35.

    Xie Yuhong. New progress and prospect of oil and gas exploration of China National Offshore Oil Corporation[J]. China Petroleum Exploration, 2018, 23(1): 26-35.
    [11] 朱伟林. 中国近海新生代含油气盆地古湖泊学与烃源条件[M]. 北京:地质出版社,2009.

    Zhu Weilin. Paleolimnology and source rock studies of Cenozoic hydrocarbon-bearing offshore basins in China[M]. Beijing: Geology Press, 2009.
    [12] Tyson R V, Follows B. Palynofacies prediction of distance from sediment source: A case study from the Upper Cretaceous of the Pyrenees[J]. Geology, 2000, 28(6): 569-571.
    [13] 曾智伟,杨香华,朱红涛,等. 白云凹陷恩平组沉积晚期大型三角洲发育特征及其意义[J]. 地球科学,2017,42(1):78-92.

    Zeng Zhiwei, Yang Xianghua, Zhu Hongtao, et al. Development characteristics and significance of large delta of Upper Enping Formation, Baiyun Sag[J]. Earth Science, 2017, 42(1): 78-92.
    [14] 曾智伟,朱红涛,杨香华,等. 珠江口盆地白云凹陷恩平组物源转换及沉积充填演化[J]. 地球科学,2017,42(11):1936-1954.

    Zeng Zhiwei, Zhu Hongtao, Yang Xianghua, et al. Provenance transformation and sedimentary evolution of Enping Formation, Baiyun Sag, Pearl River Mouth Basin[J]. Earth Science, 2017, 42(11): 1936-1954.
    [15] 郭帅,杨海长,曾清波,等. 白云凹陷恩平组南部物源研究及其油气地质意义[J]. 海洋地质前沿,2020,36(6):56-63.

    Guo Shuai, Yang Haizhang, Zeng Qingbo, et al. Provenance of Enping Formation in the southern Baiyun Sag, Pearl River Mouth Basin and its implications for petroleum geology[J]. Marine Geology Frontiers, 2020, 36(6): 56-63.
    [16] 张春生,刘忠保. 现代河湖沉积与模拟实验[M]. 北京:地质出版社,1997.

    Zhang Chunsheng, Liu Zhongbao. Modern river and lake deposits and simulated experiment[M]. Beijing: Geological Publishing House, 1997.
    [17] 刘海,徐耀辉,李阳,等. 海陆过渡相三角洲沉积体系陆源有机质沉积特征及其影响因素的模拟实验研究[J]. 沉积学报,2024,42(1):251-265.

    Liu Hai, Xu Yaohui, Li Yang, et al. Experimental simulation of terrigenous organic matter sedimentary characteristics and its influencing factors in transitional facies delta depositional system[J]. Acta Sedimentologica Sinica, 2024, 42(1): 251-265.
    [18] Ramaswamy V, Gaye B, Shirodkar P V, et al. Distribution and sources of organic carbon, nitrogen and their isotopic signatures in sediments from the Ayeyarwady (Irrawaddy) continental shelf, northern Andaman Sea[J]. Marine Chemistry, 2008, 111(3/4): 137-150.
    [19] 李中乔,吴莹,李珍,等. 越南红河水下三角洲表层沉积物中有机物分布及来源分析[J]. 海洋与湖沼,2013,44(3):577-583.

    Li Zhongqiao, Wu Ying, Li Zhen, et al. Distribution and source of organic matter in the surface sediments from the red river subaquatic delta, Vietnam[J]. Oceanologia et Limnologia Sinica, 2013, 44(3): 577-583.
    [20] Burd A B, Frey S, Cabre A, et al. Terrestrial and marine perspectives on modeling organic matter degradation pathways[J]. Global Change Biology, 2016, 22(1): 121-136.
    [21] Li Z Q, Wu Y, Liu S M, et al. An 800-year record of terrestrial organic matter from the East China Sea shelf break: Links to climate change and human activity in the Changjiang Basin[J]. Deep Sea Research Part II: Topical Studies in Oceanography, 2016, 124: 64-73.
    [22] 蔡进功,包于进,杨守业,等. 泥质沉积物和泥岩中有机质的赋存形式与富集机制[J]. 中国科学:地球科学,2007,37(2):234-243.

    Cai Jingong, Bao Yujin, Yang Shouye, et al. Research on preservation and enrichment mechanisms of organic matter in muddy sediment and mudstone[J]. Science China Earth Sciences, 2007, 37(2): 234-243.
    [23] Hu L M, Shi X F, Bai Y Z, et al. Recent organic carbon sequestration in the shelf sediments of the Bohai Sea and Yellow Sea, China[J]. Journal of Marine Systems, 2016, 155: 50-58.
    [24] 陈诚,朱怡翔,石军辉,等. 断陷湖盆浅水三角洲的形成过程与发育模式:以苏丹Muglad盆地Fula凹陷Jake地区AG组为例[J]. 石油学报,2016,37(12):1508-1517.

    Chen Cheng, Zhu Yixiang, Shi Junhui, et al. The forming process and development pattern of shallow water delta in fault Depression lacustrian basin: A case study of AG Formation in the Jake area in Fula Sag, Muglad Basin, Sudan[J]. Acta Petrolei Sinica, 2016, 37(12): 1508-1517.
    [25] 魏康强,张元福,李媛,等. 利用水槽实验对不同流速下三角洲发育区别的探究[J]. 复杂油气藏,2017,10(3):6-11.

    Wei Kangqiang, Zhang Yuanfu, Li Yuan, et al. Study on difference of delta development under different flow velocities by flume experiment[J]. Complex Hydrocarbon Reservoirs, 2017, 10(3): 6-11.
    [26] 郭超,何青. 黏性泥沙絮凝研究综述与展望[J]. 泥沙研究,2021,46(2):66-73.

    Guo Chao, He Qing. Review of the research on cohesive sediment flocculation[J]. Journal of Sediment Research, 2021, 46(2): 66-73.
    [27] 李胜利,李顺利,付超. 长试管静置沉降实验结果对湖盆细粒沉积纹层成因的启示[J]. 古地理学报,2022,24(3):405-414.

    Li Shengli, Li Shunli, Fu Chao. Implication of the large-tube settling experiment results on genesis of fine-grained deposition lamination of lacustrine basin[J]. Journal of Palaeogeography (Chinese Edition), 2022, 24(3): 405-414.
    [28] 程乐峰,余涛,张孝顺,等. 机器学习在能源与电力系统领域的应用和展望[J]. 电力系统自动化,2019,43(1):15-31.

    Cheng Lefeng, Yu Tao, Zhang Xiaoshun, et al. Machine learning for energy and electric power systems: State of the art and prospects[J]. Automation of Electric Power Systems, 2019, 43(1): 15-31.
    [29] Niu X X, Suen C Y. A novel hybrid CNN–SVM classifier for recognizing handwritten digits[J]. Pattern Recognition, 2012, 45(4): 1318-1325.
    [30] 林景栋,吴欣怡,柴毅,等. 卷积神经网络结构优化综述[J]. 自动化学报,2020, 46(1): 24-37.

    Lin Jingdong, Wu Xinyi, Chai Yi, et al. Structure optimization of convolutional neural networks: A survey[J]. Acta Automatica Sinica, 2020, 46(1): 24-37.
    [31] 周永章,王俊,左仁广,等. 地质领域机器学习、深度学习及实现语言[J]. 岩石学报,2018,34(11):3173-3178.

    Zhou Yongzhang, Wang Jun, Zuo Renguang, et al. Machine learning, deep learning and Python language in field of geology[J]. Acta Petrologica Sinica, 2018, 34(11): 3173-3178.
    [32] 苏恺明,徐耀辉,徐旺林,等. 鄂尔多斯盆地延长组多油源贡献比例与分布规律:基于机器学习与可解释性研究[J]. 地学前缘,2024,31(3):530-540.

    SU Kaiming, XU Yaohui, XU Wanglin, et al. Contribution ratio and distribution of numerous oil sources in the Yanchang Formation of the Ordos Basin: Based on machine learning and interpretability studies[J]. earth science Froniters, 2024, 31(3): 530-540.
    [33] 匡立春,刘合,任义丽,等. 人工智能在石油勘探开发领域的应用现状与发展趋势[J]. 石油勘探与开发,2021,48(1):1-11.

    Kuang Lichun, Liu He, Ren Yili, et al. Application and development trend of artificial intelligence in petroleum exploration and development[J]. Petroleum Exploration and Development, 2021, 48(1): 1-11.
    [34] 李增学,张功成,王东东,等. 确定控制陆源分散有机质分布三角洲体系外缘坡度的方法:中国,108629130B[P]. 2019-09-24.

    Li Zengxue, Zhang Gongcheng, Wang Dongdong, et al. A method to control the slope of the outer edge of the terrigenous dispersed organic matter distribution delta system is determined: CN, 108629130B[P]. 2019-09-24.
    [35] 李增学,刘莹,李晓静,等. 琼东南盆地古近纪泥炭沼泽破坏与重建作用对煤型源岩物质形成的控制[J]. 石油与天然气地质,2022,43(6):1309-1320.

    Li Zengxue, Liu Ying, Li Xiaojing, et al. The control of Paleogene peat swamp destruction and reconstruction on the formation of coal-type source material in the Qiongdongnan Basin[J]. Oil & Gas Geology, 2022, 43(6): 1309-1320.
  • [1] 聂万才, 张廷山, 王铭伟, 吴玟, 谭秀成.  海陆过渡相煤系页岩孔隙分形特征及影响因素 . 沉积学报, 2024, 42(3): 1047-1057. doi: 10.14027/j.issn.1000-0550.2022.078
    [2] 刘海, 徐耀辉, 李阳, 黄凌松, 吕奇奇, 刘忠保.  海陆过渡相三角洲沉积体系陆源有机质沉积特征及其影响因素的模拟实验研究 . 沉积学报, 2024, 42(1): 251-265. doi: 10.14027/j.issn.1000-0550.2023.047
    [3] 屈童, 高岗, 徐新德, 黄志龙, 甘军, 梁刚, 游君君.  三角洲—浅海沉积体系陆源有机质沉积模拟实验研究 . 沉积学报, 2023, 41(2): 584-600. doi: 10.14027/j.issn.1000-0550.2021.085
    [4] 张宇航, 时保宏, 张曰静, 石好果, 文雯, 张杨.  机器学习方法在浅层滩坝相薄储层孔隙度预测中的应用 . 沉积学报, 2023, 41(5): 1559-1567. doi: 10.14027/j.issn.1000-0550.2022.100
    [5] 邢淑晓, 窦衍光, 赵京涛, 蔡峰, 李清, 邹亮, 王利波.  17. 3 ka以来冲绳海槽中南部有机质来源 . 沉积学报, 2022, 40(3): 691-700. doi: 10.14027/j.issn.1000-0550.2020.117
    [6] 彭思钟, 刘德勋, 张磊夫, 邱振, 王以城, 封从军, 孙萌思.  鄂尔多斯盆地东缘大宁—吉县地区山西组页岩岩相与沉积相特征 . 沉积学报, 2022, 40(1): 47-59. doi: 10.14027/j.issn.1000-0550.2021.058
    [7] 董大忠, 邱振, 张磊夫, 李树新, 张琴, 李星涛, 张素荣, 刘翰林, 王玉满.  海陆过渡相页岩气层系沉积研究进展与页岩气新发现 . 沉积学报, 2021, 39(1): 29-45. doi: 10.14027/j.issn.1000-0550.2021.002
    [8] 屈童, 高岗, 徐新德, 刘凤妍.  三角洲—浅海沉积体系陆源有机质分布控制因素 . 沉积学报, 2020, 38(3): 648-660. doi: 10.14027/j.issn.1000-0550.2019.057
    [9] 朱筱敏, 葛家旺, 赵宏超, 袁立忠, 刘军.  陆架边缘三角洲研究进展及实例分析 . 沉积学报, 2017, 35(5): 945-957. doi: 10.14027/j.cnki.cjxb.2017.05.007
    [10] 赵林, 贾蓉芬, 刘德汉, 秦建中, 张文龙.  古生界海陆过渡相黑色泥质岩系显微组分特征及生气潜力评价 . 沉积学报, 1995, 13(2): 105-111.
  • 实验条件.xlsx
  • 加载中
图(11) / 表 (4)
计量
  • 文章访问数:  211
  • HTML全文浏览量:  42
  • PDF下载量:  40
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-02-27
  • 修回日期:  2024-04-18
  • 录用日期:  2024-06-18
  • 网络出版日期:  2024-06-18
  • 刊出日期:  2025-08-10

目录

    基于机器学习的海陆过渡环境中陆源有机质分布预测模型——从沉积模拟实验到地质应用

    doi: 10.14027/j.issn.1000-0550.2024.056
      基金项目:

      湖北省自然科学基金 2024AFB243

      作者简介:

      邵俊哲,男,2001年出生,硕士研究生,烃源岩评价与油气成藏机理,E-mail: shao413958@163.com

      通讯作者: 李阳,男,副教授,烃源岩沉积机制与分布规律,E-mail: lyugly@163.com

    摘要: 目的 陆源海相烃源岩是我国多个近海盆地的主力烃源岩,其差异性展布特征制约着烃源岩的分布预测精度和油气勘探成效。而陆源有机质的搬运沉积过程决定着陆源海相烃源岩质量和分布。 方法 运用水槽沉积模拟结合三维激光扫描技术,从“正演”的角度动态记录并定量表征不同水体盐度条件下陆源分散有机质的搬运过程并运用机器学习算法建立总有机碳(Total Organic Carbon,TOC)预测模型。 结果 海陆过渡环境中的陆源有机质主要富集在三角洲前缘和前三角洲沉积相带内,随着搬运距离的增大,海陆过渡环境中的陆源有机质丰度呈现先增大后减小的趋势。在盐絮凝作用影响下,咸水环境中陆源有机质搬运距离更靠近物源区,沉积厚度更大。基于三种深度学习算法建立了实验条件下的TOC预测模型,最终优选出基于随机森林算法的预测模型为最优模型。 结论 将实验条件下的TOC预测模型与地质条件相结合,完成了崖南凹陷崖城组三角洲内烃源岩的TOC预测。结果显示,崖南凹陷陆源有机质搬运距离可达50 km,在距离物源区31 km左右处有机质富集程度最高。

    English Abstract

    邵俊哲, 李阳, 汪勇, 吴楠, 魏薇, 刘海. 基于机器学习的海陆过渡环境中陆源有机质分布预测模型——从沉积模拟实验到地质应用[J]. 沉积学报, 2025, 43(4): 1398-1411. doi: 10.14027/j.issn.1000-0550.2024.056
    引用本文: 邵俊哲, 李阳, 汪勇, 吴楠, 魏薇, 刘海. 基于机器学习的海陆过渡环境中陆源有机质分布预测模型——从沉积模拟实验到地质应用[J]. 沉积学报, 2025, 43(4): 1398-1411. doi: 10.14027/j.issn.1000-0550.2024.056
    SHAO JunZhe, LI Yang, WANG Yong, WU Nan, WEI Wei, LIU Hai. Machine Learning-Based Model for Predicting the Distribution of Terrestrial Organic Matter in a Marine-Terrestrial Transitional Environment: From sedimentary simulation experiments to geological applications[J]. Acta Sedimentologica Sinica, 2025, 43(4): 1398-1411. doi: 10.14027/j.issn.1000-0550.2024.056
    Citation: SHAO JunZhe, LI Yang, WANG Yong, WU Nan, WEI Wei, LIU Hai. Machine Learning-Based Model for Predicting the Distribution of Terrestrial Organic Matter in a Marine-Terrestrial Transitional Environment: From sedimentary simulation experiments to geological applications[J]. Acta Sedimentologica Sinica, 2025, 43(4): 1398-1411. doi: 10.14027/j.issn.1000-0550.2024.056
      • 海陆过渡相是发育于滨海地区的海陆过渡或海陆混合沉积环境中的沉积相,具体包括三角洲相、潟湖相、障壁岛相、潮坪相、河口湾相等。海陆过渡环境中发育海相烃源岩、煤系烃源岩和陆源海相烃源岩。在三角洲—浅海沉积体系中,主要发育煤系烃源岩和陆源海相烃源岩两种类型,具体的岩性以煤、泥岩、页岩为主[1]。近年来的勘探实践表明,陆源海相烃源岩是近海海域含油气盆地的主力烃源岩,尤其是大气田发育的重要条件[23]。全球的河流—三角洲—海湾体系与富含油气盆地的分布密切相关,与三角洲相关的烃源岩和储层一直是学者们研究的重点[47]

        无论是煤系烃源岩还是陆源海相烃源岩,其有机质均主要为源于湖泊水生生物和高等植物的陆源有机质[89],陆源有机质的搬运特征和聚集规律决定了海陆过渡相烃源岩的空间展布。邓运华等[1]研究南海周边三角洲的分布与烃源岩发育的关系指出三角洲控制了南海盆地海陆过渡相烃源岩的形成与分布,也影响着不同盆地的含油气类型和资源潜力。但海陆过渡相烃源岩陆源有机质的搬运沉积过程尚不明确,制约着海洋油气勘探成效。

        鉴于海洋油气勘探“高风险、高科技、高投入”的三高特点[10],要想取得海洋油气资源的更大突破,迫切需要明晰海域烃源岩形成机理和展布规律,建立高精度烃源岩分布预测模型。本论文通过开展沉积物理模拟实验,采取“正演”的手段模拟沉积物的搬运沉积过程。完成对沉积物理模拟实验的动态记录和定量表征是获取可靠结论的前提。应用三维激光扫描仪可在几分钟内创建环境或物件精确全面的三维图像,同时可获取实验过程中全方位点云数据。结合高清录像设备和MATLAB程序可实现沉积物理模拟实验的全程动态记录和精准定量表征,以期从陆源有机质搬运沉积角度探究海陆过渡相烃源岩发育机制。结合岩心实测数据和地震测井资料,通过支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)和人工神经网络(Artificial Neural Network,ANN)三种机器学习算法可建立整个沉积体系范围内的烃源岩分布预测模型,可提高海域内优质烃源岩识别和预测精度,对降低海洋油气勘探风险和投入具有重要指导意义。

      • 涉及的沉积模拟实验均在长江大学沉积模拟实验室进行,主体实验装置为一个长8.0 m宽6.0 m的水槽,并将该水槽沿长轴方向均分为两个对比实验小水槽,除去分隔墙面厚度,每个水槽规格为长8.0 m,宽2.6 m(图1)。

        图  1  沉积模拟实验主体装置示意图

        Figure 1.  Schematic diagram of the main device for the sedimentary simulation experiment

        单物源条件下,物源口设置在水槽宽轴方向的中心位置,导流槽采用不锈钢材质,长度为0.5 m;自动加砂器与导流槽相连,通过档位调节将来自储砂槽的物源定量且匀速地加入导流槽;水槽底部铺设一层PVC材质的方格滤水筛,可加快沉积模拟实验结束后的排水晾干进程;滤水筛上部铺设一层海绵吸水布,其作用是保证切片平整和加速排水;水槽边缘墙体上用油漆标注长度和深度便于读取岸线位置、三角洲长度及水深等数据;在7.0~8.0 m处通过活动底板下沉建立一个蓄水池,亦可模拟深海区;蓄水和水位的调整通过功率600 W,13 m扬程的蓄水泵实现;物源处水流供给和水动力控制通过功率38 W,3 m扬程的循环泵实现;水槽顶部吊装4K高清录像机以记录沉积模拟过程;3D激光扫描仪定期进行微地形扫描以获取沉积体厚度变化数据。造浪器为CX-W3型造浪泵,其磁吸于深水区,可根据需要调整波浪形式和强度,与物源供给方向正交造浪。

      • 珠江口盆地白云凹陷恩平组海陆过渡相烃源岩母质来源主要为陆源有机质,孢粉相分析显示其陆源有机质主要在搬运和分选作用影响下分布于三角洲—浅海沉积体系[1112]。因此,白云凹陷恩平组三角洲的地质条件是进行陆源有机质沉积模拟的原型地质模型和可靠参考依据。

        通过开展白云凹陷典型钻井岩心观察工作,通过岩心观察与刻画获取了白云凹陷恩平组岩性、岩石相、粒度特征等实际地质资料[1315]。结果表明,白云凹陷储层砂体以中细砂为主,南部地区发育部分中—粗砂岩[15],烃源岩以灰色—黑色泥岩为主,据此特征设计沉积模拟实验的加砂组成。考虑到在物源供给适中条件下,水动力越强其搬运粗粒能力越大,同时参考前人沉积模拟实验加砂组成特征[16],配置不同水动力强度下加砂组成(表1)。

        表 1  沉积模拟实验沉积期次和加砂组成数据表

        Table 1.  Sedimentary periods of the sedimentary simulation experiment and composition data values

        来水特征加砂组成/%
        第一沉积期第二沉积期第三沉积期
        粗砂中细砂粉砂粗砂中细砂粉砂粗砂中细砂粉砂
        洪水期254027825402783337237
        中水期20422810204228103035305
        枯水期104632121046321225343011

        调研白云凹陷恩平组层序地层特征发现恩平组可划分为3个三级层序(SQ1、SQ2和SQ3),SQ1和SQ2沉积时期主要以湖相三角洲沉积为主,SQ3沉积期主要为半封闭的局限海沉积环境,在海侵影响下水体盐度升高且波浪对陆源有机质的搬运沉积产生影响[1314]。因此,基于白云凹陷恩平组层序地层划分结果和沉积环境特征,将部分沉积模拟实验的沉积期次设定为3期。第一沉积期为水退条件下的三角洲进积,不加有机质,沉积结束进行激光扫描;第二沉积期为一个完整的沉积旋回,第一沉积期结束后,缓慢水进进行三角洲退积,岸线恢复至第一沉积期初始位置时,铺红色彩砂建立分隔层;第二沉积期时期定期定量加入相同有机质,实验半程和结束进行两次激光扫描以明确水体盐度对有机质的影响,沉积结束后在沉积体表面铺撒橘色彩砂建立分隔层;第三沉积期同样为一个完整的旋回,但第三沉积期咸水水槽全程造浪,先模拟波浪影响下的水进退积过程,再模拟波浪影响下的水退快速进积过程。第三沉积期两个水槽均定期定量加入有机质,实验半程和结束进行两次激光扫描以明确波浪在淡水咸水条件下对有机质分布的影响。三维激光扫描仪对于部分没有砂体沉积的三角洲前缘、前三角洲、浅海陆棚以及大陆坡区域中的陆源有机质分布特征和聚集规律的表征效果良好。无砂体沉积部位的沉积物几乎全部是泥质和陆源有机质,这些部位的三维激光扫描仪的扫描结果完全反映了陆源有机质和泥质的分布特征,其差异性分布在平面上和剖面上均可做到精准定量表征。淡咸水条件下沉积模拟的具体实验条件参数如表2所示。

        表 2  淡/咸水沉积模拟实验条件数据表

        Table 2.  Freshwater/saline data for sedimentary simulation experiment conditions

        水体盐度/‰实验期次来水过程历时/min流量/(L/s)有机质添加速率/(L/h)
        0.7(淡水)第一沉积期枯水6000.051.2
        第二沉积期中水—洪水—中水—枯水1 0000.1~0.15~0.1~0.052.4~3.6~2.4~1.2
        第三沉积期中水—洪水—中水—枯水1 0000.1~0.35~0.1~0.052.4~8.4~2.4~1.2
        54(咸水)第一沉积期枯水6000.061.2
        第二沉积期中水—洪水—中水—枯水1 0000.1~0.15~0.1~0.052.4~3.6~2.4~1.2
        第三沉积期中水—洪水—中水—枯水1 0000.1~0.35~0.1~0.052.4~8.4~2.4~1.2

        根据模拟区地质条件,底型设计出河口区、三角洲沉积区、浅海陆架区、大陆坡、深海区5个主要沉积区域,模拟比例为1∶10 000。河口区设计坡度为3°,三角洲沉积区范围为0.5~3.0 m,坡度由河口区逐渐过渡为1°。陆架区范围为3.0~6.0 m,坡度为3°,大陆坡范围为6.0~7.0 m,坡度12°。上述底型如图2所示。

        图  2  沉积模拟实验底型3D示意图

        Figure 2.  Three dimensional model of the bottom shape for the sedimentary simulation experiment

        沉积模拟实验完成后,首先进行排水晾干工作,待排水完成后对沉积体进行横、纵剖面的切片、取样和拍照工作。在三角洲沉积区以0.3 m为间距在宽轴方向上切取至多8条横剖面,以0.6 m为间距切取3条纵剖面(图3a)。切片过程中,用高清单反相机拍摄剖面照片,记录不同部位的陆源有机质的沉积模式。制作厚2 mm,高15 cm,分度值为0.5 mm的透明玻璃取样管进行取样(图3b),应用此取样管既能记录剖面沉积特征,又能读取有机质沉积厚度。浅海陆架区沉积的全部为泥质和有机质,以0.2 m为间距在宽轴方向上切取横剖面,以0.6 m为间距切取3条纵剖面,此部位主要读取有机质厚度和取样测试。实验过程中,详细测量并记录不同沉积期的底型坡度、加砂组成、加砂速率、水流流量、沉积时间、有机质加入速率、岸线位置以及三角洲长度和宽度等数据。

        图  3  三角洲沉积区切片方案(a)与取样管(b)

        Figure 3.  Slicing scheme (a) and sampling tube (b) for the delta sedimentary area

      • 笔者团队已通过沉积模拟实验研究了不同沉积相带陆源有机质的分布模式,发现在三角洲平原内陆源有机质以互层型、透镜型、断续型分布;在三角洲前缘—前三角洲,则以厚度较大的条带型分布为主;坡度在三角洲演化的早期对陆源有机质分布影响较大,坡度越小,搬运距离越大;波浪影响下,在三角洲前缘陆源有机质向前搬运受阻,可在三角洲平原发育局部富集区[17]。本文主要探讨水体盐度对陆源有机质搬运沉积的影响。实验记录显示,在相同的水动力和坡度条件下,淡水水体中有机质搬运距离较咸水水体更远,扩散速度更快(图4)。

        图  4  淡咸水条件下有机质搬运情况对比

        Figure 4.  Comparison of organic matter transport under fresh/saline water conditions

        从沉积体中央纵剖面上来看,有机质在不同沉积部位呈以下四种分布模式:①断续型,颜色较浅,呈断续状分布,厚度平均值为2 mm,TOC含量比较低,是有机质在水动力较弱时,在低地势部位沉积形成,主要分布在三角洲平原;②透镜型,颜色浅,形状呈现不对称透镜状,由河道摆动和切割作用导致,分布不规律,主要集中在三角洲平原漫溢部位;③互层型,数量多,间距小,近似平行分布,有间断,厚度薄,颜色浅,集中分布在三角洲平原部位;④条带型,数量较少,间距大,常见斜交条带,厚度大,颜色深,TOC含量高,主要分布在三角洲前缘,陆源有机质搬运到三角洲前缘与湖水交互,水动力迅速下降,在前缘部位快速沉积,呈现条带状分布。在同一沉积期的三角洲沉积相带内,随着搬运距离的增加,有机质的沉积模式呈现由“断续型”向“互层型”再向“条带型”转变的趋势(图5)。上述分布模式与陡/缓坡实验条件下的沉积模拟实验具有相似特征[17]

        图  5  淡水条件下三角洲纵剖面刻画图

        Figure 5.  Vertical profile characterization of the delta under freshwater conditions

      • 尽管大量研究已经证明中国近海盆地诸多凹陷内的油气主要来源于陆源海相烃源岩[1,3,5,9,11],但因盆地地质条件复杂多样,陆源有机质搬运路径和沉积特征不明确,含油气盆地中陆源海相烃源岩的发育机制和分布规律一直未能形成统一认识,导致近年来我国近海盆地未能实现油气勘探的重大突破。从古生产力和保存条件方面探讨有机质富集机制的同时,应重视烃源岩主要母质来源的物理搬运和沉积过程对烃源岩分布的影响。存在陆源有机质的搬运和沉积是海陆过渡相烃源岩发育的必要前提。因此,研究陆源有机质的搬运沉积过程,明确陆源有机质的机械沉积分异作用和沉积分布模式是实现海陆过渡相烃源岩分布预测的必要步骤。

        陆源有机质机械沉积分异作用受到沉积物粒度、沉积速率、水动力条件、物源供给、水体盐度等诸多因素的控制[1826]。目前,已有相关研究对地形坡度、水动力强度、波浪、物源粒度等搬运条件对陆源有机质分布的影响做了系统研究[9,17],但水体盐度对陆源有机质搬运沉积的影响尚未有讨论。我国近海盆地往往受到海侵的影响,海侵作用会导致水体盐度发生变化进而影响陆源有机质的絮凝沉降速率和搬运距离,这将一定程度上影响陆源海相烃源岩的分布。因此,开展了不同水体盐度条件下的陆源分散有机质沉积模拟实验,探讨水体盐度对陆源有机质搬运沉积过程的影响。

        基于三维激光扫描获取的数据,对第二沉积期的水进和水退两个过程的有机质沉积区的沉积增量进行三维定量表征。结果显示,淡水条件下,有机质展布范围大,沉积厚度薄;咸水条件下,有机质展布范围小,沉积厚度大(图6)。

        图  6  淡咸水条件下有机质沉积厚度分布

        Figure 6.  Distribution of organic matter thickness under fresh/saline water conditions

        从TOC的平面展布来看,在三角洲规模相同,坡度和水动力条件一致的情况下咸水三角洲的有机质主要富集区距离物源更近(图7)。综上所述,在水深较浅,水动力较弱的情况下,随着盐度的增加,有机质搬运距离变小。推测在咸水条件下,黏土矿物和有机质吸附的大量阴离子与水中的阳离子结合,形成颗粒的物理絮凝也可称之为电凝或盐絮凝,使沉积物形成团块并克服浮力而快速沉降[2728]

        图  7  淡咸水条件下TOC平面分布

        Figure 7.  Plane distribution of total organic carbon (TOC) under fresh/saline water conditions

      • 前人及此次研究表明,陆源有机质的富集程度和搬运距离并非线性关系,常用的基于统计学分析的线性回归预测存在一定的局限性。机器学习在非线性相关数据处理和数据规律总结方面具有显著的优势,应用机器学习建立的预测模型通常具有较高的精度[2833]。基于沉积模拟实验和机器学习算法建立的陆源有机质分布预测模型将为海洋油气勘探中的有利区带优选和资源评价工作提供重要依据。

        结合实验过程中的地形坡度、水动力条件、沉积物粒度、水体盐度等多种地质因素的准确定量表征[17],通过机器学习算法可建立整个沉积体系范围内的烃源岩分布预测模型。实现从点到线,从线到面,从面到体的空间范围内的烃源岩分布预测,其在油气资源评价和指导油气资源勘探领域具有广阔的应用空间。

        选用沉积模拟实验中实测TOC作为标签变量,结合取样时对样品信息和实时实验条件的准确记录,采用支持向量机(SVM)、随机森林(RF)和人工神经网络(ANN)三种机器学习算法进行TOC预测模型的建立,具体的模型建立流程如图8所示。

        图  8  有机质分布预测模型建立流程图

        Figure 8.  Process for establishing a prediction model for TOC distribution

        本模型选取搬运距离、沉积相带、水动力条件(水流流量和造浪与否)、坡度、三角洲规模、物源粒度(以不同粒级颗粒占比表征)、水体盐度、水位变化率、有机质供给速率9个参数进行训练。选取所有数据中的75%进行训练,剩余的25%进行测试。通过不断调参,选取每种算法中精度最高的模型作为该算法的最优模型。

        每种算法的输入特征可选择离散特征编码与基于经验赋值的数据,标准化和不标准化的数据以及去异常值和不去异常值的数据进行训练。离散特征编码的数据处理工作主要用于区分样品所属沉积相带的划分。由于不同的沉积相带中陆源有机质富集程度差异较大,在进行预测模型建立时,要对不同的沉积相带进行编码以适用于软件平台。本文采取独热编码(one-hot)的方式完成沉积相带的划分。对每一个样品而言,只对其所在沉积相带赋值为1,其余沉积相属性均赋值为0。这样所有样品的沉积相将通过0和1表示。这种方法避免了人为经验赋值的主观性误差,可有效对沉积相带参数进行区分。基于经验的赋值是基于传统地质理论,采用专家赋值的方法给不同的沉积相带赋值,值的高低以其可能的有机质富集程度表征,最大值为4,最小值为1。如前三角洲通常粒度较细,有机质相对富集,可以基于经验赋值为4,而三角洲平原则以储层为主,烃源岩不发育,有机质富集程度不高,基于经验赋值为1。

        数据的无量纲处理即将不同类型参数进行归一化处理,这样可有效避免不同类型参数数量级差异较大带来的不便。在参数数值归一化处理时会出现以下两种情况。

        第一种情况是参数值与TOC存在正相关关系,此时在数据归一化时应选用以下公式:

        Y(i,j)=Xi,j-minXi,jmaxXi,j-minXi,j(i=0,1,2,m;j=1,2,n) (1)

        第二种情况是参数值与TOC存在负相关关系,此时在数据归一化时应选用以下公式:

        Y(i,j)=maxXi,j-Xi,jmaxXi,j-minXi,j(i=0,1,2,m;j=1,2,n) (2)

        上述两式中:Yij)是对应的归一化数值;Xij)是样本的参数值;maxXij)是样本参数的最大值;minXij)是样本参数的最小值。

        异常值检验和剔除是为了避免样品分析测试误差较大对模型精度的影响,在模型训练前先将异常值筛选出来并剔除。拟选用箱型图检验离群值的方法完成异常值处理。将样品数据进行统计分析绘制数据箱型图,通过四分位检测可快速识别异常值。

        支持向量机算法的参数调整范围设置为①C调整,gamma默认;②gamma调整,C默认;③C,gamma调整三种。人工神经网络参数调整范围设置为①alpha调整,hiden_layer默认;②hiden_layer调整,alpha默认;③alpha,hiden_layer调整三种。随机森林算法参数调整范围设置为①max_depth调整,minsamplesleaf默认;②minsamplesleaf调整,max_depth默认;③max_depth, minsamplesleaf调整三种。这样,每种算法的输入特征有18种方式,从中优选精度最高的模型即可。选用10折交叉验证的方法(k fold cross validation),将训练集分成不相交的10个子集,每次从分好的子集里面,选择9个作为训练集,剩下的1个作为验证集。每次把训练好的模型放在验证集上,得到准确率,计算10次求得平均值,作为该模型的最终精度。预测精度的评价指标为RMS和R2。其计算公式为:

        RMS=1mi=1m(yi-y^i)2 (3)
        R2=1-i=1m(yi-y^i)2i=1m(yi-y¯i)2 (4)
      • 从525个样品数据中选取420个样品数据进行训练,105个数据进行训练测试。每种算法设置了16种变量组合形式,设置3种调参模式,共计144个模型,其中每种算法48种模型,从每种算法中选取精度最高的一种模型。最终,SVM算法的最优模型精度为72.83%,ANN算法的最优模型精度为74.67%,随机森林算法的最优模型精度为78.22%。每种算法的最优模型的输入特征见表3

        表 3  三种算法最优模型参数和输入特征

        Table 3.  Optimal model parameters and input features of the three algorithms

        模型名称模型参数模型精度/%输入特征
        随机森林(RF)max_depth=11n_estimators':50078.22去异常值+基于经验的相带参数
        人工神经网络(ANN)alpha:[1],'solver':['lbfgs'],'max_iter':[10000]74.67相带独热编码+标准化
        支持向量机(SVM)C': [10]'max_iter':[10000]72.83相带独热编码+标准化
        注:max_depth为决策树最大深度;n_estimators为随机森林算法中森林中的树木的数量;alpha为正则化参数,alpha它的目的是防止过拟合;solver为优化器,用来调整群众参数:max_iter为迭代次数,C为惩罚系数。

        最优模型为基于随机森林算法的以去异常值和基于经验的相带赋值为输入特征的预测模型,其预测精度为78.22%,同时确定,对有机质富集程度影响较大的因素为沉积相带、有机质供给速率和搬运距离(图9)。

        图  9  不同参数对TOC分布的影响程度

        Figure 9.  Impact of different parameters on TOC distribution

      • 基于实验条件下的TOC预测模型建立后并验证预测精度良好,选取实验条件下的不同算法的最优模型输入特征开展了地质条件下的TOC预测模型的建立与应用工作。由于地质条件下的预测模型建立需要足够的实测数据作为训练集,白云凹陷恩平组目前难以收集到足够的训练数据,因此选定与白云凹陷三角洲沉积环境相近,同样以陆源海相烃源岩为主的琼东南盆地崖南凹陷崖城组三段烃源岩为预测层位。

        以崖南凹陷崖城组沉积相平面展布图为底图,以A井为原点,向东和向南设定为X轴和Y轴,基于比例尺确定每口井在研究区的相对位置坐标。然后根据收集到的12口钻井分析测试数据、井位所在区域古地形坡度和单井沉积相确定TOC预测模型建立所需的沉积相、岩性、岩石颜色、TOC、深度和地形坡度等参数。由于崖南凹陷同层位中不同颜色(如灰色和黑色)烃源岩实测TOC差异较大,模型训练时将岩石颜色作为一个输入参数可有效避免不同颜色烃源岩预测结果的混淆,也可提高预测精度。最终选定搬运距离(位置X和位置Y)、沉积相带、岩性、岩石颜色、坡度、TOC。TOC为标签变量,通过支持向量机(SVM)、随机森林(RF)和人工神经网络(ANN)三种算法进行机器学习,并确定精度最高的预测模型。最优模型确定后,选取部分数据对三种算法进行了模型精度验证,验证结果如表4所示。

        表 4  预测模型验证数据表

        Table 4.  Data for prediction model validation

        井号深度/mX坐标Y坐标岩性岩石颜色坡度沉积相实测TOC/%TOC_RF/%误差准确度/%TOC_SVM/%误差/%准确度/%TOC_ANN/%误差准确度/%
        B3 718.562.148.82粉砂质泥岩灰色1.74分流河道0.340.370.025 392.560.440.1070.530.400.063 581.32
        B3 733.002.148.82粉砂质泥岩灰色1.74泛滥平原0.650.690.043 493.320.660.0198.661.380.725 3-11.58
        C3 924.504.579.12泥岩灰色1.74分流河道0.430.180.254 740.770.340.0980.050.400.026 593.84
        C3 930.004.579.12煤层黑色1.74泛滥平原30.9738.217.241 376.6231.860.8997.1233.302.334 792.46
        C4 034.504.579.12碳质泥岩黑色1.74泛滥平原19.0613.795.270 572.3511.877.1962.288.0011.055 242.00
        C4 049.504.579.12碳质泥岩黑色1.74分流间湾5.015.630.615 187.726.031.0279.646.971.955 360.97
        C4 067.564.579.12煤层黑色1.74分流间湾43.5054.4210.919 074.9043.400.1099.7763.4819.975 454.08
        C4 070.504.579.12泥岩黑色1.74分流间湾2.062.810.748 863.653.961.907.964.732.665 5-29.39
        C4 070.604.579.12碳质泥岩黑色1.74分流间湾6.395.830.563 891.186.140.2596.157.020.631 390.12
        C4 137.504.579.12泥岩灰色1.74泛滥平原1.961.520.441 377.481.860.1094.882.510.545 872.15
        D3 820.977.8612.50泥岩灰色1.50分流间湾0.830.990.156 681.131.100.2767.520.580.252 969.53
        D3 821.307.8612.50煤层黑色1.50分流间湾52.1067.1915.092 071.0343.868.2484.1963.7311.629 277.68
        D3 822.207.8612.50碳质泥岩黑色1.50分流间湾6.686.140.545 091.846.780.1098.507.260.583 191.27
        D3 830.127.8612.50泥岩灰色1.50分流河道0.180.240.060 666.330.280.1044.000.400.223 5-24.17
        D3 946.867.8612.50泥岩灰色1.50泛滥平原0.741.010.269 563.580.930.1974.281.991.249 9-68.91
        E4 126.006.869.26碳质泥岩黑色1.70分流间湾6.546.360.180 297.246.640.1098.479.843.304 349.48
        E4 126.996.869.26泥岩灰色1.70分流间湾1.621.370.245 484.851.470.1590.941.590.031 698.05
        E4 127.006.869.26泥岩黑色1.70分流间湾4.234.520.286 193.244.370.1496.695.721.489 864.78
        F3 970.029.0013.24煤层黑色1.40分流间湾45.2156.0110.797 076.1246.911.7096.2365.5720.361 154.96
        F3 997.454.579.12煤层黑色1.74泛滥平原28.1638.2710.105 064.1132.524.3684.5133.685.520 080.40
        F3 807.609.0013.24泥岩灰色1.40分流间湾0.791.000.206 673.851.290.5036.540.630.164 079.24

        结果显示,ANN算法的预测准确度(预测值和实测值之差与实测值的比值)范围为-68.91%~98.05%,平均预测准确度为53.00%,准确度大于70%占比为47.62%,准确度大于90%占比为23.81%,异常值占比为19.05%;SVM算法的预测准确度介于7.96%~99.77%,平均预测准确度为79.00%,准确度大于70%占比为76.19%,准确度大于90%占比为47.62%,异常值占比为5.00%;RF算法的预测准确度介于40.77%~97.24%,平均预测准确度为78.00%,准确度大于70%占比76.19%,准确度大于90%占比为28.57%,异常值占比为0。综合分析,最优算法为随机森林算法。

        应用地震资料可换算出该层位古地形坡度[3435],确定预测区坐标位置,便可通过上述预测模型预测海域内少井/无井区某一位置不同沉积相带内烃源岩的TOC(图10a)。本文以崖南凹陷崖城组三段烃源岩为例,首先完成单条剖面的TOC预测,然后在研究区网格选取多条地震剖面开展TOC预测,最终完成了崖南凹陷崖城组烃源岩TOC平面预测(图10b)。

        图  10  崖南凹陷主三角洲泥岩TOC分布预测及平面展布特征

        Figure 10.  Prediction of TOC distribution and planar distribution characteristics of mudstone in the main delta of the Yanan depression

        从主三角洲平面展布图中拉取一条剖面(图10b),观察沿着搬运方向上其TOC的分布特征发现,三角洲前缘和前三角洲为分散有机质主要富集区,分散有机质沿着物源方向的搬运距离可达50 km,在距离物源区31 km左右处有机质富集程度最高(图11)。

        图  11  崖南凹陷主三角洲泥岩TOC与陆源有机质搬运距离的关系

        Figure 11.  The relationship between TOC of mudstone in the main delta of Yanan Depression and the distance of terrestrial organic matter transport

      • (1) 咸水条件下盐絮凝作用加速有机质沉降,使其更靠近物源区且沉积厚度大,淡水条件下有机质分布范围广但厚度薄。陆源有机质在剖面上存在四种分布模式,其中断续型、互层型、透镜型主要分布于三角洲平原,而条带型有机质主要分布于三角洲前缘和前三角洲。同一沉积期内,随搬运距离增加,有机质的沉积模式呈现由“断续型”向“互层型”再向“条带型”转变的趋势。

        (2) 预测模型显示,对有机质富集程度影响较大的因素为沉积相带、有机质供给速率和搬运距离。陆源有机质主要富集在三角洲前缘和前三角洲沉积相带内。富含陆源有机质的物源供给速率越大,烃源岩中有机质丰度越高。三角洲—浅海沉积体系中,随着搬运距离的增大,陆源有机质丰度呈现先增大后减小的趋势。

        (3) 基于三种深度学习算法建立TOC预测模型,优选出基于随机森林算法的预测模型具有最高的预测准确度和稳定性。同时,基于最优模型的输入特征,对琼东南盆地崖南凹陷崖城组烃源岩TOC平面分布进行预测。结果显示,崖南凹陷崖三段沉积期陆源有机质搬运距离可达50 km,在距离物源区约31 km处有机质富集程度最高。

    参考文献 (35)
    补充材料:
    实验条件.xlsx

    目录

      /

      返回文章
      返回