123,123,123

基于SAE特征优选和Bagging集成学习的油藏初期产能预测

电子技术应用

徐振1，张望1，李兴亮1，龙军2

1.中国石油吐哈油田分公司；2.深圳鹏锐信息技术股份有限公司

摘要： 油藏初期产能受地质、工程和开发等多种因素影响，是一种复杂的非线性变化时间序列，传统采用单一模型进行预测的方法预测精度较低，数据适应能力较弱。提出一种基于稀疏自编码器（Sparse Auto-Encoder， SAE）和集成学习的油藏初期产能预测模型。首先利用SAE对影响初期产量的多种因素进行分析，自动提取含油饱和度、射孔段有效厚度、压裂加砂量、加砂强度和能量保持状态5维特征作为主控因素，然后分别采用线性回归（Linear Regression， LR）、支持向量回归（Support Vector Regression， SVR）和长短时记忆神经网络（Long Short-Term Memory， LSTM）3种方法建立预测模型进行初产预测，最后利用Bagging集成学习对3种方法的预测结果进行综合集成，从而获得最终的油藏初期产能预测结果。采用某特低渗油田实际数据开展验证试验，结果表明相对于单一LR、SVR和LSTM方法，所提方法的预测精度更高，数据适应能更强，具有较高的应用前景。

關(guān)鍵詞： 稀疏自编码器特征选择集成学习产能预测支持向量回归

中圖分類號：TP18；TE341 文獻標志碼：A DOI: 10.16157/j.issn.0258-7998.256701
中文引用格式： 徐振，張望，李興亮，等. 基于SAE特征優(yōu)選和Bagging集成學習的油藏初期產(chǎn)能預測[J]. 電子技術(shù)應用，2026，52(3)：84-90.
英文引用格式： Xu Zhen，Zhang Wang，Li Xingliang，et al. Prediction of initial reservoir productivity based on SAE feature optimization and Bagging ensemble learning[J]. Application of Electronic Technique，2026，52(3)：84-90.

Prediction of initial reservoir productivity based on SAE feature optimization and Bagging ensemble learning

Xu Zhen1，Zhang Wang1，Li Xingliang1，Long Jun2

1.Petrochina Tuha Oilfield Branch；2.Shenzhen Pengrui Information Technology Co.， Ltd.

Abstract： The initial productivity of oil reservoir is affected by many factors such as geology, engineering and development, which is a complex nonlinear time series. The traditional prediction method using a single model has low prediction accuracy and weak data adaptability. A prediction model of initial reservoir productivity based on sparse auto encoder (SAE) and ensemble learning is proposed. Firstly, SAE is used to analyze various factors affecting the initial production, and the five-dimensional characteristics of oil saturation, effective thickness of perforated interval, fracturing sand addition, sand addition intensity and energy retention state are automatically extracted as the main control factors. Then, the prediction models are established by using linear regression (LR), support vector regression (SVR) and long short-term memory neural network (LSTM) to predict the initial production. Finally, Bagging ensemble learning is used to comprehensively integrate the prediction results of the three methods, so as to obtain the final prediction results of the initial production of the reservoir. Using the actual data of an ultra-low permeability oilfield to carry out the verification test, the results show that compared with the single LR, SVR and LSTM methods, the proposed method has higher prediction accuracy, stronger data adaptability and higher application prospect.

Key words : sparse autoencoder；feature selection；integrated learning；productivity prediction；support vector regression

引言

油藏是我國的戰(zhàn)略資源，在國家經(jīng)濟發(fā)展中起著舉足輕重的作用。油藏初期產(chǎn)能的準確預測對于企業(yè)投資決策、合理開采方案制訂以及生產(chǎn)環(huán)節(jié)優(yōu)化等具有重要意義[1]。自六十年代以來，我國油藏初期產(chǎn)能預測經(jīng)歷了數(shù)值模擬法、機器學習法和深度學習法3個階段[2]。數(shù)值模擬法通過對與油藏初期產(chǎn)量相關(guān)的參數(shù)進行分解，進而建立一系列模型對參數(shù)相互之間的關(guān)系進行描述，最終獲得油藏初期產(chǎn)量的解析表達式，具有原理清晰、可解釋性強和計算簡單等優(yōu)勢[3]，但由于儲層非均質(zhì)性、生產(chǎn)以及工程等非線性因素難以采用準確的數(shù)學模型進行描述，導致數(shù)值模擬法的預測精度有限[4]。近年來，隨著我國油氣田數(shù)字化、信息化程度的提升，油氣田產(chǎn)業(yè)積累了大量的地質(zhì)數(shù)據(jù)、生產(chǎn)數(shù)據(jù)和工程數(shù)據(jù)等，數(shù)據(jù)驅(qū)動的機器學習類方法得到了科研人員的廣泛關(guān)注。機器學習法以線性回歸(Linear Regression, LR)、支持向量回歸(Support Vector Regression, SVR)和人工神經(jīng)網(wǎng)絡等方法為代表[5]，能夠從歷史數(shù)據(jù)中自動挖掘出與油藏產(chǎn)量有關(guān)參數(shù)之間隱藏的規(guī)律性信息和變化趨勢信息，從而在降低建模難度的同時提升對非線性數(shù)據(jù)的適應性[6]。文獻[7]利用自回歸移動平均模型(ARMA)對水驅(qū)油藏井組內(nèi)產(chǎn)油量和注水量之間的關(guān)系進行建模表征；文獻[8]篩選了井深、氣體飽和度和滲透率等8個參數(shù)作為頁巖氣產(chǎn)量的主控因素，并采用SVR模型對8個參數(shù)與頁巖氣產(chǎn)量之間的關(guān)系進行建模，獲得了較高的預測精度；文獻[9]將ANN引入油氣產(chǎn)量預測領域，分析了ANN和SVR在面對非線性油氣數(shù)據(jù)時的性能差異，證明了ANN在油藏初期產(chǎn)量預測領域具有較高的潛能。相對于數(shù)值模擬方法，機器學習方法不需要復雜的理論推導，且能夠根據(jù)數(shù)據(jù)中隱含的地質(zhì)、工程和生產(chǎn)信息自動學習和調(diào)整，因此具有更高的靈活性和數(shù)據(jù)適應性。然而油氣數(shù)據(jù)本質(zhì)上是一種隨時間變化的時間序列，而機器學習類方法對時間不敏感，建模過程中忽略了時間維度對產(chǎn)量變化的影響，因此預測過程中會出現(xiàn)預測偏差[10]。以長短時記憶神經(jīng)網(wǎng)絡(Long Short-Term Memory Network, LSTM)和卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)為代表的深度學習方法能夠有效挖掘數(shù)據(jù)中隱含的周期性和趨勢性時間信息，同時能夠提取更高階、更豐富的特征對油藏產(chǎn)量與工程參數(shù)之間的復雜關(guān)系進行描述[11-12]，文獻[13]考慮道頁巖氣開發(fā)過程中高密度鉆井條件限制，建立LSTM模型對頁巖氣產(chǎn)量的時序關(guān)系進行描述并將其應用至加拿大Alberta地區(qū)的頁巖氣產(chǎn)量預測；文獻[14]提出一種麻雀搜索算法優(yōu)化的時域卷積神經(jīng)網(wǎng)絡(TCN)的預測模型，解決了水驅(qū)油田單井產(chǎn)量波動大、預測困難的問題。深度學習方法雖然能夠獲得較高的預測準確度，但是需要大量的訓練數(shù)據(jù)用于模型參數(shù)尋優(yōu)，數(shù)據(jù)依賴性將強且運算量較大，限制了該類方法在實際中的應用[15]。

當前已有研究均是采用單一模型進行油藏初期產(chǎn)能預測，近年來集成學習理論的發(fā)展表明，單個模型的預測性能必然存在局限性，通過將多個模型進行集成能夠有效提升對復雜非線性問題的建模分析能力?；诖耍疚奶岢鲆环N基于稀疏自編碼器(Sparse Auto-Encoder, SAE)和集成學習的油藏初期產(chǎn)能預測模型。首先利用SAE進行主控因素選擇，實現(xiàn)數(shù)據(jù)降維的同時降低后續(xù)預測模型的復雜度；然后分別建立LR、SVR和LSTM 3種預測模型進行產(chǎn)量預測，最后利用Bagging集成學習對3種方法的預測結(jié)果進行綜合集成從而獲得最終的油藏初期產(chǎn)能預測結(jié)果。通過某特低滲油田實際數(shù)據(jù)對所提方法的性能進行驗證。

本文詳細內(nèi)容請下載：

http://www.ihrv.cn/resource/share/2000007009

作者信息：

徐振1，張望1，李興亮1，龍軍2

（1.中國石油吐哈油田分公司，新疆哈密 839000；

2.深圳鵬銳信息技術(shù)股份有限公司，廣東深圳 518000）

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容