中文引用格式: 徐振,張望,李興亮,等. 基于SAE特征優(yōu)選和Bagging集成學習的油藏初期產(chǎn)能預測[J]. 電子技術(shù)應用,2026,52(3):84-90.
英文引用格式: Xu Zhen,Zhang Wang,Li Xingliang,et al. Prediction of initial reservoir productivity based on SAE feature optimization and Bagging ensemble learning[J]. Application of Electronic Technique,2026,52(3):84-90.
引言
油藏是我國的戰(zhàn)略資源,在國家經(jīng)濟發(fā)展中起著舉足輕重的作用。油藏初期產(chǎn)能的準確預測對于企業(yè)投資決策、合理開采方案制訂以及生產(chǎn)環(huán)節(jié)優(yōu)化等具有重要意義[1]。自六十年代以來,我國油藏初期產(chǎn)能預測經(jīng)歷了數(shù)值模擬法、機器學習法和深度學習法3個階段[2]。數(shù)值模擬法通過對與油藏初期產(chǎn)量相關(guān)的參數(shù)進行分解,進而建立一系列模型對參數(shù)相互之間的關(guān)系進行描述,最終獲得油藏初期產(chǎn)量的解析表達式,具有原理清晰、可解釋性強和計算簡單等優(yōu)勢[3],但由于儲層非均質(zhì)性、生產(chǎn)以及工程等非線性因素難以采用準確的數(shù)學模型進行描述,導致數(shù)值模擬法的預測精度有限[4]。近年來,隨著我國油氣田數(shù)字化、信息化程度的提升,油氣田產(chǎn)業(yè)積累了大量的地質(zhì)數(shù)據(jù)、生產(chǎn)數(shù)據(jù)和工程數(shù)據(jù)等,數(shù)據(jù)驅(qū)動的機器學習類方法得到了科研人員的廣泛關(guān)注。機器學習法以線性回歸(Linear Regression, LR)、支持向量回歸(Support Vector Regression, SVR)和人工神經(jīng)網(wǎng)絡等方法為代表[5],能夠從歷史數(shù)據(jù)中自動挖掘出與油藏產(chǎn)量有關(guān)參數(shù)之間隱藏的規(guī)律性信息和變化趨勢信息,從而在降低建模難度的同時提升對非線性數(shù)據(jù)的適應性[6]。文獻[7]利用自回歸移動平均模型(ARMA)對水驅(qū)油藏井組內(nèi)產(chǎn)油量和注水量之間的關(guān)系進行建模表征;文獻[8]篩選了井深、氣體飽和度和滲透率等8個參數(shù)作為頁巖氣產(chǎn)量的主控因素,并采用SVR模型對8個參數(shù)與頁巖氣產(chǎn)量之間的關(guān)系進行建模,獲得了較高的預測精度;文獻[9]將ANN引入油氣產(chǎn)量預測領域,分析了ANN和SVR在面對非線性油氣數(shù)據(jù)時的性能差異,證明了ANN在油藏初期產(chǎn)量預測領域具有較高的潛能。相對于數(shù)值模擬方法,機器學習方法不需要復雜的理論推導,且能夠根據(jù)數(shù)據(jù)中隱含的地質(zhì)、工程和生產(chǎn)信息自動學習和調(diào)整,因此具有更高的靈活性和數(shù)據(jù)適應性。然而油氣數(shù)據(jù)本質(zhì)上是一種隨時間變化的時間序列,而機器學習類方法對時間不敏感,建模過程中忽略了時間維度對產(chǎn)量變化的影響,因此預測過程中會出現(xiàn)預測偏差[10]。以長短時記憶神經(jīng)網(wǎng)絡(Long Short-Term Memory Network, LSTM)和卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)為代表的深度學習方法能夠有效挖掘數(shù)據(jù)中隱含的周期性和趨勢性時間信息,同時能夠提取更高階、更豐富的特征對油藏產(chǎn)量與工程參數(shù)之間的復雜關(guān)系進行描述[11-12],文獻[13]考慮道頁巖氣開發(fā)過程中高密度鉆井條件限制,建立LSTM模型對頁巖氣產(chǎn)量的時序關(guān)系進行描述并將其應用至加拿大Alberta地區(qū)的頁巖氣產(chǎn)量預測;文獻[14]提出一種麻雀搜索算法優(yōu)化的時域卷積神經(jīng)網(wǎng)絡(TCN)的預測模型,解決了水驅(qū)油田單井產(chǎn)量波動大、預測困難的問題。深度學習方法雖然能夠獲得較高的預測準確度,但是需要大量的訓練數(shù)據(jù)用于模型參數(shù)尋優(yōu),數(shù)據(jù)依賴性將強且運算量較大,限制了該類方法在實際中的應用[15]。
當前已有研究均是采用單一模型進行油藏初期產(chǎn)能預測,近年來集成學習理論的發(fā)展表明,單個模型的預測性能必然存在局限性,通過將多個模型進行集成能夠有效提升對復雜非線性問題的建模分析能力?;诖耍疚奶岢鲆环N基于稀疏自編碼器(Sparse Auto-Encoder, SAE)和集成學習的油藏初期產(chǎn)能預測模型。首先利用SAE進行主控因素選擇,實現(xiàn)數(shù)據(jù)降維的同時降低后續(xù)預測模型的復雜度;然后分別建立LR、SVR和LSTM 3種預測模型進行產(chǎn)量預測,最后利用Bagging集成學習對3種方法的預測結(jié)果進行綜合集成從而獲得最終的油藏初期產(chǎn)能預測結(jié)果。通過某特低滲油田實際數(shù)據(jù)對所提方法的性能進行驗證。
本文詳細內(nèi)容請下載:
http://www.ihrv.cn/resource/share/2000007009
作者信息:
徐振1,張望1,李興亮1,龍軍2
(1.中國石油吐哈油田分公司,新疆 哈密 839000;
2.深圳鵬銳信息技術(shù)股份有限公司,廣東 深圳 518000)

