前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇神經網絡的學習方式范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
關鍵詞 BP神經網絡;免疫遺傳算法;模擬退火算法;線損
中圖分類號:TM744 文獻標識碼:A 文章編號:1671-7597(2013)11-0000-00
線損是考核電力網運行部門一個重要經濟指標,是電力網供售電過程中損失的電量。線損是技術線損與管理線損之和。對于技術線損則應控制在合理的范圍以內,而管理線損要盡力減到最少。線損理論計算得到的電力網技術線損數值是電力網線損分析和指導降損的科學依據。線損計算是節能管理的重要工作。本文主要討論BP神經網絡算法在配網線損計算中的應用。
1 配網線損的計算方法
整個電力網電能損耗計算可以分解為如下元件的電能損耗計算,即35 kV及以上電力網為35 kV及以上交流線路及變壓器的電能損耗計算;20 kV配電網為20 kV交流線路及公用配電變壓器的電能損耗計算;10 kV配電網為10 kV交流線路及公用配電變壓器的電能損耗計算;6 kV配電網為6 kV交流線路及公用配電變壓器的電能損耗計算;0.4 kV低壓網為0.4 kV及以下電力網的電能損耗計算;其它交流元件為并聯電容器,并聯電抗器,調相機,電壓互感器,站用變等;高壓直流輸電系統:直流線路,接地極系統,換流站(換流變壓器、換流閥、交流濾波器、平波電抗器、直流濾波器、并聯電抗器、并聯電容器和站用變壓器)。
目前已有不少計算線損的方法,日均方根電流法應用較多,但它只是對35 kV及以上電壓的輸電網絡比較適用,而對于35 kV以下的配電網,因為線段數、分支線路、配電變壓器數量較多,使得其等值電路的節點數和元件數大大增加,需要花費大量的人、物力計算所需的運行資料,因此在實際應用中日均方根電流方法難以通用。回歸分析方法在配網線損計算中也有較為廣泛的應用,但該方法難于確定回歸方程,對不同配網結構不具通用性,計算結果準確度不高。近年來,神經網絡理論的發展與應用為配網理論線損計算提供了新的思路。
2 BP神經網絡算法
人工神經網絡是由具有適應性的簡單單元組成的廣泛并行互連的網絡,它的組織能夠模擬生物神經系統對真實世界物體所作出的交互反應。人工神經網絡具有自組織、自學習、良好的容錯性和非線性逼近能力,受到學界的關注。實際應用領域中,百分之八十至九十的人工神經網絡模型采用了誤差反傳算法或者為其變化形式的網絡模型,在這里簡稱為BP網絡,BP網絡目前主要應用在模式識別、分類、函數逼近和數據壓縮或數據挖掘等方面。
BP(Back Propagation)神經網絡,由信息正向傳播及誤差反向傳播兩個過程構成,即誤差反向傳播算法的學習過程。輸入層的每個神經元負責接收來自外界的輸入信息,并傳遞給中間層的每個神經元;中間層是內部信息的處理層,負責信息變換;最后一個隱層傳遞到
輸出層各神經元的信息成一次學習的正向傳播處理過程,由輸出層向外界輸出信息處理結果。根據信息變化能力的需求,中間層可以設計為單隱層或者多隱層結構;當輸出層的實際輸出與期望輸出不符時,進入誤差的反向傳播階段。誤差通過輸出層,按誤差梯度下降的方式修正各層權值,向隱層、輸入層逐層反傳。周而復始的信息正向傳播和誤差反向傳播過程,是各層權值不斷調整的過程,也是神經網絡學習訓練的過程,此過程一直進行到網絡輸出的誤差減少到可以接受的程度,或者預先設定的學習次數為止。
BP神經網絡模型包括其輸入輸出模型、誤差計算模型、作用函數模型和自學習模型。
2.1 作用函數模型
作用函數是反映下層輸入對上層節點刺激脈沖強度的函數,一般取為(0,1)內連續取值Sigmoid函數,即為:f(x)=1/(1+e)。
2.2 節點輸出模型
隱節點輸出模型為Oj=f(∑Wij×Xi-qj),輸出節點輸出模型為Yk=f(∑Tjk×Oj-qk),其中f為非線形作用函數;q為神經單元閾值。
2.3 誤差計算模型
誤差計算模型是反映神經網絡期望輸出與計算輸出之間誤差大小的函數:
Ep=1/2×∑(tpi-Opi) ,其中tpi-i節點的期望輸出值;Opi-i節點計算輸出值。
2.4 自學習模型
神經網絡的學習過程,即連接上層節點之間和下層節點的權重矩陣Wij的設定和誤差修正過程。BP網絡有師學習方式(即需要設定期望值)和無師學習方式(即只需輸入模式)之分。自學習模型為Wij(n+1)=h×Фi×Oj+a×Wij(n),其中h為學習因子;Фi為輸出節點i的計算誤差;Oj為輸出節點j的計算輸出;a為動量因子。
神經網絡可以用作分類、聚類、預測等。神經網絡需要有一定量的歷史數據,通過歷史數據的訓練,網絡可以學習到數據中隱含的知識。
3 BP神經網絡算法在配網線損計算中的應用
基于免疫遺傳算法(IGA)的BP神經網絡方法計算的理論線損是在遺傳算法(GA)的基礎上引入生物免疫系統中的多樣性保持機制和抗體濃度調節機制,有效地克服了GA算法的搜索效率低、個體多樣性差及早熟現象,提高了算法的收斂性能。為了解決BP神經網絡權值隨機初始化帶來的問題,用多樣性模擬退火算法(sAND)進行神經網絡權值初始化,該算法設計的BP神經網絡比混合遺傳算法有更快收斂速度及較強的全局收斂性能,其準確度優于現有其它計算配電網理論線損的方法,預測精度在原有算法基礎上有一定的提高,理論線損的計算結果與實際更加一致。改進后的算法核心是運用了神經網絡的現有理論和結構,借鑒了免疫學原理和相關特性,定義了基于免疫學的基本運算規則和運算單元,用遺傳算法實現了個體群在群體收斂性和個體多樣性之間動態平衡的調整。
4 小結
配電網線損是電力工業中一個重要的技術經濟指標,準確簡便的線損計算對于電力網絡優化設計、提高電力系統運行的經濟性、安全性及供電質量具有很強的導向作用。BP神經網絡算法有更快收斂速度及較強的全局收斂性能,其準確度優于現有其它計算配電網理論線損的方法,使得理論線損理論計算與實際更逼近。
參考文獻
[1]李秀卿,汪海,許傳偉,等.基于免疫遺傳算法優化的神經網絡配電網網損計算[J].電力系統保護與控制,2009,37(11).
[2]甘德強,王錫凡,王小路.電力系統概率暫態穩定性的分析[J].中國電力,1994,27(4):32,35.
[3]張健,劉懷東.輸電線路概率安全性測度研究[J].電力系統及其自動化學報,2003,12:34,36.
關鍵詞:神經網絡 油氣層識別 進展
油氣勘探具有高投入、高風險的特點,如何利用現有勘探資料,采取切實可行的技術方法,增強測試層位的可靠性和準確性,對于擴大油氣儲量及提高已發現油氣藏的勘探價值具有重要意義。首先精確地判識油氣層位,可以大大減少試油成本及減少投資損失。其次對于新的勘探區域,如能準確地判識出油氣層,則有助于新的油氣藏的發現。因此,對儲層進行識別和預測,有著巨大的社會效益和經濟效益。
油氣層綜合解釋的任務是要判斷儲層中所含流體的性質,從而為準確地發現油氣層和確定試油層位提供依據。目前油田常用的解釋方法主要有定性解釋法和交匯圖法,其前者不足是受人為因素影響較大,自動化、系統化程度較低;而后者在解釋時只能對參數成對考慮,無法同時綜合多個有效參數。鑒于上述方法的諸多不足,近年來用人工神經網絡對儲層進行識別與評價成為研究及應用的較為廣泛的方法。
1、概述
神經網絡具有很強的自適應學習能力。它模擬人腦的結構,通過對外界事物的感知及認識實現其判別過程,如加利福尼亞技術學院J.J.Hopfield提出的Hopfield網絡用于地震模式識別油氣層系統。
用從有噪聲干擾的模擬地震記錄中檢測亮點模式,識別能力是十分驚人的。Poultion M.M等人在給定油氣層的電磁橢圓圖像情況下,用神經網絡方法來估算良導體的位置、深度和導電率與面積乘積,效果也是很好的。
模糊識別的優點: ①利用測井多參數模糊識別儲層時,各測井參數反映儲層類型所包含的信息不同,因此綜合儲層模糊隸屬度中各參數所加權值應根據曲線對模式識別貢獻的大小來確定。②模糊識別方法是一種多參數的模式識別方法,具有思想簡單、計算速度快、模式識別符合率較高等優點。缺點:建模過程中需要較多的建模樣本,對于井資料較少的井不容易識別。目前在油氣層識別中的應用比較普遍的神經網絡方法有以下幾種:
2、結構風險最小神經網絡油氣識別理論
中國科學院地質與地球物理研究所張向君在深入研究了神經網絡系統處理信息的能力之后,針對神經網絡油氣識別中網絡結構設計、提高識別結果準確性等問題,提出了結構風險最小神經元網絡方法,在理論上提出了神經網絡結構設計方法即網絡“修剪"方法,該方法要求首先訓練一個大的網絡,然后逐漸去掉隱層中多余的節點:Waug和Massimo等的研究結果表示:含有一個隱層的位置、深度和導電率與面積乘積,效果也是很好的。
Hashem和Schmeiser為提高網絡訓練精度,提出一優化組合方法,即對一訓練樣本分別獨立地用若干網絡訓練,然后通過對已訓練網絡的輸出加權合并,將各個獨立的部分網絡組合在一起;Jacobs和Jordan發展了一種分級混合結構網絡,它首先將一個復雜問題分解成各種簡單問題,再對每一個簡單的問題分別由一個網絡單獨處理,最后再將各個網絡組合在一起解決整體復雜問題。結構風險最小神經元網絡運用串行訓練算法能自適應地擴展網絡容量并使網絡的結構風險達到最小,提高了儲層識別結果的準確性。研究表明,訓練樣本一定時,神經網絡的結構越簡單,其風險越小,識別結果愈可靠,并且使神經網絡的結構風險達到最小。
3、時間延遲神經網絡地震油氣識別方法
江漢石油學院劉瑞林等人在研究了目前已發展的幾種地震資料油氣識別技術后認為通常采用孤立模式分類方法一般先根據目的層的位置選取一個包含目的層的時窗,接著對這個時窗內的地震信號進行特征提取,然后對這些特征信息用相應的分類方法進行分類。特征信息與地層含油氣情況的關系是靜態的映射關系,方法本身沒有考慮特征信息隨時間的變化與地層油氣聚集的聯系,容易產生誤識問題。針對以上現象提出了時間延遲神經網絡地震油氣識別方法即采用滑動時窗的辦法進行多時窗特征提取,以表達特征信息隨時間的變化,亦即地層層序等因素的變化。時間延遲神經網絡模型通過井旁道的標定,對于每一道就有一個多維特征串,這些特征串與地層含油氣與否的關系通過一個時間延遲神經網絡(TDNN)模型聯系起來,用于表達相應時窗特征信息與地層含油氣性的關系。時間延遲網絡進行油氣識別時增加了層序的約束,對于地震油氣識別來說是一種合理的方法。
4、前饋式(Back Propagation)神經網絡
簡稱BP神經網絡,它是目前應用最廣泛、研究最深入的一種多層前饋神經網絡。該種網絡采用有導師監督的學習方式和廣義的Delta學習規則,即誤差反傳播算法,對非線性可微分函數進行網絡權值訓練。它經常使用的激活函數是S型對數或正切函數以及線性函數。BP算法是一種監督式的學習算法,它是通過連續不斷地在相對于誤差函數斜率下降的方向計算網絡權值和偏差的變化而逐漸逼近目標的。它由信息的正向傳遞和誤差的反向傳播兩部分組成。在第一階段,即信息的正向傳遞階段,給出輸入信息,通過神經網絡處理并計算每個神經元的實際輸出值;在第二階段,即誤差反向傳播階段,網絡在輸出層比較網絡輸出與目標值,若未能得到期望的輸出值,則逐層遞歸計算目標值與期望輸出之差(即誤差),以此為根據調節權值。上述兩個過程反復進行,直到網絡輸出與目標匹配或誤差達到人們所希望的要求為止。
5、自組織特征映射(seIf-organiZingfeaturemap)SOM神經網絡
自組織特征映射網絡是一種競爭式學習網絡。這種網絡采用無導師監督的學習方式,以基本競爭網絡算法為基礎,通過網絡中鄰近神經元陽J的側向交互作用和相互競爭。在一維或二維輸出空間中形成輸入信號的特征分布拓撲圖,自適應的形成對輸入模式的不同響應,以完成對輸入信號的特征提取功能。SOM模型是由輸入層和輸出層(競爭層)組成的兩層網絡。網絡中的權分為兩類:一類是層與層之間的權;另一類是層內互相抑制的權。一般來講,它們是固定的,如果滿足一定的分布關系,距離近的抑制強,距離遠的抑制弱,它是一種對稱權。SOM網絡將學習過程分成兩部分來進行:一是選擇最佳匹配神經元,二是權向量的自適應更新過程。SOM模擬了大腦信息處理的自組織、自學習和聚類功能,并以其高強度的特征判別優點在許多領域得到了廣泛應用。
6、改進的組合進化算法的神經網絡
成都理工大學張學慶等針對使用神經網絡進行計算的過程中,神經網絡的收斂速度慢、容錯能力差、算法不完備等缺點。在充分分析了基于遺傳算法的神經網絡具有強的全局搜索能力,基于進化規劃的神經網絡具有強的局部尋優能力的特點后,將組合進化算法應用于油水層測井解釋中,降低了誤判率。
組合進化算法的過程如下:設立一個競爭池,將所有父代個體放入池中,然后進行雜交和變異操作,并用神經網絡進行訓練。將產生的個體也放入競爭池,對競爭池中的個體按適應值進行排序,進行確定性選擇,保留最好的前n個個體。這樣就完成了一次種群進化,重復這一過程,直到滿足條件為止。改進的組合進化算法的神經網絡具有遺傳算法的較強的全局搜索能力和進化規劃的較強的局部尋優能力,應用于油氣水層測井解釋中,效果好。
關鍵詞:人工神經元網絡;BP神經網絡;matlab;識別分類
中圖分類號:TP391.41文獻標識碼:A文章編號:1007-9599 (2010) 16-0000-02
Artificial Neural Network Application on Face Classification
Liang Xiaoli
(Heilongjiang Radio&TV University,Harbin150080,China)
Abstract:In the face recognition technology is developing continuously,people not limited to recognize the human face,but the main emphasis on the accuracy and efficiency of face recognition.
Face recognition is divided into three steps,face detection,feature extraction,recognition category,identification and classification of the methods in which the decision of whether to correctly identify the human face.BP neural network with forward propagation and back propagation characteristics,so as to ensure the accuracy of classif-
ication,Therefore,the main author of this article how to MATLAB,the BP neural network used in face recognition classification.
Keywords:Artificial neural network;BP neural network;Matlab;
Recognition category
人工神經元網絡,又稱為神經元網絡,它是對人腦的簡化、抽象和模擬,反映了人腦的基本特性神經元網絡是由大量處理單元廣泛互連而成的網絡。神經網絡研究的是模擬人腦信息處理的功能,從人腦的生理結構出發來研究人的智能行為。是依托于數學、神經科學、物理學、計算機科學及工程等學科的一種綜合性技術。
一、人工神經網絡的分類
我們可以對人工神經網絡進行如下分類:
(一)單層的前向神經網絡
這里所說的單層前向網絡是指擁有單層的神經元是,作為源節點個數的“輸入層”被看作是一層神經元,“輸入層”是不具有計算功能。
(二)多層的前向神經網絡
多層前向神經網絡與單層前向神經網絡的差別在于:多層的前向神經網絡和單層前向神經網絡的隱含層個數不同,在多層的前向神經網絡中完成計算功能的節點被稱為隱含單元(隱含神經元)。由于隱層的數量不同,使網絡能進行更高序的統計,尤其當輸入層規模龐大時,隱層神經元提取高序統計數據的能力便顯得非常重要。
(三)反饋網絡
反饋網絡指在網絡中最少含有一個反饋回路的神經網絡。反饋網絡中包含一個單層神經元,在這一層中的所有的神經元將自身的輸出信號反饋給其他所有神經元作為輸入。
(四)隨機神經網絡
隨機神經網絡是在神經網絡中引入了隨機概念,每個神經元都是按照概率的原理在工作,這樣每個神經元興奮或抑制具有隨機性,其概率取決于神經元的輸入值。
(五)競爭神經網絡
競爭神經網絡最顯著的特點是它的輸出神經元之間相互競爭以確定勝出者,勝出者指出哪一種原型模式最能代表輸入模式。
二、神經網絡的學習
神經網絡的學習又被稱為訓練,所指的是通過神經網絡所在外界環境的刺激下調整神經網絡的參數,使得神經網絡以一種調整好的方式對外部環境做出反應的過程。從環境中學習和在學習中提高自身性能是神經網絡最有意義的特征了。
學習方式可分為:有師學習和無師學習。有師學習又稱為有監督學習,在學習時需要給出指導信號(又可稱為期望輸出或者響應)。神經網絡對外部環境是未知的,但可以將指導信號看作對外部環境的了解,由輸入―輸出樣本集合來表示。指導信號或期望輸出代表了神經網絡執行情況的最佳結果,即對于網絡輸入調整網絡參數,使得網絡輸出逼近期望的輸出值。無師學習包括強化學習與無監督學習(可以被稱為自組織學習)。在強化學習中,對輸出的學習是通過與外界環境的連續作用最小化完成的。
三、BP神經網絡
BP(Back Propagation)神經網絡,就是指包含信息正向傳播和誤差反向傳播算法的學習過程。輸入層的每一個神經元負責接收來自外界的輸入信息,并傳遞給中間層中的每一個神經元;中間層的各個神經元是內部信息處理層,負責信息變換,可以設計為單隱層或者多隱層結構;最后隱含層傳遞到輸出層的信息,經進一步處理后,完成一次學習的正向傳播處理過程,由輸出層向外界輸出信息處理結果。當實際輸出與期望輸出不相符時,進入誤差的反向傳播階段。誤差通過輸出層作用于輸入層,按誤差梯度下降的方式分別修正各層權值,逐漸向隱含層和輸入層反傳。多次的經過信息正向傳播和誤差反向傳播過程,是各層權值不斷調整的過程,也就是神經網絡學習訓練的過程,此過程一直進行到網絡的輸出誤差減少到可以被接受的程度,或者達到預先設定的學習次數才會停止。
四、實驗過程及結果
本文中假設已經用奇異值分解得到人臉特征點的數據,每個人臉劃分為五部分,每部分又得到5個特征值,所以也就是25個的特征值。本文采集了50個人人臉,每人采集10張不同姿態下的照片,也就是500張照片,對這些照片進行人臉檢測并進行奇異值分解,得到每張照片對應的25個特征值,從每人10張照片中隨機抽出5張用于訓練出不同的姿態下的人臉,另外的5張用作測試樣本。
(一)實驗過程
由于數據過長,本文只以2個人,每人2張照片作為的訓練樣本數據為例來說明。
第一步:訓練樣本(每人25個特征值),在p是一個25行,4列的矩陣,每一列代表一個人的25個特征值,屬于一個樣本;列數4表示樣本總數;
p=[ 7.4264 9.0728 7.9825 9.5632;
7.5719 7.8115 6.5564 7.8561;
12.8074 12.7073 12.4536 11.5423;
9.0284 10.3744 8.7569 9.9965;
7.0083 9.0284 7.1254 8.8876;
1.2597 2.1578 1.3556 3.0112;
0.6896 0.7835 0.7859 0.9658;
0.7814 0.8818 0.7568 0.8213;
1.0248 1.6783 1.1542 1.5234;
1.0112 1.0248 0.9568 0.9652;
1.0427 1.0813 1.0425 0.9568;
0.5970 0.5886 0.5968 0.5889;
0.4928 0.5969 0.3569 0.6012;
0.6438 0.6417 0.6589 0.5612;
0.3563 0.6438 0.2534 0.6689;
0.4474 0.4235 0.4568 0.4236;
0.2483 0.2282 0.2253 0.2259;
0.3633 0.4616 0.3102 0.4556;
0.3383 0.4167 0.3561 0.3456;
0.3130 0.3383 0.3302 0.3359;
0.3378 0.3313 0.3219 0.3569;
0.1916 0.1767 0.1564 0.1952;
0.2356 0.3422 0.2355 0.3012;
0.2088 0.3268 0.1958 0.3568;
0.1858 0.2088 0.0956 0.1968;];
第二步:目標輸出矩陣
因為就兩個人,所以采用一位二進制編碼就可以,在這里定義第一類樣本的編碼為0;第二類樣本的輸出編碼為1。
t=[0 1 0 1];
第三步:使用MATLAB建立網絡結構
net1=newff(minmax(p),[25,9,1],{'tansig','tansig','hardlim'},'traingdm');
說明:[25,10,1]表示該網絡的輸入結點為25個值,輸出結果為1為二進制編碼的值,中間層由經驗公式 (rnd為0-1之間的隨機數),所以本文選取5-15之間數分別作為隱含層的神經元個數,得出的結論是9的收斂速度最快。
第四步:對網絡進行訓練
[net1,tr]=train(net1,p,t);
第五步:保存網絡
save aa net1
則文件會以aa.mat的格式保存,保存了訓練好的網絡以及權值。
第六步:輸入測試樣本
先加載上一步中保存好的網絡,本實驗中只輸入一個測試樣本,下面的數據代表測試樣本的特征值,共25個。
load aa.mat
p1=[7.8115;0.7835;0.5886;0.2282;0.1767;1.0197;0.7896;0.6814;1.1238;1.1114;0.9427;0.5970;0.4569;0.5438;0.4563;0.1983;0.4632;0.3383;0.3130;0.4377;0.1817;0.2256;0.2088;0.2854;0.2812];
第六步:網絡仿真
a=hardlim(sim(net1,p1)-0.5)
(二)實驗結果
根據上述實驗過程,得出的結果是:
下圖是執行了10次中的一次算法模擬情況。
Elapsed time is 0.469seconds
網絡仿真的輸出結果是:a=0
本文中測試的數據來源于訓練樣本中輸出為0的樣本,識別結果正確。換了10個測試樣本,其中識別正確的是6個,也就是正確率大約在60%。
然后,采用相同的辦法,在實驗中把訓練樣本由每人兩個不同姿態下的樣本增加到了3個,也就是輸入向量的p由4列增加到6列,其他的均不變,網絡的訓練時間為0.471 seconds。還是使用上面的10個測試樣本,其中識別正確的達到了8個,正確率提高到了80%左右。
在樣本量擴大到250時,這些樣本是來自于,50個人,每人拍攝10張不同姿態下的照片,也就是500張,然后從其中隨機的取出每個人對應的5張照片作為訓練樣本,然后再把從剩余的250張作為測試樣本,進行測試。輸入結點數為250,每個結點對應的特征向量為25;輸出值用二進制的編碼表示,由于后面要實現的人臉識別系統中要應用在一個只有50人的環境下,所以采用二進制編碼6位就夠了,但是為了系統的可擴展性,所以采用7位二進制編碼來設計輸出結點的值,bp網絡就是25維輸出7維輸出。此時測試的250個數據中只有一組數據是錯誤的,原因是照片中的人嘴和鼻子被口罩遮住了。
樣本量增加后網絡訓練到一個樣本測試仿真所有的時間是1.936seconds。
五、小結
本文介紹了基于BP神經網絡的人臉識別分類方法,先用matlab設計了一個模擬程序,然后不斷的增加訓練樣本中同一人樣本的樣本數,訓練后用10個人分別測試兩個網絡的正確率,當同一人的樣本數增加到3時,正確率由60%提高到了80%。可以證明網絡訓練樣本的增加有利于提高識別的正確率。把在上一章中采集到的50個人所對應的500張照片作為標準樣本庫,從中隨機取出250張作為訓練樣本,然后設定輸出值,輸出的值應該有50類,采用二進制的編碼構成,然后再實用剩余的250張照片作為測試樣本,進行測試。
關鍵詞:神經網格 油藏描述 級聯算法
引言
目前,由于易于尋找油氣藏的減少,油氣資源勘探已趨向巖性、地層等隱蔽油氣藏方向,油藏描述方法技術就成為油氣資源勘探開發工程中必不可少的核心技術之一,而油藏參數的分析和預測是油藏描述的最重要方面。比較準確的、精細的油藏參數預測無疑能夠回答勘探實踐中的一些重要問題。
級聯算法就是一種典型的構造性神經網絡。運用級聯算法,對油藏各參數進行分析、抽象,可以最大限度地把地下油藏的三維特征描述清楚,而且更重要的是利用較少的資料能較準確地預測出地下油藏的滲透率、飽和度和孔隙度,能夠比較準確地描述出各種開發屬性三維空間的具體細節。因此本文將探索的利用構造性神經網絡預測油藏參數是很有意義的。
關于神經網絡自學技術應用于“油藏參數的預測”的意義
1.油藏描述技術
油藏描述是以石油地質學、沉積學、地震地層學和測井地質學為基礎,以數學地質學和計算機自動繪圖技術為手段,最大限度地利用地震、鉆井、測井、試油和分析化驗等資料,對油藏進行綜合研究和描述的新技術。它表現出了以下重要的特點:
(1)階段性:油藏描述貫穿于勘探開發的全過程,從第一口發現井到油田最后廢棄為止,多次分階段滾動進行。
(2)先進性:現代油藏描述盡量采用各種先進實用的科學技術和方法,如現代數學方法和理論的大量應用,包括地質統計學及隨機模擬、模式識別、模糊數學、專家系統、神經網絡、分形幾何等。
(3)早入性:油藏描述應從油田第一口發現井開始就開展工作。油田發現后,開發工作人員介入得越早,油藏描述工作開始得越早越好。
為了把油藏描述的結果準確、詳細、直觀地表達出來,應在石油勘探開發中進行科學的管理和決策。油藏參數是一些很重要的指標,因此油藏參數的預測是否準確,繪出的圖樣是否合理,直接影響到油藏描述的效果?!吧窠浘W絡自學技術”就是以重點對油藏參數進行分析、預測,增強了油藏描述技術的可靠性。
2.推出神經網絡自學技術的工作機制
傳統的神經網絡學習算法,其具體步驟為:
(1)初始化。確定神經元的轉換函數(通常取為Sigmoid函數),給定精度控制參數ε(ε>0),學習率L及動量系數。
(2)計算網絡輸出y 。
(3)計算誤差函數E,如果E<ε轉(5),否則轉(4)。
(4)調整輸出層和隱層的權值,轉(2)。
(5)存儲最優權值W ,算法結束。
這里需要注意的是權值調整是在誤差向后傳播過程中逐層進行的,當網絡的所有權都被更新一次后,我們說網絡經過了一個學習周期。
網絡經過若干次訓練(迭代)后,得到了網絡的最優權值W 。
本文所采用的構造性學習算法――CC算法是一種監督學習方式,它融合了兩個觀點:第一個是重疊結構,該結構中我們每次只添加一個隱層單元,而且添加后都不改變;第二個是學習算法,它創造和裝載了新的隱層單元。對于每一個新隱層單元,該方法嘗試去最大化新單元輸出與網絡殘留誤差信號之間的聯系。其生長過程如下圖所示:
算法重復直到網絡的全體誤差小于某個給定值。
我們的目標是訓練輸出權重使平方和最小,即
3.神經網絡自學技術的初步應用
Rajesh Parekh、Jihoon Yang和Vasant Honavar三位研究了神經網絡自學技術在模式識別方面的應用,研究得到了美國科學基金、John Deere基金、美國安全局和IBM公司的支持。
該研究使用了幾十倍的交叉確認方法。每一個數組都被分成10等份,而且對于每一個數組,每個方法的獨立運行都是受控的。對于第i個運動,第i個包是按照測試包來設計的,而剩余的9個包中的樣品被用來訓練。在訓練的最后,網絡的普遍性是在測試包上測試。單獨的TLU的是用熱感知器方法來訓練的。每個神經元的權值按一定間隔隨機地被初始化為一個新,以適應在整個6個點中輸入到神經元的平均網格。
圖2總結了實驗的結果,該實驗是設計來測試構造性學習算法的收斂性。它列舉出了實驗用的方法和網絡尺寸(隱藏和輸出神經元的數目)的標準偏差、訓練的精確度,以及建立在3個周期和電離層數組上的M Pyramid-real和M Tiling-real方法的測試精確度。為了區別,我們包含了運用熱感知器方法訓練單層網絡的結果。感知器方法在兩個數組的訓練精確度都少100%(這鞏固了數組的非線性可分離性)。這些結果表明不僅僅構造性算法訓練集上收斂于0分類誤差,而且它們在未知數據上也可以清楚地推斷出來。
這樣在油藏描述中,我們在缺少單一資料的情況下也可以很準確地得到油藏屬性值。比如在計算空隙度時缺少了一個單一的聲波時差,我們可以使用級聯算法,計算出空隙度。并且使用神經網絡自學算法,可以更準確地得到需要使用迭代方法得到的參數值。這樣得到的參數,使用計算機圖形庫,就可以很快地形成三維的地質圖形,使得油藏描述更為精確。
對于神經網絡自學技術未來的研究點如下:
1.預測構造性學習算法的表現,
2.混合構造性學習算法,
3.合并構造性學習和特征選擇,
4.運用助推和錯誤糾正輸出碼來改善普遍化,
5.從訓練的構造性神經網絡的知識萃取。
結束語
為了把油藏描述的結果準確、詳細、直觀地表達出來,應在石油勘探開發中進行科學的管理和決策。油藏參數是一些很重要的指標,因此油藏參數的預測是否準確,繪出的圖樣是否合理,直接影響到油藏描述的效果。本文采用“神經網絡自學技術”就是以重點對油藏參數進行分析、預測,增強了油藏描述技術的可靠性。運用級聯算法,對油藏各參數進行分析、抽象,可以最大限度地把地下油藏的三維特征描述清楚,而且更重要的是利用較少的資料能較準確地預測出地下油藏的滲透率、飽和度和孔隙度,能夠比較準確地描述出各種開發屬性三維空間的具體細節,可以更快、更準確地得到結果,應用更加方便。
參考文獻:
[1]鄔長武,于浩業,沈楠,尹東迎.神經網絡在彩南油田油藏描述中的應用.新疆石油地質,2003年03期.
[2]謝叢姣,關振良,馬正.低滲油藏油層產出能力的神經網絡預測方法.成都理工學院學報,1998年S1期.
關鍵詞:自組織競爭網絡;測井資料巖性識別;MATLAB
中圖分類號:TE319 文獻標識碼:A文章編號:1007-9599 (2011)05-0000-02
Application of Self-organization Competition Network in Log Data Lithological Identification
Zong Chunmei
(Xinzhou Teachers University,Xinzhou034000,China)
Abstract:Using self-organizing and self-learning ability of self-organizing neural network,analyze the impact factor to establish self-organizing competitive network model based on MATLAB.By comparing the two structures of basic competitive network and self-organizing competitive network to achieve lithology classification.Experimental results show that the use of self-organizing network model of competition test well lithology identification information is feasible,the correct rate,for the lithology of the research to identify new methods.
Keywords:Self-organizing competitive network;Log data lithology identification;MATLAB
一、引言
目前,巖性識別主要有以下幾種方法:(1)概率統計方法;(2)聚類分析方法;(3)人工神經網絡方法。人工神經網絡方法以其自身特有的樣本學習能力獲得識別模式,以與巖性相關的測井資料作為神經網絡的輸入參數,已知巖性種類作為輸出總數。前兩種數理統計方法,兩者的差別只是參數選擇的要求不同。人工神經網絡具有很強的自組織性、自適應性、容錯性和推理思維能力,人們運用神經網絡在測井資料巖性識別領域做了大量的研究,取得良好效果。
二、自組織競爭神經網絡原理
自組織競爭網絡是以無教師教學的方式進行網絡訓練,具有自組織功能,網絡通過自身訓練,自動對輸入模式進行分類,讓網絡競爭層中的各種神經元通過競爭來獲取對輸入的響應機會,最后僅剩一個神經元成為競爭的獲勝者,并對那些與獲勝神經元有關的各連接全部朝著更有利于它競爭的方向調整,這一獲勝神經元的輸出則代表對輸入模式的分類,正是自組織競爭神經網絡具有自組織能力、自適應能力和較高的容錯能力的特點,為測井資料巖性識別提供了新的方法。在競爭層中,神經元之間相互競爭,最終只有一個或者幾個神經元獲勝,以適應當前的輸入樣本。競爭勝利的神經元就代表著當前輸入樣本的分類模式。
三、樣本數據的獲取
(一)樣本的選取
樣本包括樣本特征選取及樣本數目的確定。本文樣本源于北方某地區2004年的測井資料,該地區屬于碳酸鹽地層,因此需要判斷的巖性有三種,即泥巖、砂巖和石灰巖。通過對已知井段測井數據進行學習,來預測同一地區其他井段的巖性。
(二)樣本數據的預處理
測井資料的樣本數據中包含了影響巖性的5個重要因子,即補償中子空隙度CNL、補償密度曲線DEN、聲波時差DTC、自然伽瑪GR和微電阻率RT。歸一化后的數據如表3.1所示。
表3.1 歸一化后的巖性影響因子
序號 CNL DEN DEC GR GT 巖性
1 0.4036 0.4365 0.4860 0.5161 0.3419 泥巖
2 0.4154 0.4711 0.4639 0.4981 0.3806
3 0.5352 0.6408 0.6145 0.6299 0.7154 砂巖
4 0.5524 0.6528 0.6234 0.6715 0.7025
5 0.7709 0.7812 0.8204 0.8425 0.8622 石灰巖
6 0.7589 0.7965 0.8125 0.8506 0.8709
四、測井巖性識別模型的建立
(一)測井巖性識別算法
應用自組織競爭網絡進行測井資料巖性識別,首先獲取樣本資料,即測井數據。在應用自組織競爭人工神經網絡對數據進行處理前,利用歸一化公式對所有測井數據進行歸一化。利用自組織競爭網絡的神經網絡工具箱函數創建網絡。網絡創建好后需要對網絡進行初始化,接著對網絡進行訓練,并設置訓練次數,由于競爭型神經網絡采用的是無教師學習方式,沒有期望輸出,所以訓練過程中不需要設置判斷網絡訓練是否結束的誤差項,只要設置網絡的訓練次數就可以了,網絡訓練完畢后,利用仿真函數檢驗網絡對巖性模式的分類。利用函數vec2ind將數據串行化輸出,為了檢驗網絡的分類性能可以采用同一地區的測試數據對網絡進行測試,進行巖性識別。如果巖性識別沒有成功,重新對網絡進行初始化,重新對網絡進行訓練、測試。
(二)自組織競爭神經網絡結構設計
自組織競爭網絡的神經網絡工具箱提供了大量的函數工具。自組織競爭網絡由輸入層和競爭層組成。用newc函數創建一個競爭層,構建一個基本競爭型網絡。權值函數為negdist,輸入函數為netsum,初始化函數為midpoint或者initcon,訓練函數或者自適應函數為trains和trainr,學習函數為learnk或者learncon函數。函數返回值是一個新的競爭層。由于需要識別的類別數目是3,神經元數目也設置為3,為了加快學習速度,將學習速率設置為0.1。用newsom函數創建一個自組織特征映射網絡。自組織特征映射網絡的輸入層中的每一個神經元,通過權與輸出層中的每一個神經元相連。構成一個二維平面陣列或一個一維陣列。輸入層和競爭層的神經元之間實現全互連接。利用基本競爭型網絡進行分類,需要首先設定輸入向量的類別總數,再由此確定神經元的個數。但利用自組織特征映射網絡進行分類卻不需要這樣,這種網絡會自動將差別很小的點歸為一類,差別不大的點激發的神經元位置也是鄰近的。兩種網絡模型各自創建好網絡后,對網絡進行初始化,論文用到函數initcon。接著就可以對網絡進行訓練,當達到最大訓練次數時,訓練停止。此時用仿真函數sim檢驗網絡對巖性分類模式的分類。為了檢驗網絡的分類性能采用訓練樣本以外的數據對網絡進行測試。利用自組織競爭神經網絡進行巖性識別,不必對輸入的測井數據進行統計,只要將網絡自動分類號與相應的巖性對應,即可實現自動巖性分類識別。
五、在MATLAB環境下實現測井資料巖性識別
(一)用函數newc創建一個自組織競爭網絡來對巖性分類:
1.建立網絡
net=newc(minmax(P),3,0.1);
2.網絡訓練
net=init(net); %初始化函數為initcon
net.tranParam.epochs=200;%訓練步數為200
net=train(net,P);
訓練結果顯示當達到最大訓練次數時訓練停止。
3.仿真
為了檢驗訓練好的網絡的分類性能,利用仿真函數檢驗網絡對上述巖性模式的分類。
Y=sim(net,P)%對訓練好的網絡仿真
Yc=vec2ind(Y)
運行結果表明網絡成功地將巖性模式分成三類。
4.測試:用樣本以外的數據測試網絡的分類性能。結果顯示測試數據屬于石灰巖,網絡識別成功,網絡的性能是不錯的。
5.繪曲線圖
wts=net.IW{1,1} %查看權重
wts=wts'
運行結果如圖5.1所示。
圖5.1 訓練后網絡權重散點圖
由圖5.1分析可知,競爭型網絡會根據輸入向量的分布來調整它的權重向量。離輸入向量越近(越相似)的權重向量,通過調整靠的越近。訓練結果就是,有幾類輸入向量也就有幾類與輸入向量相似的權重向量。
(二)用newsom函數創建一個自組織特征映射進行巖性分類:
1.建立網絡
net=newsom(minmax(P),[6 5]); %網絡競爭層的神經元的組織結構6 5 plotsom(net.layers{1}.positions);%繪制神經元初始位置
title('神經元位置的初始分布')
figure;
運行結果表明神經元位置是均勻分布的,網絡還沒有對輸入向量進行分類的能力。
2.網絡訓練與網絡仿真
net.trainParam.epochs=10;
net=train(net,P);
訓練結果:
TRAINR, Epoch 0/10
TRAINR, Epoch 10/10
TRAINR, Maximum epoch reached.
y=sim(net,P) %對訓練好的網絡仿真
yc=vec2ind(y)%轉換為串行數據
運行結果表明訓練次數為10時,網絡成功的對巖性進行了分類。由此可知訓練步數為100時,網絡分成了5類,這種分類結果就比較細化了,因為根據深度的不同,砂巖還可以分為粗粒砂巖和細粒砂巖。
3.測試:結果表明該組數據為屬于石灰巖。
4.繪曲線圖:
圖5.2 訓練10次后輸入向量分布
圖5.3 訓練10次后神經元分布
由圖5.3可知,經過10次訓練后,神經元的位置就發生了明顯的改變,神經元位置的分布情況表示它們已經對輸入向量進行分類了,此時再增加訓練次數已經沒有什么實際意義了。
實驗結果表明,兩種網絡結構都成功地對巖性進行了正確分類。自組織特征映射網絡在訓練次數較少的時候就可成功地對巖性進行分類,在提高訓練次數的時候分類結果比較精細。
六、結束語
論文研究結果表明,采用自組織競爭網絡與自組織特征映射網絡進行測井資料巖性識別是可行的,識別率比較高。由于測井資料所攜帶的重要的地質信息可以確定地層含油儲量,而且還是制訂開采規劃的重要依據,因此利用自組織競爭網絡進行測井資料巖性識別具有很大的意義。此外利用自組織競爭網絡還可以對我國油田進行油氣層識別,提高油田的產量。不足之處在于巖性復雜地區所需要的信息量較大,需要考慮樣本數量的需求、模式和測井數據的完備性。
參考文獻:
[1]陳祥光,裴旭東.人工神經網絡技術及應用[M].北京:中國電力出版社,2003
[2]張立明.人工神經網絡的模型及其應用[M].上海:復旦大學出版社,2004
[3]飛思科技產品研發中心.神經網絡理論與MATLABR2007實現[M].北京:電子工業出版社,2007
[4]高雋.人工神經網絡原理及仿真實例[M].北京:機械工業出版社,2005
[5]許東,吳錚.基于MATLAB 6.x的系統分析與設計[M].西安:西安電子科技大學出版社,2003
[6]王洪元.人工神經網絡技術及其應用[M].北京:中國石化出版社,2002
[7]邱穎,孟慶武,李悌.神經網絡用于巖性及巖相預測的可行性分析[J].地球物理學進展,2001,16(3):76-84