本發明屬于光學
技術領域:
,具體涉及一種基于主成分分析和多元線性回歸法的燃燒體元素含量測定方法。
背景技術:
:對于燃燒體,要想測定其中含有哪些元素及各元素含量,需要通過復雜的化學測量分析方法,較為普遍的做法是采用對物質燃燒后的殘留物進行元素分析,進而可以分析出原燃燒體中的元素及其含量,這種方法測量難度較大,同時對于含有無機元素的燃燒體,很難對燃燒后的殘留物進行元素分析,此外,運用化學領域的方法測量元素及其含量的代價較高,測量成本較高。技術實現要素:本發明的目的在于提供一種基于主成分分析和多元線性回歸的燃燒體元素含量測定方法,通過分析燃燒體的發射光譜的光強度值進行元素含量的測定,測定方法簡單高效,測量精度高。為了解決上述技術問題,本發明提供一種基于主成分和多元線性回歸的燃燒體元素含量測定方法,首先,對燃燒體發射光譜的光強度值進行數據篩選,對篩選后的光強度值進行去噪處理;然后,根據去噪處理后的光強度值獲得光強度值的主成分得分;最后,根據光強度值的主成分得分計算獲得燃燒體中待測元素的含量,計算方式如公式所示,Y=b0+b1S1+...+bpSp其中,Y表示燃燒體中待測元素Y的含量,S1,S2,….Sp表示主成分得分,b0為常數項,b1…bp為回歸系數,b0以及b1…bp均為已知量。本發明與現有技術相比,其顯著優點在于,(1)不需要采用化學領域的分析測量方法,很容易在實際中實現;(2)采用主成分分析法,測量精度比較高;(3)采用數學建模的方法,方法較為創新;(4)理論上可以用于測量自然界中的大部分元素,方法用途較廣。具體實施方式容易理解,依據本發明的技術方案,在不變更本發明的實質精神的情況下,本領域的一般技術人員可以想象出本發明基于主成分分析和多元線性回歸的燃燒體元素含量測定方法的多種實施方式。因此,以下具體實施方式僅是對本發明的技術方案的示例性說明,而不應當視為本發明的全部或者視為對本發明技術方案的限制或限定。本發明對主成分得分變量S1,S2,….Sp與因變量Y(即燃燒體中待測元素Y的含量)進行多元線性回歸分析,建立它們之間的多元線性回歸模型方程,如式(1)所示:Y=b0+b1S1+...+bpSp(1)式(1)中,b0為常數項;b1…bp為回歸系數,b1為S1,S2…固定時,S1每增加一個單位對Y的效應,即S1對Y的偏回歸系數;同理b2為S1,S2…固定時,S2每增加一個單位對Y的效應,即S2對Y的偏回歸系數等等。回歸系數可以通過實驗獲得,在每次進行燃燒體中某待測元素含量時,只需根據光強度值獲得主成分得分S1、S2…Sp,將主成分得分代入式(1)即可實現對燃燒體中某元素Y含量的測定。一、回歸系數是事先通過多次試驗獲得,每次使用時,只需通過查表即可使用,回歸系數獲得過程如下:在多次試驗獲中,測得的包含元素Y的燃燒體發射光譜的光強度值,并在實驗前通過其他方式非常艱難地測得燃燒體中待測元素Y的含量值(即先驗信息),設每次試驗中,燃燒體發射光譜中L個光波長對應的光強度值為X1,X2,…XL,且X1~XL的光波長的波長差是一個常數。第一步,根據相關光譜理論知識,對發射光譜的光強度值進行篩選操作,獲得篩選后的發射光譜的光強度值。根據對相關光譜理論知識的研究,可知光譜數據的篩選正確與否對數據的后續處理分析有一定的影響作用。假設需要測量的為元素Y,根據現有知識可知,元素Y的燃燒發射光譜波長應當為lamda1、lamda2…、lamdan共n個波長值。由于光譜線測量時發射光譜的波長值可能會發生一定的平移,因此需要先將光強度值X1,X2,…XL所對應的L個光波長值分別與已知標準的n個波長值lamda1,lamda2…lamdan進行比較,如果兩者相差值在預先設定的誤差Δl范圍內的,則認為此波長所對應的譜線是元素Y的發射光譜譜線,予以保留,否則,則認為此波長所對應的譜線不是元素Y的發射光譜譜線,予以剔除;設經前述篩選后保留了m個光波長對應的光強度值X1,X2,…Xm,m<L。第二步,根據相關去噪理論,對篩選后的發射光譜的光強度值X1,X2,…Xm進行去噪預處理。發射光譜數據在采集時往往會受到諸多因素的影響,使得光譜數據中除了包含有用的信息外,還混雜有背景和儀器噪聲等無關信息。在分析處理光譜數據時,這些噪聲會對分析結果產生不良的影響,降低光譜分析精度,因此需要先進行去噪預處理。作為一種優選方案,本發明去噪預處理采用信號平滑法,去除高頻噪聲,提高光譜信號的信噪比,信號平滑中具體采用移動平均平滑(MovingAerageSmoothing,MAS)法。設經去噪預處理后的m個光波長對應的光強度值為第三步,根據主成分分析方法,對去噪預處理后的光強度值為進行主成分分析,獲得最終的主成分得分Si(i=1,2,...p)。發射光譜的光強度值數據量大,其中包含了豐富的物質成分和結構信息,通過主成分分析法分析光譜數據,用少數幾個主成分變量代替原始變量,主成分變量是原始變量的線性組合,能夠最大程度地代表原始變量的信息。主成分分析法通過正交變換使主成分之間彼此互不相關,以此克服數據共線性問題。主成分分析具體分析過程如下:1.1設對于共m個光強度值,每一個波長對應的光強度值有n個數據(即n次試驗獲得的結果),將n次試驗獲得光強度值組成自變量矩陣X如式(2)所示,其中xnm代表第n次試驗中第m個波長對應的光強度值。n表示矩陣X的行數,m表示矩陣X的列數1.2計算自變量矩陣X的相關系數矩陣R,關系數矩陣R如式(3)所示:式(3)中,rij(i,j=1,2,...,m)為光強度值和的相關系數,其計算公式如式(4)所示:其中,表示變量xi的平均值,xi表示矩陣X中第i列數據;k表示矩陣X的行數,k=1,2,...,n。1.3根據相關系數矩陣R求解出特征方程|λI-R|=0所需使用的特征值λ1,λ2...λm,其中I為一個單位矩陣,求解特征值λ1,λ2...λm常用的方法是雅可比(Jacobi)法,并將求解出的特征值λ1,λ2...λm按照從大到小的順序排列λ1≥λ2≥...≥λm≥01.4將特征值λ1,λ2...λm代入特征方程|λI-R|=0分別求出特征值λi對應的特征向量ei,特征向量ei為m行1列的矩陣,其中i取1~m范圍內的整數。1.5根據特征值λ1,λ2...λm計算主成分的貢獻率和累計貢獻率,貢獻率計算公式(5)所示,累計貢獻率如公式(6)所示:累計貢獻率表示所生成的新變量(即主成分)所包含原始數據信息的程度,為了更大程度地代表原來的變量,一般選取主成分累計貢獻率≥95%的特征值λ1,λ2,...λp對應的主成分,p≤m。1.6根據特征值λ1,λ2...λm和特征向量ei計算各主成分載荷Ii,計算公式如式(7)所示:主成分載荷Ii為m行1列的矩陣;然后根據求出的各主成分的載荷Ii,計算得到各主成分得分Si,如公式(8)所示,其中,Si為n行1列的矩陣,表示的是主成分變量Si在n次試驗下的得分數值。由上可知,主成分分析是一種有損降維的方法,當主成分選取過少時,信息損失量將會比較大,當主成分數量選取過多時,計算機的運算量將會大大增加,因此在實際計算過程中應該根據需要合理選取主成分變量個數。第四步,根據上面主成分分析求出的主成分得分Si(i=1,2,...p)和已知的燃燒體中元素Y的含量值Yi(i=1,2,...n),采用最小二乘法進行擬合,可以求出回歸系數b1…bp。二、主成分得分S1、S2…Sp的確定設對于當前需要測定其中元素Y含量的燃燒體的發射光譜的光強度值為z1,z2,…zL,按照前述篩選與預處理方法做相應的處理,得到處理后的光強度值將組成一個1行m列的矩陣Z,根據公式9可獲得主成分得分的值S1、S2…Sp。其中,i=1,2,...p。本發明可以通過以下實驗進一步說明。本實驗中的燃燒體發射光譜波長范圍為245nm~1044nm,共3648個光波長值,變量w1,w2…w3648分別代表某一波長值對應的光強度值,且w1~w3648光波長差是一個常數,光強度值是某一種固定參考強度的倍數,每一個變量都有19次試驗的結果,基于此,完成對燃燒體中碳元素含量的測定。第一步,對19次試驗的(不是本次待測燃燒體)原始的光強度值進行發射光譜的光強度值數據的篩選,獲得篩選后的光強強度值,由查詢到的碳元素發射光譜資料可得:碳元素發射光譜波長范圍為175.136nm~453.18nm(具體波長值見附錄),根據相關的光譜理論知識可得由于光譜線測量時發射光譜的波長值可能會發生一定的平移,因此選取在碳元素發射光譜波長范圍附近間隔小于等于0.2nm處的譜線為碳元素的發射光譜譜線,篩選后的光譜數據包含954個波長,w1,w2…w954分別代表對應波長的光強度值。第二步,對第一步篩選出的發射光譜的光強度值進行數據預處理,獲得預處理后的光強度值,采用移動平均平滑法對光譜數據進行預處理,經過預處理后的954個光波長對應的光強度值為第三步,對第二步預處理后的光強度值進行主成分分析(PCA),獲得主成分得分數值,在Matlab(一種數學分析計算軟件)中運用主成分分析方法進行求解,為預處理后的光強度值變量,共有19次試驗的結果,將19次試驗的結果組成矩陣W(19行954列的數據)如下,其中n為19,m為954,wnm代表第n次試驗中第m個波長對應的光強度值。(1)對數據矩陣W按列進行標準化(每一列中的數據除以每一列數據的總和),獲得標準化后的數據矩陣。(2)對(1)中的標準化后的數據矩陣W,按照以下公式求出矩陣W的相關系數矩陣R,式中,rij(i,j=1,2,...,m)為原變量和的相關系數,其計算公式如下所示,代表變量wi的平均值。(3)對(2)中的相關系數矩陣R求解特征值λi和對應的特征向量ei(i=1,2....954),同時計算貢獻率和累積貢獻率,取累計貢獻率達到96%時的特征值λ1,λ2,…,λp所對應的為第一、第二,…,第p(p≤954)個主成分,求出每個主成分變量對應的貢獻率如表1所示,共求出16個主成分。表1各主成分貢獻率各主成分貢獻率主成分變量10.698016主成分變量20.215754主成分變量30.007537主成分變量40.006690主成分變量50.006384主成分變量60.006227主成分變量70.006124主成分變量80.005849主成分變量90.005556主成分變量100.005476主成分變量110.005339主成分變量120.004911主成分變量130.004832主成分變量140.004634主成分變量150.004504主成分變量160.004327(4)根據(3)中求出的特征值和特征向量計算主成分變量載荷,其計算公式為:(954行1列的矩陣)根據各主成分的載荷計算得到各主成分的得分:其中,Si為19行1列的矩陣,表示的是主成分變量Si在19次樣本試驗下的得分。利用上式求出每一個主成分變量(共16個)得分,每一個主成分變量都有19次試驗的結果。第四步,對第三步中求出的16個主成分得分變量S1,S2,…S16和試驗中先驗信息(實驗前測得的碳元素含量)Y進行多元線性回歸擬合,16個主成分得分變量作為自變量,碳元素含量作為因變量,求得碳含量Y與16個主成分變量的關系:Y=b0+b1S1+...+b16S16在Matlab中調用regress函數(最小二乘擬合法)求得上式中各項系數如表2所示:表2多元線性回歸方程擬合系數多元線性回歸擬合系數b07.000564b10.346845b2-0.015874b3-46.693979b4-33.287644b555.128680b67.827610b72.922307b84.568449b9-20.499940b10-40.594263b1196.927876b125.312227b1314.558073b14123.090712b15-58.641999b169.248874運用擬合后得出的關系模型方程求解碳含量,實驗前測得燃燒體碳含量真實值如表3所示:表3碳含量真實值試驗次數n碳含量真實值121.000000220.000000318.000000420.000000518.480000625.040000729.350000819.000000924.0000001019.6000001125.0000001225.3100001330.0000001427.7500001515.1700001620.0000001717.9200001820.4400001914.280000運用擬合出的方程求出的碳含量如表4所示:表4碳含量測量值試驗次數n碳含量測量值122.214923220.845078318.373913420.355424518.524505623.565235728.691861818.742529922.5098771019.1909071123.6021001226.4471841331.4596071427.5989981515.6130331621.4848461718.4724771821.3421101915.508944經分析可知,本發明通過建立主成分分析模型和多元線性回歸模型,通過分析燃燒體的發射光譜的光強度值進行元素含量的測定,碳含量真實值和預測值之間的誤差比較少,測量精度較高、方法簡單高效。當前第1頁1 2 3