- 分析測試統計方法和質量控制
- 曹宏燕等編著
- 1654字
- 2020-05-06 20:09:00
4.3 一元非線性回歸
在分析測試中,有一些自變量和因變量的關系并不是線性關系,而是某種非線性的關系。例如,原照相式的原子發射光譜分析,照相底版上譜線的黑度與其元素含量是對數關系。電位分析法中,離子對的氧化態和還原態活度比與其電極電位關系的能斯特(Nernst)方程亦是半對數關系。溶液的pH值與氫離子活度(濃度)是負對數關系。放射性測量中放射性強度與衰變時間的關系,在化學反應中反應速率與反應活化能的關系,不是直線而是指數關系。在許多情況下,非線性關系可通過適當的變量變換轉化成線性關系,就可以用上述線性回歸來處理,使復雜的非線性關系變換為簡單的線性關系。
現將幾種非線性關系的轉化簡述如下:
(1)半對數關系
(4-54)
令X=lgx,則半對數方程就變成線性方程:
(2)指數關系1
(4-55)
取對數
令Y=lny,a'=lna,則指數方程就變成線性方程:
(3)指數關系2
(4-56)
取對數
令Y=lny,a'=lna,X=1/x,則指數方程就變成線性方程:
(4)冪函數
(4-57)
取對數
令Y=lgy,X=lgx,a'=lga,則冪函數方程就變成線性方程:
(5)雙曲線關系
(4-58)
令,
,則雙曲線方程就變成線性方程:
(6)S形函數關系
(4-59)
或
令,
,則S形函數就變成線性方程:
表4-12列出了常見非線性關系函數及其曲線形狀和線性化關系變換方式。
表4-12 常見非線性關系函數及其曲線形狀和線性化關系變換方式

【例4-7】 為確定ICP-AES法測定低合金鋼和鑄鐵中的鎂分析方法的重復性限和再現性限,有14個實驗室對6個樣品同時進行協同試驗。經統計,6個樣品的鎂含量m與實驗室間再現性限R的關系為:
m 0.1063 0.00372 0.1534 0.03222 0.06183 0.01617
R 0.00795 0.00130 0.00713 0.00277 0.00590 0.00235
已知m與R存在冪函數關系,求其回歸方程。
解 m與R間的冪函數關系為:
將其轉換為對數關系:
此對數關系即為一元一次線性方程,將m和R取對數,如表4-13所示。
表4-13 m與R的對數關系

將lgR對lgm回歸計算得,a'=-1.6804,b=0.5127,相關系數r=0.9702,m與R的對數關系為:
用冪函數表示,將a'換算為a,a=0.02086,
在試驗研究中,根據自變量和因變量關系的散點分布圖,可以擬合出它們的回歸方程。對不同的散點分布圖,有時可能擬合出多個回歸方程,此時可根據回歸方程的變動性的標準差確定最合適的回歸方程。
對非線性回歸方程,方程變動性的標準差為:
(4-60)
式中,Yi為按非線性回歸方程計算的回歸值;yi為測量值。
【例4-8】 轉爐出鋼時所用的鋼包,由于鋼水對耐火材料的侵蝕,鋼包的容積不斷增大。通過試驗數據,希望找出鋼包使用次數與其容積增大間的關系。積累的試驗數據如表4-14所示。
表4-14 鋼包容積試驗數據

解 將試驗數據點標在散點圖(圖4-7)上,可以看到,開始侵蝕的速度較快,然后逐漸減慢。顯然,鋼包侵蝕后的容積不會無限增加,它有一條平行于x軸的漸近線。試驗人員所關心的問題是哪一個回歸曲線更能真實反映使用次數和侵蝕量的關系。按散點分布(圖4-7),表4-12中的雙曲線函數和指數函數2的曲線圖與散點分布類似。

圖4-7 鋼包容積增大散點圖
設自變量試驗次數為x,因變量侵蝕后容積增大為y,以下分別按兩個函數式進行回歸。
(1)雙曲線函數回歸 雙曲線表達式為,令Y=1/y,X=1/x,則雙曲線方程就變成線性方程Y=a+bX,將x、y值變換為X=1/x和Y=1/y,其數值列于表4-15中。
表4-15 雙曲線函數回歸變換數據

計算線性方程Y=a+bX參數,得a=0.08222、b=0.1315和r=0.9684,回歸方程為:
即,,或表示為
。
(2)指數函數回歸 指數函數表達式為y=aeb/x,取對數,令Y=lny,X=1/x,a'=lna,則Y=a'+bX。將x、y值轉換為X和Y,其數值列于表4-16中。
表4-16 指數線函數回歸變換數據

計算其線性方程Y=a'+bX參數,得a'=2.458、b=-1.11和r=-0.9792,回歸方程為:
為比較兩回歸方程的適用性,表4-17分別列出了兩個回歸方程的測量值yi、回歸值和鋼包容積增大的標準差se。
表4-17 兩種回歸方式的測量值和回歸值對照表

比較表列數據,雙曲線方程的回歸值開始一段比測量值偏低,后一段又偏高,而指數方程的回歸值與測量值之差基本上是正負交替出現,回歸值與測量值吻合得較好。指數方程剩余標準差s2小于雙曲線方程剩余標準差s1。統計數據表明,指數擬合的回歸方程較好地描述了試驗結果。
在試驗研究數據處理時,選擇合適的回歸方程是很重要的,選擇回歸方程類型不合適,擬合效果就不理想。在理論根據不足或缺乏實踐經驗情況下,通常采用比較不同擬合曲線來選擇合適的回歸方程的方法。