官术网_书友最值得收藏!

2.1 絕對誤差度量

下面介紹幾個常用的絕對誤差度量。

2.1.1 均方根誤差(RMSE)度量

目前工程中廣泛應用的性能評估指標為均方根誤差(RMSE)度量,其具體定義為

式中,M為蒙特卡洛實驗次數,“i”表示第i次蒙特卡洛實驗,記x分別為待估量和估計量,估計誤差,

均方根誤差(RMSE)與標準差之間的關系如下:

標準差(均方差)反映的是估計值與均值的關系,而RMSE反映的是估計值與真實值之間的關系。因此,標準差用來衡量估計器估計結果自身的離散程度,而RMSE用來衡量估計器估計值同真實值之間的偏差;它們的研究對象和研究目的不同,但是計算過程類似。對于標量的無偏估計器來說,RMSE實際上是對估計誤差標準差的有限樣本近似,而標準差是概率分析中的一個重要參數;因此,RMSE對標量情況下的概率分析有很大意義。

然而,RMSE有著很大的缺陷。首先,它受數值大的估計誤差主導,數值小的誤差很容易被忽視掉;其次,通過RMSE的定義,RMSE度量在評估估計器時明顯偏向于最小方差估計,即,其中Z表示所有的觀測集。此外,RMSE沒有很好的物理解釋。文獻[73]提出,應該用平均歐幾里得誤差(AEE)代替RMSE。

2.1.2 AEE度量

1.AEE的定義和性質

歐幾里得誤差(AEE)是另一個可供選擇的度量,其具體定義為

這一度量有著很好的物理解釋:在幾何上,是待估量x和估計量在物理空間中真實的算術平均距離;同時,AEE在估計誤差為標量且服從高斯分布的情況下,可以轉化為RMSE來滿足概率分析的需要。讓表示估計誤差的歐幾里得范數(即2范數),分別表示e的均值和方差,則有

式中,。AEE的期望值可以很好地表征估計誤差。由于AEE和分別是估計誤差的樣本均值和的期望值,所以AEE是的估計,且有著良好的性質[52]:

(1)無論的分布如何,AEE都是的無偏估計;

(2)AEE是的最小二乘估計,即使最小;

(3)AEE是的高斯-馬爾科夫估計器,在所有的的線性無偏估計中都使最小;

(4)若是隨機的,且先驗分布為均勻分布,則AEE是的最小均方誤差估計和最大后驗估計;

(5)若為指數分布、泊松分布、伯努利分布或(近似)高斯分布,且均值為,則AEE是的最大似然分布和一個最小充分統計量。

2.RMSE和AEE的比較

根據切比雪夫大數定律,隨著M→∞, RMSE2和AEE(幾乎肯定)分別趨向于標準差E( e2 )和期望值;再根據中心極限定理,隨著M→∞, RMSE2和AEE有漸近高斯分布,即

在受數值大的誤差項主導的問題上,AEE較RMSE有很大改善,RMSE和AEE都關注大的誤差,它們給出的評估結果均受大的誤差主導。比如, 100個誤差項中有99個值是1,一個誤差值是400,那么AEE給出的評估結果是5,而RMSE給出的評估結果將接近400,即:RMSE受大的誤差項主導而幾乎完全忽略了另外的99項。所以,RMSE作為一個度量是不公正、不理想的。

RMSE之所以在工程界這么受歡迎,主要原因在于它是標準差(MSE)的有限樣本近似,方便概率上的分析,而且計算簡單。我們知道,條件均值和中位數分別使MSE矩陣和歐幾里得平均距離最小化,因此使用RMSE進行度量明顯會偏向條件均值估計器。但是,AEE由于帶有絕對值,最小化時操作上的不便使得這一距離很少作為優化準則。基于此,文獻[73]推薦:若主要關心估計誤差的大小程度,則在進行性能評估時用AEE代替RMSE;因為AEE有一個直接、自然的解釋。當需要概率分析時,RMSE通常更方便。

2.1.3 調和平均誤差(HAE)度量

HAE是各統計誤差倒數的算術平均數的倒數。調和平均數是平均數的一種,由于它是根據變量的倒數計算的,所以又稱倒數均值。

HAE的具體定義為

HAE以調和平均數為基礎,它與RMSE和AEE相反,由小誤差主導,且注重一個估計的性能有多好,傾向于度量“好”的性能;因此,它是一個樂觀的衡量指標,適合評估多次蒙特卡洛實驗中估計誤差波動較大的估計器和軍事應用中的Hit-or-miss背景下的估計器。

調和平均數尤其適用于平均比率。調和平均數可以用在距離相同但速度不同時的平均速度的計算。例如一段路程,前半段速度為60 km/h,后半段速度為30 km/h(兩段距離相等),則其平均速度為兩者的調和平均數40 km/h。另外,假設一個人分別以速度v1v2v3從A城駕車至與其距離為L的B城,那么平均速度為

調和平均數有極小極大性質[87]。考慮近似已知區間為[a, b]的誤差的問題,其中表示e的一個估計。那么ab的調和平均數H(a, b)表示最大的可能相對誤差的極小值:

2.1.4 幾何平均誤差(GAE)度量

作為度量,RMSE、AEE、HAE都帶有傾向性,因此都不是一個理想的度量。一般情況下,在評估一個估計器的性能時,要得到一個無偏的評估結果,期望任何大的誤差都能被一個足夠小的誤差來中和或者平衡是合理的,即:大的估計誤差和小的估計誤差地位均等。GAE度量基于幾何均值可以滿足這一要求,它所受極值的影響比以上幾個度量有很大改善,可以表征更公正的性能評估結果。其具體定義為

由于數值問題,最好通過其對數形式進行計算:

若有一項或多項為零,則定義GAE的值為零。

GAE度量是對各誤差值的連乘積項開數次方根。求幾何平均數的方法叫作幾何平均法。當總水平、總成果等于所有階段、所有環節的水平、成果的連乘積總和時,求各階段、各環節的一般水平、一般成果,就要使用幾何平均法計算幾何平均數,而不能使用算術平均法計算算術平均數。

GAE度量的幾何意義如圖2-1所示。

圖2-1 GAE度量的幾何意義

算術平均數體現純粹數字上的關系;而稱為幾何平均數,它體現了一個幾何關系。作一正方形,使其面積等于長和寬分別為ab的矩形的面積,則該正方形的邊長即為ab的幾何平均數。中國古代數學書中提到的矩形面積,往往用長和寬的幾何平均數來表示。

2.1.5 RMSE、AEE、HAE和GAE之間的關系

對一個給定的估計誤差集合,有HAE≤GAE≤AEE≤RMSE。這一大小關系說明:大的估計誤差被RMSE放大得最明顯,而小的估計誤差則被HAE關注。其中等式僅在所有的誤差項相等時成立。另外,有

式中,是對待估量x的估計量。

2.1.6 誤差的中位數和眾數

給定誤差集合,誤差的中位數(Median Error, ME)為

在某些情況下,關注的是最可能出現的誤差項,即誤差的眾數(Error Mode, EM)。誤差的眾數是給定的誤差直方圖中最高點的位置。

主站蜘蛛池模板: 白朗县| 波密县| 嵊州市| 兴宁市| 三原县| 碌曲县| 永丰县| 南靖县| 高安市| 寿光市| 台州市| 上饶市| 安丘市| 正镶白旗| 克山县| 油尖旺区| 舟曲县| 宜良县| 涿鹿县| 民勤县| 周口市| 安吉县| 巴林左旗| 龙海市| 广汉市| 广灵县| 石渠县| 福建省| 小金县| 十堰市| 望谟县| 体育| 鱼台县| 巴东县| 伽师县| 莆田市| 龙门县| 临澧县| 贺兰县| 苍南县| 龙游县|