- 概率論與數理統計
- 龐淑萍 孫偉
- 1400字
- 2020-02-26 14:00:26
第三節 連續型隨機變量及其分布
一、連續型隨機變量
[定義1] 若對于隨機變量X的分布函數F(x),存在非負可積函數f(x),使得對于任意實數x,有
(2-3-1)
則稱X為連續型隨機變量,稱f(x)為X的概率密度函數,簡稱為概率密度或密度函數,記為X~f(x).概率密度函數的圖形稱為X的密度曲線.
根據定義可知概率密度具有以下性質:
①f(x)≥0;
②.
反之,若一個函數滿足上述性質,則該函數可以作為某個連續型隨機變量的概率密度函數.
連續型隨機變量分布函數有以下性質.
①對于一個連續型隨機變量X,若已知它的概率密度f(x),根據定義可以求得分布函數F(x),同時可以通過密度函數的積分來求X落在任何區間上的概率,即
(2-3-2)
②連續型隨機變量X取任一指定值a(a∈R)的概率為0,因為
因此,對連續型隨機變量X,有
P{a<X≤b}=P{a≤X<b}=P{a<X<b}=P{a≤X≤b}
由此性質可見,連續型隨機變量X取任意值a的概率為0,這說明概率為零的事件不一定是不可能事件.同樣,概率為1的事件也不一定是必然事件.
③若f(x)在x處連續,則有
F'(x)=f(x) (2-3-3)
【例2-3-1】 設隨機變量X的概率密度為
(1)求系數c;
(2)求X的分布函數;
(3)求P{2<X≤3.5}.
解:(1)根據概率密度的性質有
解得,因此,密度函數為
(2)當x<0時,;
當0≤x<3時,;
當3≤x≤4時,;
當x>4時,
因此
(3).
【例2-3-2】 設隨機變量X的分布函數為
(1)求概率P{0.3<X<0.7};
(2)X的概率密度.
解:(1)P{0.3<X<0.7}=F(0.7)-F(0.3)=0.4;
(2)X的概率密度為
二、幾種常用的連續分布
1.均勻分布
[定義2] 若連續型隨機變量X的概率密度為
稱X服從區間[a,b]上的均勻分布,記作X~U[a,b].
由定義可知:(1)f(x)≥0;(2).
均勻分布的分布函數為
對于任意的x1,x2∈[a,b](x1<x2),有
這表明均勻分布的隨機變量X落入[a,b]任意子區間的概率與該子區間的長度成正比,而與子區間的位置無關.
【例2-3-3】 某城市每天有兩班開往某旅游景點的列車,發車時間分別為早上7點30分和8點,設一游客到達車站的時刻均勻分布于早上7~8點之間,求此游客候車時間不超過20分鐘的概率.
解:設游客到達車站的時間為7點過X分,則X~U[0,60],因此X的概率密度為
游客只有在7:10~7:30之間或7:40~8:00之間到達車站,候車時間不超過20分鐘,因此所求概率為
2.指數分布
[定義3] 若連續型隨機變量X的概率密度為
其中λ>0為常數,則稱X服從參數為λ的指數分布,記作X~e(λ).
指數分布的分布函數為
指數分布常用來描述各種“壽命”,如電子元器件的壽命、動物壽命、隨機服務系統中的等候時間都服從指數分布.指數分布在可靠性理論和排隊輪中有廣泛的應用.
【例2-3-4】 設某電子元器件的壽命X(單位:小時)服從參數為的指數分布.
(1)求該元器件在使用800小時后仍沒有壞的概率;
(2)求在該元件已經使用了600小時未壞的條件下,它還可以再使用800小時的概率.
解:(1)元器件的壽命X的分布函數為
因此
(2)
上例(2)中的計算結果表明:P{X>1400│X>600}=P{X>800},即在元件使用了600小時未壞的條件下,可以再繼續使用800小時的概率,等于它從啟用起使用800小時不壞的無條件概率,這種性質稱為指數分布的“無記憶性”,相當于說,元器件對已使用過的600小時沒有記憶,不影響它以后使用壽命的統計規律.
3.正態分布
[定義4] 若連續型隨機變量X的概率密度為
其中μ、σ均為常數,且σ>0,則稱X服從參數為μ、σ2的正態分布,記作X~N(μ,σ2).
正態分布的概率密度具有以下性質:
①概率密度的圖形關于直線x=μ對稱,當x=μ時,f(x)達到最大值:;
②概率密度曲線在x=μ±σ處對應有拐點;
③概率密度曲線以x軸為水平漸近線.
正態分布的密度曲線也稱作正態曲線,它是一條鐘形曲線:中間高、兩邊低、左右對稱.從圖2-3-1、圖2-3-2中可以看出,參數μ確定了正態曲線的位置,而σ的大小決定了曲線的陡峭程度.

圖2-3-1

圖2-3-2
正態分布是概率論與數理統計中最重要的分布,很多隨機現象可以用正態分布描述或近似描述,例如:
①測量時產生的誤差ε是隨機變量,時大時小,時正時負,但是誤差大的可能性小,誤差小的可能性大,正負誤差出現的機會相同,這個特點與正態曲線“中間高、兩邊低、左右對稱”是吻合的,因此測量誤差服從正態分布;
②自動包裝流水線上生產的罐頭重量服從正態分布;
③同年齡人的身高與體重分別都服從正態分布;
④某個地區的年降雨量(單位:毫米)服從正態分布;
⑤超市在一周內售出的雞蛋的總重量服從正態分布.
正態分布的分布函數為
在正態分布中,當參數μ=0、σ=1時稱為標準正態分布,記作X~N(0,1),此時密度函數
分布函數
此時正態曲線見圖2-3-3.

圖2-3-3 正態曲線
x≥0時,標準正態分布的分布函數值Φ(x)由標準正態分布表(附表2)可查,由此來計算正態分布的概率,根據標準正態曲線的對稱性,可知,當x<0時
Φ(x)=1-Φ(-x) (2-3-4)
若X~N(0,1),則
①P{X≤x}=Φ(x)
②P{X>x}=1-Φ(x)
③P{x1<X≤x2}=Φ(x2)-Φ(x1)
④P{|X|≤x}=2Φ(x)-1,(x≥0)
【例2-3-5】 設X~N(0,1),求P{X≤-1.25}及P{-1.5<X<2.3}.
解:由附表2可查得Φ(1.25)=0.8944,于是
P{X≤-1.25}=Φ(-1.25)=1-Φ(1.25)=1-0.8944=0.1056
P{-1.5<X<2.3}=Φ(2.3)-Φ(-1.5)=Φ(2.3)-[1-Φ(1.5)]
=0.9893+0.9332-1=0.9225
任何一個一般的正態分布都可以通過線性變換轉化為標準正態分布.
定理 設X~N(μ,σ2),則.
證明 的分布函數
令,上式等于
即
P{Y≤x}=Φ(x)
因此
設X~N(μ,σ2),則X的分布函數
(2-3-5)
若X~N(μ,σ2),則
(1)
(2)
(3)
【例2-3-6】 設X~N(8,0.52),求P{|X-8|≤1}及P{X<10}.
解:
【例2-3-7】 設X~N(μ,σ2),求:
(1)P{μ-σ<X<μ+σ},
(2)P{μ-2σ<X<μ+2σ}
(3)P{μ-3σ<X<μ+3σ}
解:(1)
(2)
(3)
由此看出:X的取值大部分落在區間(μ-σ,μ+σ)內,基本上落在區間(μ-2σ,μ+2σ)內,幾乎全部落在區間(μ-3σ,μ+3σ)內,落在以μ為中心、3σ為半徑的區間外的概率不到0.003.
從理論上講,服從正態分布的隨機變量X的取值范圍是(-∞,+∞),但實際上X取區間(μ-3σ,μ+3σ)外的數值的可能性微乎其微.因此,往往認為它的取值是個有限區間,即區間(μ-3σ,μ+3σ),即實用中的三倍標準差規則,也叫3σ規則.在企業管理中,經常應用這個規則進行質量檢查和工藝過程控制.
【例2-3-8】 某廠生產罐裝咖啡,每罐標準重量為1千克,長期生產實踐表明自動包裝機包裝的每罐咖啡的重量X服從參數σ=0.1千克的正態分布.為了使重量少于1千克的罐頭數不超過10%,應把自動包裝線控制的平均值μ調節到什么位置上?
解:X~N(μ,0.12),若把自動包裝線控制的在μ值調節到1千克位置,則有:
即重量少于1千克的罐頭占全部罐頭數的50%,這顯然不符合要求.所以應該把自動包裝線控制的μ值調節到比1千克大一些的位置,使得
查附表2可得Φ(1.29)=0.90147>0.9,得μ=1+0.1×1.29=1.129.
即將包裝控制的平均值μ調節到1.129處,可使得少于1千克的罐頭數不超過10%(見圖2-3-4、圖2-3-5).

圖2-3-4

圖2-3-5