- Python概率統計
- 李爽編著
- 850字
- 2024-12-27 19:43:20
第2章 隨機變量及其分布
一個隨機試驗的結果全體構成一個基本空間S,可以把這個試驗的所有可能的結果用實數表示。例如當拋硬幣時,可能的結果是正面朝上和反面朝上。如果定義一個隨機變量X,當正面朝上時,X取值為1,當反面朝上時,X取值為0。又例如拋一個骰子,它所有可能的結果是1點、2點、……、6點,如果定義一個隨機變量X,當出現i點時取值為i。這樣定義的隨機變量是定義在Ω上取值為實數的函數。也就是說,基本空間S的每個點,都有實數軸上的點與其對應,由此可以利用現代數學工具來研究隨機現象。
對于隨機變量,主要關注它的以下4方面。
(1)分布律:隨機變量在實數軸取不同值的可能性大小的刻畫,是隨機變量的分布規律。
(2)分布函數:單調遞增的用于定義概率值的函數,是分布“規律”的另一種描述。
(3)分位數:分布函數的反函數,用于計算給定概率值的臨界點,在統計學中經常使用。
(4)隨機數:數值模擬中經常需要產生符合某種分布的隨機數,主要用于隨機模擬和計算。
分布函數(Cumulative Distribution Function, CDF)是概率統計中重要的函數,正是通過它,可用數學分析的方法來研究隨機變量。分布函數是隨機變量最重要的概率特征,分布函數可以完整地描述隨機變量的統計規律,并且決定隨機變量的一切其他概率特征。
分位數(Quantile),也稱分位點,是指將一個隨機變量的概率分布范圍分為幾個數值點,常用的有中位數(二分位數)、四分位數、百分位數等。
隨機數一般指偽隨機數,它是用確定性的算法計算出來的隨機數序列,并不真正隨機,但具有類似于隨機數的統計特征,如均勻性、獨立性等。在計算偽隨機數時,若使用的初值(種子)不變,則偽隨機數的數序也不變。偽隨機數可以用計算機大量生成,在模擬研究中為了提高模擬效率,一般采用偽隨機數代替真正的隨機數。模擬中使用的一般是循環周期極長并能通過隨機數檢驗的偽隨機數,以保證計算結果的隨機性。
本章介紹概率論的基本概念,主要包括以下內容:
(1)隨機變量及其分布函數。
(2)離散型隨機變量及其分布律。
(3)連續型隨機變量及其概率密度。
(4)隨機變量函數的分布。