- 因果推斷:基于圖模型分析
- 羅銳編著
- 10字
- 2023-08-28 19:18:56
2.1 隨機變量和隨機事件
2.1.1 隨機變量
我們將對社會現象和自然現象進行的測量以及各種科學試驗統稱為試驗。其中,具有以下特征的試驗稱為隨機試驗:
● 可在相同條件下重復進行;
● 試驗的全部可能結果在試驗前就已明確;
● 在一次試驗結束之前,不能確定性地預測會出現哪一個結果。
比如,拋硬幣觀察哪一面朝上就是一個隨機試驗,它滿足隨機試驗的三個條件:拋硬幣觀察哪一面朝上可以在相同條件下重復地進行;在試驗前我們就知道可能的結果只有兩個,即正面朝上或反面朝上;在拋硬幣結束之前,我們無法確定這次拋硬幣的結果中到底是哪一面朝上。
在隨機試驗中,具有多個不確定取值的屬性或者對不確定問題結果的描述,稱為隨機變量(后續一般簡稱為變量)。比如,在拋硬幣觀察哪一面朝上這個隨機試驗中,我們可以將哪一面朝上這個結果視為一個隨機變量,其有兩個取值:正面朝上或反面朝上。在統計學校里學生身高與體重關系的調查中,學生的身高這個屬性是一個隨機變量,我們表示為X,學生的體重也是一個隨機變量,我們表示為Y。一個學生的身高是175cm,也就是身高這個隨機變量的取值是175cm,即X=175cm。同樣,一個學生的體重是60kg,也就是體重這個隨機變量的取值是60kg,即Y=60kg。
根據取值情況,隨機變量又分為離散變量和連續變量兩種類型。若隨機變量的取值為有限多個值或者無限多個可列值,則稱該隨機變量為離散變量。比如,描述燈開關狀態的隨機變量是離散變量,因為這個變量的取值只有兩個,即“開”和“關”;描述患者用藥后治愈分類情況的隨機變量也是離散變量,因為這個變量的取值只有三個,即“狀況變好”“狀況變差”和“狀況不變”。若隨機變量可以在一個有限或無限的連續區間上取無窮多個值,則稱該隨機變量為連續變量。連續區間就是對于區間中的任意兩個數值,都存在第三個數值落于這兩個數值之間。比如,在統計學生的身高與體重的關系時,學生的體重就是連續變量,因為體重的取值是連續區間上的一個正實數,且可以取無窮多個值。同樣,學生的身高也是連續變量。需要注意的是,一個變量是連續變量還是離散變量,是針對具體的隨機試驗而言的。一個變量可能在一個隨機試驗中是連續變量,而在另一個隨機試驗中是離散變量。比如測量小孩身高這個隨機試驗,小孩的身高是一個變量。假如我們這個隨機試驗是統計小孩的身高情況,那么小孩身高這個變量的取值就是大于0的正實數,是連續變量;如果我們這個隨機試驗是查看小孩的身高,用于判斷小孩乘車是該購買半票還是全票,那么小孩身高這個隨機變量就只有大于等于1.2米和不到1.2米兩個取值,是一個離散變量。