官术网_书友最值得收藏!

2011年中山大學432統計學[專業碩士]考研真題及詳解

一、單項選擇題(30小題,每小題2分,共60分。在每小題給出的四個選項中,只有一個符合題目要求,請將所選正確答案對應的字母寫在答題紙上,并標明題號)

1為調查在中國的省會城市和4個直轄市的居民年收入,需要從這些城市的居民中抽取一個樣本,你認為以下四種抽樣方式哪一種會得到更有代表性的樣本?(  )

A.簡單隨機抽樣

B.整群抽樣

C.系統隨機抽樣

D.分層隨機抽樣

【答案】D

【解析】在規模較大的調查中,很少直接采用簡單隨機抽樣,一般是把這種方法和其他抽樣方法結合在一起使用。系統隨機抽樣是先將總體中各單位按一定的順序排列,然后每隔一定的距離抽取一個單位構成樣本。整群抽樣又稱聚類抽樣,是將總體中若干個單位合并為組,這樣的組稱為群,抽樣時直接抽取群,然后對中選群中的所有單位全部實施調查。分層抽樣是將抽樣單位按某種特征或某種規則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本。分層抽樣的優點是由于通過劃類分層,增大了各類型中單位間的共同性,容易抽出具有代表性的調查樣本,且抽樣誤差比較小。該方法適用于總體情況復雜,各單位之間差異較大,單位較多的情況,在調查中廣泛應用。

2根據有關專家的建議,51歲以下成年女性每日的鐵攝入量應為16毫克;為了解這一人群鐵攝入量的情況,有人抽取一個容量為45的樣本并取得她們在24小時內的鐵攝入量,所得數據列在下表:

以下圖表,哪一種可以讓我們迅速得到以上樣本數據的中位數與兩個四分位數?(  )

A.直方圖

B.餅圖

C.條形圖

D.莖葉圖

【答案】D

【解析】條形圖、餅圖主要用于展示分類數據,直方圖則主要用于展示數值型數據,描述分組數據的分布。莖葉圖用于顯示未分組的原始數據的分布,由“莖”和“葉”兩部分構成,其圖形是由數字組成的,以該組數據的高位數值作樹莖,低位數字作樹葉,樹葉上只保留最后一位數字。由于莖葉圖上沒有原始數據信息的損失,包括中位數、四分位數在內的所有數據信息都可以從圖中獲得。

3在第2小題中,經過計算可知,樣本平均值為14.680,樣本標準差為3.083;假定每日的鐵攝入量近似服從正態分布,根據以上數據,在5%水平下可以認為51歲以下成年女性的鐵攝入量(  )。

A.跟建議值沒有顯著差別

B.顯著偏低

C.顯著偏高

D.無法判斷

【答案】B

【解析】假設:H0:μ=16,H1:μ≠16。統計量

當α=0.05時,zα/2=1.96。因為|z|>zα/2,所以拒絕原假設,接受備擇假設。又因為14.680<16,所以51歲以下成年人女性的鐵攝入量顯著偏低。

4美國汽車制造商協會想了解消費者購車時的顏色偏好趨勢,抽取新近售出的40輛車并記錄其顏色種類(黑、白、紅、綠、棕)和深淺類型(亮色、偏淡、中等、偏濃);你認為以下展示數據的圖表中,哪一種不適合用來處理這一樣本數據?(  )

A.散點圖

B.餅圖

C.條形圖

D.頻數圖

【答案】A

【解析】散點圖是用二維坐標展示兩個變量之間關系的一種圖形。它是以坐標橫軸代表變量X,縱軸代表變量Y,每組數據(Xi,Yi)在坐標系中用一個點表示,n組數據在坐標系中形成的n個點稱為散點,由坐標及其散點形成的二維數據圖。散點圖處理的是數值型數據,而題干中的顏色種類與深淺類型屬于分類數據,所以是不適合的。

5現有一份樣本,為100名中學生的IQ分數,由此計算得到以下統計量:樣本平均(mean)=95,中位數(median)=100,下四分位數(lower quartile)=70,上四分位數(upper quartile)=120,眾數(mode)=75,標準差(standard deviation)=30。則關于這100名中學生,下面哪一項陳述正確?(  )

A.有一半學生分數小于95

B.有25%的學生分數小于70

C.中間一半學生分數介于100到120之間

D.出現頻次最高的分數是95

【答案】B

【解析】一半學生分數小于中位數,即100;中間一半學生分數介于下四分位到上四分位之間,即介于70到120之間;出現頻次最高的分數是眾數,即75。下四分位數是指該樣本中所有數值由小到大排列后第25%的數字,從題干中可知有25%的學生分數小于70。

6若總體服從均值為μ標準差為σ的正態分布;從中抽出一個容量為10的簡單隨機樣本,則樣本平均的抽樣分布為(  )。

A.N(μ,σ2/10)

B.N(μ/10,σ2

C.N(μ/10,σ2/100)

D.N(μ,σ2/100)

【答案】A

【解析】當總體分布為正態分布N(μ,σ2)時,可以得到下面的結果:的抽樣分布仍為正態分布,的數學期望為μ,方差為σ2/n,則~N(μ,σ2/n)。

7關于方差分析,下列說法正確的是(  )。

A.方差分析的目的是分析各組總體方差是否相同

B.方差分析的組間均方僅僅衡量了隨機誤差的變異大小

C.各組數據呈嚴重偏態時,也可以作方差分析

D.方差分析的目的是分析各組總體的均值是否相同

【答案】D

【解析】方差分析就是通過檢驗各總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。如果分析數據來自相同總體,那么在組間誤差中只包含隨機誤差,而沒有系統誤差。反之,如果分析數據來自不同總體,在組間誤差中除了包含隨機誤差外,還會包含系統誤差。方差分析中有三個基本假定:每個總體都應服從正態分布;各個總體的方差σ2必須相同;觀測值是獨立的。

8以下統計方法中,哪一種不能用來研究變量之間的關系?(  )

A.樣本比例估計

B.列聯表分析

C.一元線性回歸

D.多元線性回歸

【答案】A

【解析】列聯表分析也稱為獨立性檢驗,是分析兩個變量之間是否有關聯;回歸分析則側重于考察變量之間的數量伴隨關系,并通過一定的數學表達式將這種關系描述出來,進而確定一個或幾個變量(自變量)的變化對另一個特定變量(因變量)的影響程度;樣本比例估計是用樣本比例p估計總體比例π,不能用來研究變量之間的關系。

9如果把α從5%降到2.5%,則置信程度為1-α的樣本平均的置信區間的寬度將(  )。

A.增加

B.不變

C.降低

D.可能增加,也可能降低

【答案】A

【解析】當樣本量給定時,置信水平(1-α)越高,置信區間的寬度越長。從直覺上說,區間比較寬時,才會使這一區間有更大的可能性包含參數的真值。

10在假設檢驗中,如果檢驗結果是拒絕零假設;那么,以下哪一種情形的檢驗結果更顯著?(  )

A.樣本平均值更小

B.P-值更小

C.樣本平均值更大

D.P-值更大

【答案】B

【解析】P值就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果P值很小,說明這種情況發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,P值越小,我們拒絕原假設的理由就越充分,因此檢驗結果就更顯著。

111998年的一次網絡民意調查中,共7553人接受調查,其中4381人認為:“白水事件”調查執行官Kenneth Start應該詢問所有可以找到的證人,包括時任總統克林頓的助手;由此,你能得出以下哪一個結論?(  )

A.以上數據提供了充分證據,說明多數人認為Kenneth Start應該詢問所有可以找到的證人,包括時任總統克林頓的助手

B.以上數據未提供充分證據,說明多數人認為Kenneth Start應該詢問所有可以找到的證人,包括時任總統克林頓的助手

C.以上數據提供了充分證據,說明多數人認為Kenneth Start不應詢問所有可以找到的證人,包括時任總統克林頓的助手

D.以上數據未提供充分證據,說明多數人認為Kenneth Start不應詢問所有可以找到的證人,包括時任總統克林頓的助手

【答案】A

【解析】本題屬于總體比例的檢驗,假設:H0:π≤50%,H1:π>50%,其中π為總體中認為“應該”的調查者所占的比例。樣本比例p=(4381/7553)×100%=58.00%,

z>z0.001=3.09,所以在0.001的顯著性水平下,拒絕原假設。即有充分證據說明:多數人認為應該詢問所有可能找到的證人,包括克林頓的助手。

12一元線性回歸中,以下哪一種殘差圖特點可以說明回歸模型的運用是不合理的?(  )

A.殘差落在一水平直線附近

B.殘差落在一傾斜直線附近

C.殘差的正態概率圖大致落在一條直線附近

D.殘差關于一水平直線大致對稱

【答案】B

【解析】若對所有的x值,ε的方差都相同,而且假定描述變量x和y之間關系的回歸模型是合理的,那么殘差圖中的所有的點都應落在一條水平帶中間。如果對所有的值,ε的方差是不同的,例如,對于較大的x值,相應的殘差也較大,這就意味著違背了ε方差相等的假設,由此可知B項正是此種情況。在標準化殘差圖中,大約有95%的標準化殘差在-2~2之間。

13考慮總體均值的95.44%置信區間,已知總體服從正態分布且標準差為10;要使得到的置信區間的半徑不超過1,需要的最小樣本容量為(  )。

A.100

B.400

C.900

D.1600

【答案】B

【解析】置信度為95.44%時,由正態分布的3σ原則可知zα/2=2,則

解得n≥400。

14官方數據顯示,2008年,北京地區移動電話用戶的月均電話費為50元;從2009年3月份的用戶費用清單中,隨機抽取40人,發現他們的月均話費為60元;移動電話公司想通過假設檢驗來判斷“2009年的月均話費是否顯著提高”,設定零假設為“H0:2009年和2008年的月均話費沒有顯著差別”,那么,備擇假設應該選取為(  )。

A.H1:跟2008年相比,2009年的月均話費有顯著減少

B.H1:跟2008年相比,2009年的月均話費沒有顯著減少

C.H1:跟2008年相比,2009年的月均話費有顯著增加

D.H1:跟2008年相比,2009年的月均話費沒有顯著增加

【答案】C

【解析】原假設與備擇假設互斥,肯定原假設,意味著放棄備擇假設;否定原假設,意味著接受備擇假設。由于假設檢驗是圍繞著對原假設是否成立而展開的,所以有些文獻上也把備擇假設稱為替換假設,表明當原假設不成立時的替換。根據定義可知備擇假設H1為:跟2008年相比,2009年的月均話費有顯著增加。

15X1,X2,…,Xn為獨立同分布的隨機樣本,設統計量T(X1,X2,…,Xn)為μ=E(X)的無偏估計量。下面哪項指標小,表示用該統計量估計均值μ的可靠性好?(  )

A.var[T(X1,X2,…,Xn)]

B.E[T(X1,X2,…,Xn)]

C.var(X)

D.max{X1,X2,…,Xn}-min{X1,X2,…,Xn}

【答案】A

【解析】統計量的可靠性即指有效性,有效性是指對同一總體參數的兩個無偏估計量,有更小標準差的估計量更有效。設θ1,θ2都是θ的無偏估計量,且Var(θ1)≤Var(θ2),θ1,θ2∈Θ,則稱θ1比θ2更有效。故選用統計量T(X1,X2,…,Xn)的方差。

16考慮關于兩個正態總體的均值μ1與μ2的假設檢驗,經常用到的零假設為(  )。

A.H0:μ1+μ2=0

B.H0:μ1-μ2=0

C.H0:μ1×μ2=0

D.H0:μ1÷μ2=0

【答案】B

【解析】關于兩個正態總體的均值μ1與μ2的假設檢驗,經常需要檢驗的是兩個均值是否相等,所以用到的零假設為μ1-μ2=0。

17設{Xt}是平穩時間序列,則下面陳述不正確的是(  )。

A.t時刻的均值E(Xt)不依賴t

B.t時刻的方差Var(Xt)不依賴t

C.t時刻與s(s≠t)時刻的協方差cov(Xt,Xs)不依賴t,也不依賴s

D.t時刻與s時刻的協方差與t+1,s+1時刻的協方差相等,即Cov(Xt,Xs)=Cov(Xt+1,Xs+1)

【答案】C

【解析】如果時間序列{Xi}滿足如下三個條件,則稱{Xi}為平穩時間序列。任取t∈T,有E(Xt)=μ,μ為常數;任取t∈T,有E(Xt2)<∞;任取t,s,k∈T,且k+s-t∈T,則Cov(Xt,Xs)=Cov(Xk,Xk+s-t),Var(Xt)=Var(Xt-s)=σ2

18假設檢驗中,若零假設是簡單的,則顯著性水平α指(  )。

A.犯第一類錯誤的概率

B.犯第二類錯誤的概率

C.置信水平

D.P-值

【答案】A

【解析】假設檢驗遵循的原則是:在嚴格控制犯第一類錯誤概率的條件下,盡量控制犯第二類錯誤的概率。為了突出這個原則,把犯第一類錯誤的概率又稱作為顯著性水平α。

19在回歸變量Y關于預測變量x的回歸分析中,若以x為橫坐標,y為縱坐標,繪散點圖,最小二乘原則是指(  )。

A.各點到直線的垂直距離的和最小

B.各點到X軸的縱向距離的平方和最小

C.各點到直線的垂直距離的平方和最小

D.各點到直線的縱向距離的平方和最小

【答案】D

【解析】最小二乘法也稱為最小平方法,它是用最小化垂直方向的離差平方和來估計參數的方法,根據最小二乘法使∑(y-2最小,故選D項。

20欲調查兩變量X和Y的相互關系,收集一份數據作線性相關分析,經計算得到樣本相關系數r=0.38,可以說(  )。

A.X和Y無關,因r值較小

B.不能確定X和Y是否相關以及相關密切程度,因不知n的大小

C.雖然X和Y相關,但不能認為X和Y有因果關系

D.因r>0,可以認為X和Y存在線性相關關系

【答案】C

【解析】對于一個具體的r取值,根據經驗可將相關程度分為以下幾種情況:當|r|≥0.8時,可視為高度相關;0.5≤|r|<0.8時,可視為中度相關;0.3≤|r|<0.5時,視為低度相關;當|r|<0.3時,說明兩個變量之間的相關程度極弱,可視為不相關。此外|r|→0說明兩個變量之間的線性關系越弱;|r|→1說明兩個變量之間的線性關系越強。r=0只表示兩個變量之間不存在線性相關關系,并不說明變量之間沒有任何關系,它們之間可能存在非線性相關關系。r雖然是兩個變量之間線性關系的一個度量,卻不一定意味著x與y一定有因果關系。

21假設檢驗難免犯錯誤,以下論斷中不正確的是(  )。

A.第一類錯誤是指零假設成立時,拒絕零假設

B.第二類錯誤是指零假設不成立時,接受零假設

C.其他條件不變,顯著性水平α定得越高,犯第一類錯誤的機會越小

D.其他條件不變,顯著性水平α定得越高,犯第二類錯誤的機會越小

【答案】C

【解析】第一類錯誤是指原假設H0為真卻被拒絕了,犯這種錯誤的概率用α表示,所以也稱α錯誤或棄真錯誤;第二類錯誤是指原假設為偽卻沒有被拒絕,犯這種錯誤的概率用β表示,所以也稱β錯誤或取偽錯誤。如果減小α錯誤,就會增大犯β錯誤的機會;若減小β錯誤,也會增大犯α錯誤的機會。

22以回歸方程Y=a+bX作相關分析與回歸分析中,關于樣本相關系數r與回歸系數b,下列各項中哪項是正確的?(  )

A.r>0時,b<0

B.r>0時,b>0

C.|r|=1時,|b|=1

D.|r|=1時,|b|=0

【答案】B

【解析】r>0說明y與x呈正線性相關關系,b表示的是直線的斜率,所以b>0。當|r|=1時,y的取值完全依賴于x,兩者之間即為函數關系,此時b的取值不確定。

232×2的析因試驗的方差分析中,若關于A、B兩個因素的主效應分別做假設檢驗,結論均為拒絕零假設;并且,關于A、B兩個因素的交互效應的假設檢驗結論為接受零假設,則可認為(  )

A.因素A的效應依賴于因素B的水平

B.因素A的效應不依賴于因素B的水平

C.因素A的主效應與因素B的主效應相等

D.兩個因素可舍二為一,采用單因素的方差分析

【答案】B

【解析】關于A,B兩個因素的主效應的假設檢驗,結論均為拒絕原假設,表明因素A和B都對因變量有顯著的影響。關于A、B兩個因素的交互效應的假設檢驗結論為接受零假設,說明沒有充分證據能證明因素A和因素B的交互作用對因變量存在顯著影響,即A、B兩個因素對因變量的影響是相互獨立的,所以因素A的效應不依賴于因素B的水平,因素B的效應不依賴于因素A的水平。

24根據某地6至16歲學生近視情況的調查資料,反映患者的年齡分布可用(  )。

A.線圖

B.散點圖

C.直方圖

D.條形圖

【答案】C

【解析】直方圖是用來反映數據的分布直觀形式,它的橫坐標代表變量分組,縱坐標代表各變量值出現的頻數。條形圖是用來反映分類數據的,反映數值型數據一般用直方圖;散點圖反映兩個變量間的關系;線圖主要用來反映現象隨時間變化的特征。

25設X1,X2…,Xn是來自正態總體N(μ,σ2)的一個隨機樣本,μ己知,定義三個統計量如下:

那么,下面論斷中,哪一項成立?(  )

A.S12是σ2的無偏估計

B.S2是σ的無偏估計

C.S3是σ的無偏估計

D.S32是σ2的無偏估計

【答案】D

【解析】根據方差定義可知E(Xi-μ)2=DXi=σ2,由于X1,X2…,Xn獨立同分布,所以

26隨機事件A,B,C中恰有兩個事件發生的復合事件為(  )。(這里,A∩B表示事件A與B都發生)

A.(A∩B)∪(A∩C)∪(B∩C)

B.

C.(A∩B∩)∪(A∩∩C)∪(∩B∩C)

D.(A∩)∪(∩C)∪(∩B∩

【答案】C

【解析】恰有兩個事件發生是指有兩個事件發生、另一個事件不發生,把三種情況求并集即為答案,故選C項。

27已知P(A)=0.4,P(B)=0.25,P(A-B)=0.25,則P(A∪B)=(  )。

A.0.4

B.0.5

C.0.6

D.0.65

【答案】B

【解析】對于任意兩個事件A、B來說,B不一定包含于A,而AB一定包含于A,可知A-B=A-AB,則P(A-B)=P(A)-P(AB)。又因為P(AB)=P(A)-P(A-B)=0.4-0.25=0.15。所以P(A∪B)=P(A)+P(B)-P(AB)=0.4+0.25-0.15=0.5。

28某種動物活到25歲以上的概率為0.8,活到30歲的概率為0.4,則現年25歲的這種動物活到30歲以上的條件概率是(  )。

A.0.76

B.0.5

C.0.4

D.0.32

【答案】B

【解析】記事件X為動物活的歲數。現年25歲的這種動物活到30歲以上的條件概率

29盒中有5個球,其中3個紅球,2個黑球。從中不放回的取,每次一個,則取兩次,每次都取到紅球的概率為(  )。

A.3/10

B.6/25

C.2/5

D.1/5

【答案】A

【解析】每次都取到紅球的概率p=(3/5)×(2/4)=3/10。

30投資某項目的收益率R是隨機變量,其分布見下表;某位投資者在該項目上投資1000元,他的預期收入和收入的方差分別為(  )元和(  )(元)2

A.50,10

B.1050,10

C.1050,80

D.50,80

【答案】C

【解析】預期利潤=1000×(4%×0.3+5%×0.5+6%×0.1+7%×0.1)=50(元);預期收入為1000+50=1050(元);預期收入的方差=(1000×4%-50)2×0.3+(1000×5%-50)2×0.5+(1000×6%-50)2×0.1+(1000×7%-50)2×0.1=80(元)2,所以C項正確。

二、簡要回答下列問題(本題包括1~4題共4個小題,每題10分,共40分)

1下面兩個統計圖分別是對某數據集中y關于x的線性回歸分析后的殘差(Residuad)請指出這個回歸分析所存在的問題,并提出解訣方案。

答:由殘差圖可知,兩個變量之間可能為非線性關系。表明所選擇的線性回歸分析模型不合理,應該考慮選用非線性模型。處理非線性回歸的基本方法是,通過變量變換,將非線性回歸化為線性回歸,然后用線性回歸方法處理。假定根據理論或經驗,已獲得輸出變量與輸入變量之間的非線性表達式,但表達式的系數是未知的,要根據輸入輸出的n次觀察結果來確定系數的值。按最小二乘法原理來求出系數值。

此外,殘差連續的出現在橫坐標軸的上面或下面,兩個變量也可能存在正自相關問題,即線性回歸模型擾動項的方差-協方差矩陣的非主對角線的元素不全為0,存在擾動項的自相關。可以采用DW檢驗,檢驗方程是否存在一階自相關問題,或采用LM檢驗高階自相關問題。如果存在自相關,可以采用可行廣義最小二乘法(FGLS),或仍用OLS法,但使用方差-協方差矩陣的穩健估計值。

2考慮總體參數θ的估計量,簡述無偏估計量與最小方差無偏估計量的定義。

答:(1)無偏性(unbiasedness)是指估計量抽樣分布的數學期望等于被估計的總體參數。設總體參數為θ,所選擇的估計量為,如果E()=θ,則稱為θ的無偏估計量。對于待估參數,不同的樣本值就會得到不同的估計值。這樣,要確定一個估計量的好壞,就不能僅僅依據某次抽樣的結果來衡量,而必須由大量抽樣的結果來衡量。對此,一個自然而基本的衡量標準是要求估計量無系統偏差。盡管在一次抽樣中得到的估計值不一定恰好等于待估參數的真值,但在大量重復抽樣時,所得到的估計值平均起來應與待估參數的真值相同,即希望估計量的均值應等于未知參數的真值,這就是無偏性的要求。

(2)最小方差無偏估計(UMVUE)是在無偏估計類中使均方誤差達到最小的估計量,即在均方誤差最小意義下的最優估計,它是在應用中人們希望尋求的一種估計量。設是θ的一個無偏估計量,若對于θ的任一方差存在的無偏估計量,都有

則稱是θ的一致最小方差無偏估計。

3欲調查廣州市初中學生的身高情況,隨機抽取100名廣州市初中學生,測量了身高。

1)用此例說明這幾個統計概念,總體(population),樣本(sample),參數(pammeter),統計量(statistics)。

2)請說明如何對這100例身高數據進行描述性統計分析。

答:(1)總體(population)是包含所研究的全部個體(數據)的集合,它通常由所研究的一些個體組成。本例中的總體是廣州市所有初中學生的身高。

樣本(sample)是從總體中抽取的一部分元素的集合,構成樣本的元素的數目稱為樣本量(sample size)。本例中的樣本是隨機抽取的100名廣州市初中學生的身高,其中樣本量為100。

參數(parameter)是用來描述總體特征的概括性數字度量,它是研究者想要了解的總體的某種特征值。本例中廣州市所有初中學生的平均身高即是一個參數。

統計量(statistic)是用來描述樣本特征的概括性數字度量。它是根據樣本數據計算出來的一個量,由于抽樣是隨機的,因此統計量是樣本的函數。隨機抽取的100名廣州市初中學生的平均身高即是一個統計量。

(2)所謂描述性統計分析,就是對一組數據的各種特征進行分析,以便于描述測量樣本的各種特征及其所代表的總體的特征。主要包括集中趨勢的描述,可計算身高的均值、中位數和眾數,也可采用箱線圖直觀的反映數據的集中趨勢以及是否存在異常值;離散程度的描述,可計算身高的方差、變異系數、四分位差或極差,也可采用折線圖或散點圖等直觀反映數據的離散程度;分布的偏態與峰度描述,可計算偏度和峰度值,或采用莖葉圖或直方圖直觀的反映分布是否與正態分布或單峰偏態分布逼近。

4在投擲一枚均勻硬幣進行打賭時,出現正面時投擲者贏5元,出現反面時輸3元,記投擲者贏錢數為X。試寫出此問題的樣本空間Ω,以及隨機變量X的定義和概率分布。

解:記贏錢數為X,ω為投擲后出現的兩種結果,則樣本空間為Ω={正面,反面},其中ω∈Ω,則ω的函數定義為:

則有P(X=-3)=P{出現反面}=1/2,P(X=5)=P{出現正面}=1/2

于是X的概率分布為:

三、計算與分析題(本題包括1~3題共3個小題,前兩題每題20分,第三小題10分,共50分)

1一油漆制造商宣稱,他們生產的一種新型乳膠漆的平均干燥時間為120分鐘;為檢驗這一數值是否屬實,從該種乳膠漆中隨機抽出20罐做試驗,發現它們的干燥時間(分鐘)為:123,109,115,121,130,127,106,120,116,136,131,128,139,110,133,122,133,119,135,109;

1)假定干燥時間近似服從正態分布,在5%的顯著性水平下,檢驗以上數據是否提供充分證據說明這種乳膠漆的平均干燥時間大于制造商宣稱的120分鐘,要求給出零假設、備擇假設、檢驗統計量、檢驗結果。(經計算可知,樣本平均值為123.1,樣本標準差為10.0,自由度為19的t分布的0.05上側分位數為1.729)

2)給出平均干燥時間μ的10%置信區間(要求給出樞軸量、置信區間的最后結果)

3)簡述上述假設檢驗問題和置信區間問題的主要聯系?

解:(1)由于干燥時間近似服從正態分布,總體方差未知,且樣本量較小,所以采用t統計量。

建立單側假設檢驗:H0:μ≤120;H1:μ>120

已知條件為:μ0≤120,=123.1,s=10.0,n=20,α=0.05。

因為顯著性水平0.05,自由度為19的單側臨界值t0=1.729,而t<t0,樣本統計量落在非拒絕域,故不能拒絕H0,即還不能充分證明這種乳膠漆的平均干燥時間大于制造商宣稱的120分鐘。

(2)由于總體方差未知,且樣本量較小,所以采用t統計量。已知條件為:=123.1,s=10.0,n=20,α=0.1。樞軸量為

所以平均干燥時間μ的置信區間為:

即(119.2,127.0),即平均干燥時間μ的10%的置信區間為119.2分鐘~127.0分鐘。

(3)假設檢驗問題和置信區間問題的主要聯系如下:

第一,區間估計與假設檢驗都是根據樣本信息對總體參數進行推斷,都是以抽樣分布為理論依據,都是建立在概率基礎上的推斷,推斷結果都有一定的可信度或風險;

第二,對同一問題的參數進行推斷,二者使用同一樣本、同一統計量、同一分布,因而二者可以相互轉換。區間估計問題可以轉換成假設檢驗問題,假設檢驗問題也可以轉換成區間估計問題。區間估計中的置信區間對應于假設檢驗中的接受域,置信區間以外的區域對應于假設檢驗中的拒絕域。

2欲調查噪聲強度對學生完成作業的準確度的影響,隨機抽取了15名學生,分配到低噪聲組,中噪聲組,高噪聲組中,得到準確度均數與方差如下表:

樣本平均

樣本方差

附:分子自由度為df1,分母自由度為df2的α=0.05對應的F界值表

1)計算完成方差分析表,并說明噪聲強度能解釋作業準確度的變異的比例。

2)用α=0.05的顯著性水平,分析噪聲強度對作業準確度是否有影響。

3)要具體確定低噪聲組與中噪聲組間的準確度是否有差異,怎樣分析(不需計算)。

解:(1)計算全部觀測值的總均值:

計算各誤差平方和:

組間平方和:

組內平方和:

總平方和:SST=SSA+SSE=1290+567=1857

方差分析表如下所示:

R2=SSA/SST=1290/1857≈69%

即噪聲強度能解釋作業準確度的變異的比例為69%。

(2)從方差分析表可以看到,由于F=13.65>F0.05(2,12)=3.88,所以拒絕原假設H0,表明不同噪聲組之間的差異是顯著的,即噪聲對學生完成作業的準確度有影響。

(3)可以對低噪聲組與中噪聲組進行兩個總體均值是否相等的檢驗,看它們是否存在顯著差異。在一定的置信水平下,若兩個總體均為正態總體,但總體方差未知,可構造t檢驗統計量;若兩個總體非正態,但樣本量足夠大,可構造Z檢驗統計量。

3某公司的一種設備從甲、乙、丙三個廠進貨。甲、乙、丙三廠的進貨比例分別占30%,20%和50%,甲、乙、丙三廠生產的設備的次品率分別為3%,3%和2%。

(1)現從這批進貨中任取一件,求取到的設備是次品的概率;

(2)經檢驗發現取到的設備是次品,求該設備是丙廠生產的概率。

解:(1)記事件A1、A2、A3分別表示“產品來自甲、乙、丙廠”,事件B為取到次品。根據全概率公式可得

所以,從這批進貨中任取一件,取到設備是次品的概率為2.5%。

(2)根據貝葉斯公式:P(A3|B)=P(A3)P(B|A3)/P(B)=50%×2%/2.5%=40%,即,經檢驗發現取到的設備是次品,則該設備是丙廠生產的概率為40%。

主站蜘蛛池模板: 邻水| 双江| 广安市| 泸水县| 泌阳县| 五家渠市| 固镇县| 博客| 张家港市| 正安县| 城市| 苏尼特左旗| 三台县| 马边| 沿河| 文山县| 民和| 墨脱县| 郓城县| 茌平县| 蕉岭县| 崇仁县| 宜春市| 五河县| 阿拉善左旗| 沙湾县| 靖远县| 博罗县| 育儿| 普定县| 永嘉县| 乌鲁木齐县| 大埔区| 紫金县| 东光县| 毕节市| 宁陕县| 大庆市| 烟台市| 开远市| 瓮安县|