官术网_书友最值得收藏!

第5章 相關關系

1解釋相關系數時應注意什么?

答:(1)相關系數是一個指標值,它表示兩個變量之間的關系程度。只能說絕對值大者比絕對值小者相關更密切一些,不能進行四則運算。

(2)相關系數值的大小表明了兩列測量數據相互間的相關程度。符號的不同只是表示方向的不同。

(3)相關關系不是因果關系,發現相關關系也并不是確定因果關系。相關值較大的兩類事物之間,不一定存在因果關系,這一點要從事物的本質方面進行分析,絕不可簡單化。

(4)如果研究表明某一變量確實對欲探討的兩個變量之間存在影響,則可以用協變量分析方法設法排除或控制那些變量的影響效應,找出要研究的變量之間真正的相關關系。如果兩變量是線性關系,則可以用偏相關和部分相關進行控制,表示兩個變量間純凈的相關度。

2假設兩變量為線性關系,計算下列各種情況的相關時,應用什么方法?

(1)兩列變量是等距或等比的數據且均為正態分布;

(2)兩列變量是等距或等比的數據但不為正態分布;

(3)一變量為正態等距變量,另一列變量也為正態變量,但人為分為兩類;

(4)一變量為正態等距變量,另一列變量也為正態變量,但人為分為多類;

(5)一變量為正態等距變量,另一列變量為二分名義變量;

(6)兩變量均以等級表示。

答:(1)積差相關法;

(2)斯皮爾曼等級相關法;

(3)二列相關法;

(4)肯德爾W系數;

(5)點二列相關法;

(6)肯德爾等級相關法。

3如何區分點二列相關與二列相關?

答:(1)點二列相關法就是考察兩列觀測值一個為連續變量(點數據),另一個為“二分”稱名變量(二分型數據)之間相關程度的統計方法。

二列相關法就是考察兩列觀測值一個為連續變量(點數據),另一個也是連續變量不過被按照某種標準人為的劃分的二分變量之間相關程度的統計方法。

(2)點二列相關與二列相關的區別

二列相關不太常用,但有些數據只適用于這種方法。在測驗中,二列相關常用于對項目區分度指標的確定。有時,某一題目實際獲得的測驗分數是連續性測量數據,這些分數的分布為正態,當人為地根據一定標準將其得分劃分為對與錯、通過與不通過兩個類別時,計算該題目的區分度就要使用二列相關。如果題目的類型屬于錯與對這樣的是非類客觀選擇題,計算該題目的區分度就應該選用點二列相關。

二者之間的主要區別是二分變量是否為正態分布??偟脑瓌t是,如果不是十分明確,觀測數據的分布形態是否為正態分布,這時,不管觀測數據代表的是一個真正的二分變量,還是一個基于正態分布的人為二分變量,這時就用點二列相關。當確認數據分布形態為正態分布時,都應選用二列相關。只要有任何疑問,選用點二列相關總是較好的選擇。在實際的研究當中,二列相關很少使用。

4品質相關有哪幾種?各種品質相關的應用條件是什么?

答:(1)品質相關的種類

品質相關用于表示R×C(行×列)表的兩個變量之間的關聯程度。品質相關依二因素的性質及分類項目的不同,而有不同的名稱和計算方法。主要有四分相關、Φ相關、列聯表相關等。

(2)各種品質相關的應用條件

四分相關適用條件

四格表的二因素都是連續的正態變量,如學習能力,身體狀態等,只是人為將其按一定標準劃分為兩個不同的類別,如“好”與“不好”,“對”與“錯”等,即一因素劃分為“A”與“非A”兩項,另一因素劃分為“B”與“非B”兩項。

φ系數適用條件

兩個變量分布都是真正的二分變量,在兩個分布中間都各有一個真正的缺口。

列聯相關適用條件

當數據屬于R×C表的計數資料,欲分析所研究的二因素之間的相關程度,就要應用列聯相關。當雙變量的測量型數據被整理成次數分布表后,也可用列聯相關系數表示兩變量的相關程度。

5欲考察甲乙丙丁四人對十件工藝美術品的等級評定是否具有一致性,用哪種相關方法?

答:應該用肯德爾W系數。肯德爾W系數,又稱肯德爾和諧系數,是表示多列等級變量相關程度的一種方法,適用于兩列以上的等級變量。

6下表是平時兩次考試的成績分數,假設其分布為正態,分別用積差相關與等級相關方法計算相關系數,并回答,就這份資料用哪種相關法更恰當?

答:

(1)積差相關計算相關系數

(2)等級相關計算相關系數

7下列兩變量為非正態,選用恰當的方法計算相關。

答:兩列非正態的變量用斯皮爾曼等級相關求相關系數。

由于兩列變量中有相同等級,因此應用相同等級計算等級相關的方法。

這兩列變量的等級相關系數為0.97。

8問下表中成績與性別是否有關?

答:設p為女生比率;q為男聲比率;X(_)p為女生的平均分;X(_)q為男生的平均分;

計算p=5/10=0.5,q=1-p=0.5,X(_)p=91,X(_)q=85,st=3.8

上表中成績與性別有很強的相關,相關系數為0.789。

9第8題的性別若是改為另一種成績A(正態分布)的及格、不及格兩類,且知1、3、5、7、9被試的成績A為及格,2、4、6、8、10被試的成績A為不及格,請選用適當的方法計算相關,并解釋之。

答:

設st是所有學生成績的標準差;

X(_)p為與成績A及格對偶的成績B的平均數;

X(_)q為與成績A不及格對偶的成績B的平均數;

p為及格人數在總人數中所占的比率;

q為不及格人數在總人數中所占的比率。

計算st=3.8,X(_)p=88.2,X(_)q=87.8,p=q=0.5,y=0.3989

代入公式得

故成績A與成績B的相關很小,成績A的變化與成績B的變化幾乎沒有關系。

10下表是某新編測驗的分數與教師的評價等級,請問測驗成績與有教師評定之間是否有一致性?

答:測驗分數可以看作正態分布,由于教師評定等級為四等。因此這是一個四系列相關問題。

設X(_)1為獲得教師優評定的被試的平均成績,P1為獲得優的被試比例;

X(_)2為獲得教師良評定的被試的平均成績,P2為獲得良的被試比例;

X(_)3為獲得教師中評定的被試的平均成績,P3為獲得中的被試比例;

X(_)4為獲得教師及格評定的被試的平均成績,P4為獲得及格的被試比例;

計算P1=0.32,P2=0.21,P3=0.29,P4=0.18,x(_)1=69.78,x(_)2=59.5,x(_)3=44.8,x(_)4=25,由pi查正態分布表求出對應得yL-yH

優:下限p=0.5-p1=0.18對應正態曲線高度等于0.357;上限p=0.5對應正態曲線高度等于0。

yL-yH=0.357

良:下限p=(p1+p2)-0.5=0.03對應正態曲線高度等于0.398;上限p=0.18對應正態曲線高度等于0.357。

yL-yH=0.041

同理,中:yL-yH=-0.137,及格:yL-yH=-0.261。

故測驗成績與教師評定之間有一致性,相關系數為0.87。

11下表是9名被試評價10名著名的天文學家的等級評定結果,問這9名被試的等級評定是否具有一致性?

答:表示多列變量相關程度應該用肯德爾W系數,又稱肯德爾和諧系數。

故9名被試的等級評定具有中等強度的相關,相關系數為0.48。

12將第11題的結果轉化成對偶比較結果,并計算肯德爾一致性系數。

答:第11題的結果轉化成對偶比較結果。轉化方法是如果被試1對10位天文學家評定的等級分別是A1,B2,C3…也就是說若用對偶比較,則當A天文學家與其他天文學家比較時,都選擇A,因此在A天文學家這一行都記1分;B天文學家排第二,表示當B天文學家與其他天文學家比較時除了A天文學家外都選擇B天文學家,以次類推。對偶比較結果如下:

K=9

N=10

故肯德爾一致性系數為0.33。

主站蜘蛛池模板: 乌拉特后旗| 麻阳| 沙雅县| 鄂托克旗| 凤翔县| 凤山市| 卢湾区| 莲花县| 平和县| 长垣县| 泗阳县| 营口市| 旅游| 武清区| 朝阳区| 买车| 大城县| 治多县| 荆州市| 南京市| 普洱| 深水埗区| 陇西县| 阳城县| 宁蒗| 大渡口区| 纳雍县| 图们市| 垦利县| 巴青县| 沈阳市| 马山县| 同德县| 青州市| 渑池县| 织金县| 油尖旺区| 襄垣县| 禄丰县| 长岭县| 棋牌|