官术网_书友最值得收藏!

第1章 多元變量數(shù)據(jù)

1.1 什么是多元變量數(shù)據(jù)

在統(tǒng)計學中,變量(variable)是指具有相同屬性的觀測對象(個體)的數(shù)據(jù)集合。例如,人的身高變量,這個數(shù)據(jù)集合中所有數(shù)據(jù)必須取自人體身高的測量結果:160 cm,178 cm,154 cm……有時變量的取值不一定是數(shù)值,例如汽車顏色是描述汽車屬性的一個變量,可以是白、紅、黑、黃等不同顏色。但是在統(tǒng)計處理時,我們也可以將車色變量變換為一個數(shù)據(jù)的集合,例如,“1”表示白色,“2”表示紅色,等等,只不過這些數(shù)據(jù)只是表示顏色的類別而已。一旦確定了變量的某個值,這個值就稱為變量的一個觀測值(observation),即一個具體的數(shù)據(jù)(datum)。

多元變量數(shù)據(jù)是包含兩個以上變量的觀測數(shù)據(jù)的統(tǒng)稱,是對一組觀測對象關于兩個以上變量進行聯(lián)合觀測所取得的數(shù)據(jù)集合(Anderson,2003)。例如,表1.1(a)中的各個被試對應著各自的性別及學科成績變量,表1.1(b)中的各地區(qū)對應著學校數(shù)、在校學生數(shù)、專任教師數(shù)等不同的變量。表中的每行數(shù)據(jù)稱為某觀察對象的記錄,例如(0,72,68,82)是對1號同學的觀察記錄。

表1.1(a)多元變量數(shù)據(jù)

表1.1(b)多元變量數(shù)據(jù)(2012年部分地區(qū)普通高中基本情況)

多元變量數(shù)據(jù)有一個重要的特征,即變量間含有相互關系的信息。我們對多元變量數(shù)據(jù)進行統(tǒng)計分析,不僅要探討各變量內在的變化規(guī)律,還要在此基礎上把握全體數(shù)據(jù)的結構、分布規(guī)律,進而對研究對象、變量進行分類和簡化。這些分析都離不開變量間的相關性的信息。由多元變量數(shù)據(jù)拆分成單變量數(shù)據(jù)很簡單。例如,從表1.1(a)中只取出語文成績的數(shù)據(jù)就是一個單變量的數(shù)據(jù)。但是,對于多元變量數(shù)據(jù),如果只用單變量的統(tǒng)計方法分析的話,就會丟失變量間相互關系的重要信息,導致結論出現(xiàn)偏差。

另外,不管有多少個單變量的數(shù)據(jù),如果各變量的觀測值之間不能保證一一對應的關系(例如表1.1(a)中同一行的數(shù)據(jù)來自同一名被試),是不能合并為多元變量數(shù)據(jù)的。

為了讓初學者能夠正確分析和應用多元變量數(shù)據(jù),我們將在本章中介紹這類數(shù)據(jù)的基本知識。方便起見,以后文中提及多元變量數(shù)據(jù)將簡稱為多元數(shù)據(jù)。

主站蜘蛛池模板: 海林市| 肥乡县| 驻马店市| 青州市| 若尔盖县| 名山县| 龙江县| 鄢陵县| 沂南县| 依兰县| 饶阳县| 望都县| 明溪县| 天台县| 靖安县| 瑞昌市| 星子县| 遂宁市| 澜沧| 合江县| 弥渡县| 河北区| 保山市| 大同县| 鸡东县| 皮山县| 青岛市| 运城市| 太仓市| 伊宁市| 新巴尔虎右旗| 喀喇沁旗| 鹿泉市| 郯城县| 当涂县| 沅江市| 刚察县| 天全县| 宜昌市| 电白县| 正镶白旗|