官术网_书友最值得收藏!

1.2 統計學的基本概念

任何一門科學在研究該科學的理論和方法時都要涉及一些基本概念,統計學也不例外。統計總體與總體單位、統計標志與統計指標以及指標體系等,是統計學中幾個最常用和重要的基本概念。理解和正確使用這些概念是學習統計學后續內容的基礎。

1.2.1 總體與總體單位

如前所述,統計學是研究客觀現象總體的數量特征和數量關系的學科。因此,首先對統計總體要有一個明確的認識。統計總體簡稱總體,它是客觀存在的、具有某種共同性質的許多個別事物構成的整體。例如,所有上市公司、在校大學生、所有旅行社、工業企業、全部職工等,都可以稱為統計總體。

統計總體具有三大特點,即同質性、大量性、變異性。同質性是指總體中各個單位具有某一共同的性質,同質性是確定統計總體的基本標準;大量性是指統計總體應該由足夠數量的同質性單位構成,統計對總體數量特征的研究,其目的是探索、揭示現象的規律,而現象的規律只有通過大量觀察才能顯示出來;總體各個單位除了具有某種或某些共同的性質以外,在其他方面具有質的差別和量的差別,這種差別稱為變異。正因為變異是普遍存在的,才有必要進行統計研究??傮w中各個單位之間具有變異性的特點,這是各種因素錯綜復雜作用的結果,所以有必要采用統計方法加以研究,才能表明總體的數量特征。

根據所包含的單位的數量不同,總體可以分為有限總體和無限總體兩類。有限總體是由有限量的單位構成的總體。例如,全國人口普查,盡管其包含的單位數量很大,但仍然是有限的,所以是有限總體。而當總體單位數難以確定,其數量有可能是無限多時,便構成了無限總體。例如,要檢驗某種新工藝是否真正能夠改善產品的性能時,由于該新工藝的應用有可能一直延續下去,利用該工藝制造的產品包括已經生產和將要生產的產品,其數量也難以準確確定,因此就屬于無限總體。

總體單位也簡稱為單位,是組成總體的各個個體,是各項統計數字最原始的承擔者。例如:要研究上市公司的經濟效益時,所有上市公司構成一個統計總體,每一個上市公司則是總體單位,將每個上市公司的有關經濟效益方面的數量特征加以登記、匯總,就取得所有上市公司經濟效益的統計資料。根據研究目的的不同,總體單位可以是人、物、機構等實物單位,也可以是一種現象或活動過程等非實物單位。

總體和總體單位的概念是相對而言的,隨著研究目的和總體范圍的不同而相互轉化。同一個研究對象,在一種情況下為總體,但在另一種情況下又可能變成總體單位。例如:研究全國各省的人口情況時,全國為總體,各省為總體單位;而當要研究某省各縣人口狀況時,則該省就變成了總體,各縣又成了總體單位。

1.2.2 樣本

在推斷統計學中將所要研究的事物全體構成的總體稱為全及總體,從全及總體中抽取出來的,代表全及總體的部分單位組成的集合體稱為樣本。樣本是推斷統計學中非常重要的概念。抽取樣本時應注意以下問題:

(1)抽取樣本的目的是推斷總體,所以樣本的單位必須取自同一總體。一般情況下,樣本中個體的數目以30為界限,大于30為大樣本,小于等于30為小樣本,對社會經濟現象進行調查通常取大樣本,對自然現象進行調查通常取小樣本。

(2)從一個總體可以抽取多個樣本,樣本個數的多少和樣本所包含的單位數量與抽樣方法有關。

(3)樣本的抽取必須按隨機原則,排除主觀因素的影響,以確保樣本的客觀性與代表性。

(4)由樣本去推斷總體的特征總會存在一定的誤差。如何科學地從總體中抽取樣本,怎樣控制樣本的代表性誤差,是推斷統計學中研究的主要問題。

1.2.3 統計標志與標志表現

標志是指總體各單位所具有的屬性或特征的名稱。每個總體單位從不同方面考察都具有許多屬性和特征,例如,每個企業都具有經濟類型、所屬行業、資產數量、職工人數、產品產量等屬性和特征,這些就是企業總體單位的標志;又如,每個大學生都具有姓名、性別、年齡、籍貫、專業等屬性和特征,這些就是大學生總體單位的標志。由此可見,所謂屬性和特征可以是自然屬性也可以是社會屬性,而且都是總體中每個單位普遍具有的。如果只是個別單位具有的特殊屬性和特征就不能作為統計總體單位的標志。

標志分為品質標志和數量標志兩種。品質標志表明總體單位屬性方面的特征,例如,每個企業的經濟類型、所屬行業、設備的種類等屬性和特征,每個大學生的性別、籍貫、專業等屬性和特征。數量標志表明總體單位數量方面的特征,例如,每個企業資產數量、職工人數、產品產量等屬性和特征,每個大學生的年齡、身高、體重等屬性和特征。盡管總體各單位都有共同的標志,但每單位對該標志的具體表現卻可能不同。品質標志的表現和數量標志的表現是不同的。品質標志的表現只能用文字、語言來描述。例如,性別是品質標志,而標志表現具體為男性或女性;又如專業是品質標志,而標志表現具體為工商、物流、財務、會計、旅游等。數量標志的表現可以用數值來表示。例如,資產是數量標志,其具體表現為多少萬元;又如年齡是數量標志,其具體表現為多少歲等。

無論是品質標志還是數量標志,如果在一個總體的各單位具體表現都相同,則稱之為不變標志。例如,在物流管理專業大學生總體中,專業這一標志各單位表現都是物流,所以專業便是不變標志。在一個總體中,當一個標志在各單位的具體表現有可能不同時,這個標志便稱為可變標志。例如,物流管理專業大學生總體中,各單位的姓名、性別、年齡、籍貫表現不同,所以姓名、性別、年齡、籍貫是可變標志。

1.2.4 變量與變量值

可變的數量標志是變量,例如,年齡、身高、體重、工資、產量、資產等都是變量。變量的具體數值表現稱為變量值。例如,某公司職工的工資有1500元、1860元、2120元三種,1500元、1860元、2120元就是變量值。變量與變量值是兩個既有密切聯系又有明顯區別的不同概念,不能混淆。例如,職工人數是一個變量,因為各個工廠的職工人數可能是不同的,如甲工廠有1000人,乙工廠有1500人,丙工廠有1800人,都是“職工人數”這個“變量”的具體數值,也就是變量值,求甲、乙、丙三個工廠平均職工人數,不能說是求三個“變量”的平均數,因為這里只有“職工人數”一個變量,并沒有三個變量,而應該說是求三個變量值的平均數。

變量按取值是否連續區分為連續變量和離散變量。連續變量是指變量值在相鄰的兩值之間可無窮分割,可以表現為無窮小數,其取值既可以是整數也可以取小數。例如,產品產量、企業資產、銷售額、總產值、資金、利潤等。離散變量是指變量值只能表現為整數而不能取小數。如人口數、企業數、機器臺數等。變量按其性質不同區分為確定性變量和隨機變量。確定性變量是指受確定性因素影響的變量,也即影響變量值變化的因素是明確的、可解釋的或可人為控制的,因而變量的變化方向和變動程度是可以確定的。例如,企業職工工資總額受職工人數和平均工資兩個因素的影響,它是確定性變量。隨機變量是指受隨機因素影響的變量,也即影響變量值變化的因素是不確定的、偶然的因素影響的變量。例如,農作物產量受土壤、水分、氣溫、光照、施肥、管理等多種因素的影響,而水分、氣溫、光照等變化是無法預知和控制的,因而農作物產量是隨機變量。

1.2.5 統計指標與指標體系

統計指標是反映統計總體數量特征的概念和數值。例如,在2014年國民經濟和社會發展統計公報中,2014年我國國內生產總值63.64萬億元,財政收入14.03萬億元,糧食產量60710萬噸等,這些指標從某一側面反映了我國國民經濟的數量特征。由此可見,統計指標是由兩項基本要素構成的,即指標名稱和指標數值。指標名稱是對總體數量特征的質的規定性。所以,確定統計指標必須有一定的理論依據,使之與社會經濟或科學技術的范疇相吻合;同時,又必須對理論范疇加以具體化,以便達到量化的目的。指標數值反映所研究現象在具體時間、地點、條件下的規模和水平,不同時間、不同地點或不同條件下,指標的具體數值必然不同。所以,一個完整的統計指標不僅包括指標名稱、指標數值,還應包括時間限制、空間限制、計算方法、計量單位。指標有兩個重要特點:一是綜合性,指標說明的不是總體單位的數量特征而是總體的數量特征,也即是構成總體的全部單位綜合的結果;二是可量性,指標都是能用數值表示的,沒有不能用數值表示的統計指標。

統計指標與標志既有區別,又有聯系。

區別主要有兩個方面:

(1)指標和標志說明的對象不同,指標說明總體的特征,標志則說明個體的特征。

(2)指標和標志的表現形式不同,指標是用數值來表現的,而標志既有能用文字來表現的品質標志,又有用數值來表現的數量標志。

聯系也有兩個方面:

(1)標志是計算統計指標的依據,即統計指標數值是根據個體的標志表現綜合匯總而來的。

(2)由于總體與個體的確定是相對的、可以互換的,因而指標與標志的確定也是相對的、可以互換的。這樣,指標與標志在許多場合并不需要嚴格區分,例如企業人數、企業總產量、企業總產值等,既是指標也是標志。因此,指標與標志同屬于變量的范疇。

統計指標按其反映現象的內容不同,可以分為數量指標和質量指標兩種。

數量指標是反映現象總規模、總水平、總工作量大小的統計指標。例如人口總數、企業數、職工人數、總產量、總產值、土地面積、投資額等,都屬于數量指標,這些指標反映現象或過程的總規模和水平,所以,數量指標也稱為總量指標,用絕對數來表示。數量指標的計量單位有實物單位、價值單位和時間單位三種,其中實物單位又有自然單位、度量衡單位、復合單位等。

質量指標是反映現象相對水平和工作質量的統計指標。例如,人口性別比例、職工平均工資、產品合格率、人均土地面積、產值增長速度、資金利潤率等,都屬于質量指標。質量指標是總量指標的派生指標,用相對數和平均數來表示,所以質量指標又可以分為相對指標和平均指標兩種。

單個統計指標只反映總體的某一個數量特征,說明現象某一側面的情況??陀^現象是錯綜復雜的,要反映其全貌、描述現象發展的全過程,只靠單個統計指標是不夠的,需要設立統計指標體系。統計指標體系是由一系列相互聯系的統計指標所組成的有機整體,用以反映所研究現象各方面相互依存、相互制約的關系。指標體系的表達形式有兩種:一種是通過數學形式來表達,例如,產品銷售收入=產品的銷售量×銷售價格;另一種是表達成相互聯系、相互補充的指標系列,例如,為了反映企業生產經營的全貌,需要設立產量、產值、品種、質量、職工人數、勞動生產率、工資總額、原材料、設備、財務成本等多項指標,來組成工業企業統計指標體系。指標體系的設置不但是客觀現象的反映,而且也是人們客觀認識的結果。隨著客觀形勢的發展變化以及實踐經驗和理論研究的積累,指標體系也將不斷改進更新、逐步完善。

1.2.6 統計數據

1.數據的計量尺度

統計數據是總體單位標志或統計指標的具體數量表現。統計數據是對客觀現象進行計量的結果。由于不同事物性質不同,我們能夠予以計量或測度的程度也不同,有些事物只能對其屬性進行分類,比如,人口的性別和文化程度、產品的型號及質量等級等;有些則可以用比較精確的數字加以計算,比如產量、價值、利潤和銷售量等。根據計量學的一般分類方法,按照對事物計量的精確程度,可以將所采用的計量尺度由低級到高級、由粗略到精確分為四個層次,即定類尺度、定序尺度、定距尺度、定比尺度。采用不同計量尺度,可以得到不同類型的數據。

(1)定類尺度。它是最粗略、計量層次最低的計量尺度,它是按照事物的某種屬性對其進行平行的分類或分組,分類或分組的結果是用文字表示的。例如,按照性別將人口分為男、女兩類;按照經濟性質將企業分為國有、集體、私營、混合制企業等。使用該尺度對事物所做的分類中,各類別之間是平等的并列關系,無法區分優劣或大小,各類之間的順序是可以改變的。定類尺度計量的結果只是表現為某種類別,但為了便于統計處理,特別是為了便于計算機識別,我們可以對不同類別用不同的數字或編碼來表示,比如用“1”表示男性人口,“0”表示女性人口;“1”表示國有企業,“2”表示集體企業,“3”表示私營企業等。這些數字只是給不同類別的一個代碼,并不意味著這些數字可以區分大小或進行任何數學運算。

(2)定序尺度。它是對事物之間等級差別或順序差別的一種測度,它也是按照事物屬性對其進行分類,分類的結果也是用文字表示。該尺度不僅可以將事物分成不同的類別,而且還可以確定這些類別的優劣或順序。定序尺度的計算結果雖然也是表現為類別,但這些類別之間是可以比較順序的。例如,產品等級就是對產品質量好壞的一種次序測度,它可以將產品分為一等品、二等品、三等品、次品;考試成績可以分為優、良、中、及格、不及格等。很顯然,定序尺度對事物的計量要比定類尺度精確一些,但它只是測度了類別之間的順序,而未測量出類別之間的準確差值。因此,該尺度的計算結果只能比較大小,不能進行加、減、乘、除等數學運算。

(3)定距尺度。它不僅能將事物區分為不同類型并進行排序,分類的結果用數字表示,而且可以準確地指出類別之間的差距是多少。定距尺度是對事物類別或次序之間的間距的測度,該類尺度通常使用自然或物理單位作為計量尺度,如收入用人民幣元來度量,溫度用攝氏度來度量,長度用米來度量等。因此,定距尺度的計量結果表現為數值。由于這種尺度的每一間距都是相等的,只要給出一個度量單位,就可以準確地指出兩個計數之間的差值。如,考試成績70分與95分之間相差25分,一個地區的溫度30℃與另一個地區的35℃相差5℃等。由于定距尺度的計量結果表現為數值,并可以計算差值,因而其結果可以進行加、減運算。

(4)定比尺度。它與定距尺度屬于同一層次,其計量的結果也表示為數值。它除了具有上述三種計量尺度的全部特性外,還具有一個特性,那就是可以計算兩個測度值之間的比值。這就要求定比尺度中必須有一個絕對固定的“零點”,這也是它與定距尺度的唯一差別。換言之,定距尺度中沒有絕對的零點,即定距尺度的計量值可以為“0”。這里的“0”是表示一個數值,即“0”水平,而不表示“沒有”或“不存在”。例如,一個學生的統計學考試成績為“0”分,是表示他的統計學成績水平為“0”,并不表示他沒有考試成績或沒有任何統計學知識;一個地區的溫度為0℃,它表示一種溫度的水平,并不是沒有溫度??梢?,定距尺度中的“0”是一個有意義的數值。定比尺度則不同,它有一個絕對“零點”。也就是說,在定比尺度中,“0”表示“沒有”或“不存在”。比如,一個人的收入為“0”,表示這個人沒有收入;一種產品的產量為“0”,則表示沒有這種產品等。在現實生活中,大多數情況下我們使用的都是定比尺度。可見,定距尺度只能進行加、減運算,而定比尺度則可以進行加、減、乘、除運算。

2.數據的類型

統計數據時我們采用某種計量尺度對事物進行計量。但采用不同的計量尺度會得到不同類型的統計數據。從上述四種計量尺度計量的結果來看,我們可以將統計數據大體分為兩種類型:定性數據和定量數據。定性數據也稱品質數據,它說明的是事物的品質特征,是不能用數值表示的,其結果通常表現為類別,這類數據是由定類尺度和定序尺度計量形成的;定量數據也稱為數量數據,它說明的是現象的數量特征,是能用數值來表示的,這類數據是由定距尺度和定比尺度計量形成的。對不同類型的數據,可以采用不同的統計方法來處理和分析。比如對品質數據通??梢杂嬎愠龈鹘M的頻數或頻率,而數量數據則可以用更多的統計方法進行處理。

本章小結

統計學的產生與發展大致經歷了三個時期:古典統計學時期、近代統計學時期和現代統計學時期。在古典統計學時期有德國的國勢學派與英國的政治算術學派之分,在近代統計學時期有德國的社會統計學派與比利時的數理統計學派之爭,在現代統計學時期則以推斷統計發展為主要特征。

統計學的研究對象是客觀事物的數量方面具體包括數量特征和數量關系。研究對象具有三個方面的特征,即數量性、總體性、變異性。

統計一詞包含三個含義:統計工作、統計數據、統計學。統計數據是統計工作的成果,統計學則是統計工作實踐活動的經驗總結和理論概括,而統計學形成的理論則對統計工作起著指導作用。統計工作一方面受統計理論指導,另一方面也檢驗著統計理論的正確與否,促進統計理論的不斷發展。統計學與統計工作、統計數據之間的關系表明,理論來源于實踐,又反過來為實踐服務,被實踐檢驗,體現著理論與實踐辯證統一的關系。

統計學是研究如何收集數據、整理數據、分析數據的方法論性質的科學。經過三百多年的演變與發展,統計學已經發展成為由若干分支學科組成的學科體系。根據統計方法的構成,統計學分為描述統計學和推斷統計學;根據統計方法研究和應用,統計學分為理論統計學和應用統計學。

統計學中的幾個基本概念。統計總體是由客觀存在的、具有某種共同性質的事物所組成的集合體,具有大量性、同質性和差異性的特征。構成總體的每個個別事物稱為個體??傮w有有限總體與無限總體、全及總體與抽樣總體。統計總體與總體單位的關系不是一成不變的,根據研究的目的不同,可以相互轉化。

統計標志是說明總體單位屬性和特征的名稱。標志有品質標志與數量標志、可變標志與不變標志之分。可變的數量標志也叫變量。變量有離散型變量與連續型變量、確定性變量與隨機性變量之分。

統計指標是反映現象總體數量特征的概念及其數值,有指標名稱、計算方法、空間限制、時間限制、具體數值和計量單位六個要素。指標與標志既有區別,又有聯系。統計指標區分為數量指標與質量指標。統計指標體系是由一系列相互聯系的統計指標所組成的有機整體。

統計數據是總體單位標志或統計指標的具體數量表現。數據的計量尺度分為四個層次,即定類尺度、定序尺度、定距尺度、定比尺度。采用不同計量尺度,可以得到不同類型的數據。定類尺度和定序尺度計量形成的數據是定性數據;定距尺度和定比尺度計量形成的數據是定量數據。

主站蜘蛛池模板: 庆城县| 昌吉市| 旅游| 洞头县| 论坛| 泸定县| 三河市| 错那县| 威信县| 延寿县| 贡嘎县| 苏尼特右旗| 博白县| 尤溪县| 霍林郭勒市| 曲水县| 东辽县| 云浮市| 麻阳| 济南市| 桓仁| 亳州市| 胶南市| 紫金县| 奉节县| 常德市| 仁怀市| 海兴县| 菏泽市| 楚雄市| 海晏县| 禹城市| 孝昌县| 福清市| 新邵县| 古田县| 扬中市| 桂东县| 皋兰县| 门源| 白沙|