- 黃金投資分析師復習全書(核心講義+歷年真題詳解)
- 圣才學習網主編
- 19790字
- 2021-01-06 19:48:04
第三章 概率論與數理統計基礎知識
一、事件的概率特性
(一)概率的基本概念
1.概率的統計學定義
概率,又稱或然率,是表示某種情況(事件)出現的可能性大小的一種數量指標,它介于0和1之間。
2.主觀概率
因為許多決策都難免包含個人判斷的成分,這時估計的概率又稱作主觀概率。主觀概率可以理解為一種心態或者傾向性。主觀概率一般都是根據經驗知識對或有事件做出估計,它在體現當事人主觀看法的同時也反映了一定的客觀因素。
(二)實驗與事件
1.概率論中事件的一般定義
(1)有一個明確界定的實驗。具體而言,“事件”是對某一實驗某些特征的描述,“事件”是依賴于實驗的。
(2)這個實驗全部可能的結果是在實驗前就明確的。有些情況不能確切地知道一個實驗全部可能的結果,但是,可以知道它不超過某個范圍。在這種情況下,可以用這個范圍來作為該實驗的全部可能結果。
(3)要有一個明確的陳述,這個陳述界定了實驗的全部可能結果中某一確定的部分。或者說,對實驗一個確定的陳述就可以稱作一個“事件”。
注:事件不是指已經發生的事情,而是指某種或有情況,它最后的結果在未來才能確定。它發生與否的結果只有在有關的“實驗”有了結果以后才能知道。
2.必然事件和不可能事件
(1)必然事件
必然事件就是發生概率為1的事件,換言之,就是即使是在現在也可以斷定該事件在未來一定發生。
(2)不可能事件
不可能事件是指發生概率為0的事件,該事件在未來無論如何都不會發生。
(三)古典概率
1.古典概率的定義
(1)“等可能性”實驗
如果一個實驗有N種結果,而且從實驗的條件和實施的方法上去分析,找不到任何理由認為其中某一結果比其他任意結果更具有發生優勢,這種情況下,所有結果在實驗中有同等可能的出現機會,即1/N的出現機會。常常把這樣的實驗結果稱為“等可能性”實驗。
(2)古典概率
設一個實驗有N個等可能的結果,而事件E恰包含了其中的M個結果,則事件E的概率P(E)定義為:
P(E)=M/N
注:①古典概率是通過排列組合的思想計算事件發生的概率,而且是客觀概率。
②只要事件E中的任何一個元素發生,就說事件E發生了,即事件是實驗結果的并集。
③古典概率計算方法能否適用的關鍵是等可能性的前提條件能否成立。
④古典概率只適用于實驗結果的個數是有限的,而且發生等可能性的情況。因此,古典概率計算方法存在很大的局限性,在很多情況下都不能用來計算事件發生的概率。
2.古典概率的計算
古典概率就是在得出基本的組合或者排列數之后,根據等可能性原則計算出所考察事件發生的概率。
注:(1)要討論古典概率的問題需要掌握基本的排列組合知識及其計算方法。排列的意思是不同的抽取次序表示不同的結果。與排列對應的是組合的概念,即組合之間的區別在于構成元素的不同,而不是元素的排列順序。
(2)一些常用的排列組合算法,如取物排序、取物不排序、分組等方法在古典概率問題的討論中都有很大的應用。
(四)概率的統計定義
1.定義
概率的統計定義是通過實驗去估計事件概率的方法。
2.含義
一個事件出現的可能性大小,應該由多次重復實驗中出現的頻繁程度去刻畫。該問題的關鍵是實驗必須能在同樣的條件下大量次數重復進行,以便有可能觀察事件的頻率。
3.實際應用中的重要性
(1)提供了一種估計頻率的方法。
(2)提供了檢驗理論正確與否的準則。可以通過實驗的方法檢驗由某種理論計算出來的概率是否正確。
(五)事件的運算、條件概率與獨立性
1.事件的蘊含、包含和相等
在相同實驗下的兩個事件A和B,如果當A發生時B必然發生,則稱A包含于B,記為A?B。若A、B互相包含,即A?B,B?A,則稱A、B兩個事件相等,記為A=B。
2.事件的互斥和對立
若事件A、B不能在同一次實驗中都發生(但可以不發生),則稱它們是互斥的。如果一些事件中,任意兩個事件都是互斥的,則稱這些事件是兩兩互斥的,或簡稱互斥的。
互斥事件一個重要情況是“對立事件”,若A為一事件,則事件B={A不發生}為A的對立事件,記為。
3.事件的和(或稱并)
設有兩個事件A、B,定義一個新事件C如下:
C={A發生或B發生}={A、B至少一個發生}
只要A發生,或者B發生,或者二者同時發生,C就發生。這樣定義的事件C稱作事件A、B的和。因此,可以把A和B看成是C的子事件。記為C=A+B或者C=AUB。
4.概率的加法定理
若干個互斥事件和的概率等于各事件發生概率的和,事件的個數可以是有限的也可以是無限的,這個定理稱作(概率的)加法定理,其重要條件是各事件必須是兩兩互斥的。如果兩個事件是對立的,根據加法定理有:P(A)=1-P()。
5.事件的積(或交)、事件的差
設有兩個事件A、B,定義一個新事件C如下:
C={A、B都發生}
稱為兩事件A、B的積,記為AB。一般事件A、B都是一些實驗結果的組合,AB則由同屬于這兩個集合的那些實驗結果組成,即這兩個集合的交叉。如果A、B為對立事件,那么AB為不可能事件。
設有兩個事件A、B,定義一個新事件C如下:
C=A-B={A發生,B不發生}
稱C為事件A,B的差,記為C=A-B。A-B就是從構成A的那些實驗結果中,去掉同時在A和B中的那些事件。
6.條件概率
一般講,條件概率就是在附加一定的條件下所計算的概率。在概率論中,決定實驗的那些基礎條件被看作是固定不變的。如果不再加入其他條件或假定,計算出的概率叫做“無條件概率”,這是常說的概率。條件概率指另外附加的條件,其形式總可歸納為“已知某些事件發生了”。
7.事件的獨立性和概率乘法定理
(1)事件的獨立性
如果兩個事件之間存在一定的關聯性,那么在給定其中一個的前提下,另一個的發生概率和其無條件概率P是不一樣的。反之,如果兩個概率相同,即一個事件的發生與否對另一個事件的發生概率不會產生影響,則稱它們是條件獨立的,兩個事件為獨立事件。
多個事件獨立性的定義可以由兩個事件獨立性直接推廣而得到。
(2)概率乘法定理
當事件是相互獨立的,那么事件交集的概率是各個事件各自概率的乘積。
注意:①一些事件A1,A2,…,如果其中任意兩個都獨立,則稱他們兩兩獨立。由相互獨立一定能得出兩兩獨立,但是反過來不一定成立。
②乘法定理和加法定理一樣,都能夠把復雜事件概率的計算歸結為更簡單的事件概率的計算,但要滿足一定的條件:相加是互斥,相乘是獨立。
8.全概率公式
(1)完備事件群
設B1,B2,…為有限或無限個事件,他們兩兩互斥而且在每次實驗中至少發生一個,即B1+B2+…=Q(必然事件),=φ(不可能事件)(i≠j),這樣的一組事件又稱作“完備事件群”。
(2)全概率公式
任何一個事件A發生的概率可以表示為:
P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+…
這就是著名的全概率公式,全概率被分解成許多部分之和。
它的理論和實踐意義在于,在許多情況下直接計算A的概率不容易,但A總是伴著某個B,適當構造一組B往往會使問題變得簡單。全概率公式在整個概率論中,用處非常廣泛,起著重要的作用。
二、隨機變量及概率分布
(一)隨機變量
1.隨機變量的基本概念
(1)隨機變量的定義
隨機變量就是指那些“其值隨機會而定”的變量。
含義:①機會表示實驗的結果,一個隨機實驗有很多可能的結果,隨機變量就是實驗結果的函數。
②隨機的含義在于實驗前不能預知它將取何值。
(2)隨機變量的分類
隨機變量按其可能取值的全體的性質,分為兩類:
①離散型隨機變量
其特征是只能取有限個值,或者雖然在理論上可以取無限個值,但是這些值可以毫無遺漏的一個接一個排列出來。
②連續型隨機變量
這種變量的全部取值不但是無限的,而且還不能毫無遺漏的一個接一個排列出來,而是充滿一個區間。
2.單維隨機變量特征
(1)概率函數和概率密度函數
①離散型隨機變量的概率函數
對于離散型隨機變量,概率函數可以衡量變量取某值概率的大小。
需要指出的是,每個取值概率應該介于0和1之間,而且所有可能取值對應的概率之和應該等于1。
②連續型隨機變量的概率密度函數
對于連續型隨機變量,概率密度函數可以反映出變量取某值的“強度”。
(2)分布函數
設X為一個隨機變量,函數P(X≤x)=F(x)(-∞<x<+∞)為X的分布函數。
注意:這里并未對X的屬性加任何限制,它可以是離散型的,也可以是連續型的。
(3)連續型隨機變量密度函數的性質:
①所有概率密度函數非負。
②在隨機變量的定義域內,概率密度函數的積分等于1。
③隨機變量介于兩點之間的累積概率等于概率密度函數在該區間內的積分。
(二)條件概率分布與隨機變量的獨立性
1.條件概率分布
(1)條件概率分布的概念
一個隨機變量或者向量的條件概率分布,就是在某種給定的條件之下的概率分布。
注意:這里所說的條件不是指保證實驗正常進行的基礎條件,而是除此之外的附加條件。它一般采取以下形式,設有兩個隨機變量或者向量X、Y,在給定了Y取某個或某些值的條件下,去求X的概率條件分布。討論條件概率的意義在于,很多情況下變量之間往往是相互影響的,這使得條件概率成為了研究變量之間相互依賴關系的一個有力工具。
(2)離散型隨機變量的條件概率分布
離散型隨機變量的條件分布用其條件概率表示。
設(X1,X2)為一個二維隨機向量,在給定X2取值的條件下,X1的條件概率為二者的聯合分布與X2取值概率的商。即:
P(X1=ai|X2=bj)=P(X1=ai,X2=bj)/P(X2=bj)
(3)連續型隨機變量的條件概率分布
連續隨機變量的條件概率分布用條件概率密度函數表示。
一個變量的條件密度函數為多個變量的聯合密度函數與其他變量密度函數的商。即:
f(xl|x2)=f(xl,x2)/f(x2)
也就是說,兩個連續隨機變量的聯合密度函數等于其中一個的概率密度乘以給定該變量的情況下另一個的條件概率密度。
2.隨機變量的獨立性。
(1)獨立性的定義
一般而言,條件概率或者條件概率密度函數是隨條件變量的變化而變化的,這反映了兩個隨機變量在概率上相互依賴關系的事實。如果條件概率或條件概率密度函數不依賴于條件變量的取值,那么條件分布與條件變量的取值完全無關,這時就稱兩個隨機變量(在概率意義上)是獨立的。
可以推而廣之,給出隨機變量獨立性一般情況下的正式定義:
如果,對于多個隨機變量的聯合概率密度函數等于單個變量邊緣密度函數之積,就稱這些變量是相互獨立的。
(2)幾個重要定理
定理1:變量獨立導致的事件獨立性。
如果多個隨機變量之間是獨立的,則完全依賴于不同變量的事件之間也是獨立的。
定理2:如果連續型隨機變量的概率密度函數f(x1,x2,…,xn)可表示為n個相異函數之積,而且每個函數只依賴于其中的一個變量,那么這些隨機變量是相互獨立的,而且每個函數與其自變量對應的邊緣分布只差一個常數因子。
定理3:隨機變量獨立性導致的函數獨立性。
如果多個隨機變量是相互獨立的,以這些隨機變量為變量的函數對應的自變量完全不同,那么這些函數之間也是相互獨立的。
三、隨機變量的數字特征
(一)數學期望(均值)與中位數
1.數學期望
(1)數學期望的概念
數學期望就是隨機變量的可能值與該值發生概率之積的累加,換句話說就是隨機變量取值分別與各自的發生概率為權重相加的結果。
嚴格的定義如下:
設隨機變量X只可能取有限個值a1,a2,…am,其取值概率分別為P(X=ai)=pi,i=1,2,…,m,則X的數學期望E(X)為:
E(X)=a1Pl+a2p2+…+amPm
數學期望也常被稱為“均值”。
當隨機變量為連續型時,基本原理與離散型隨機變量情況下相同,不同之處在于連續型隨機變量的期望值為其概率密度函數在其取值范圍內的積分,而不再是相加。
(2)數學期望的性質
①如果若干個隨機變量都存在期望值,那么這些變量和的期望值等于各個隨機變量期望值的和。
②若干個獨立隨機變量積的期望值等于各個變量的期望值之積。
③(隨機變量函數的數學期望)
隨機變量函數期望值的計算方法和隨機變量相似,只是把隨機變量的取值換為相應的函數值。這個定理的實質在于,計算隨機變量函數的期望值,并不需要先計算出函數的密度函數,而可以通過隨機變量分布計算得出,這就大大方便了計算。
2.中位數
中位數為把隨機變量分布函數一分為二的變量取值。即隨機變量在中位數左右對應的累計概率分別為1/2。從概率的角度來說,中位數正好居于隨機變量分布的中央。
(二)方差與矩
1.方差和標準差
(1)基本概念
方差是隨機變量與其期望值差平方的期望值。即隨機變量X的方差可以表示為:
Var(X)=E[X—E(X)]2
方差的正平方根稱作隨機變量的標準差。方差和標準差都是刻畫隨機變量分布離散程度的參數。
(2)方差的性質
①a.常數的方差為0;
b.若C為常數,Var(C+X)=Var(X);
c.若C為常數,則Var(CX)=C2Var(X)。
②獨立隨機變量和的方差,等于各個變量的方差之和。
這個定理是方差的一個極其重要的性質,它與均值的定理1相似。但需要注意的是:方差定理要求各變量獨立,而均值定理沒有該限制條件。
2.矩
(1)矩的定義
矩是隨機變量的一系列經調整的期望值。E[(X—c)k]稱為X關于c點的k階矩。比較重要而且經常使用的矩有以下兩種:
①c=0,這時稱為X的k階原點矩;
②c=E(X),這時稱為X的k階中心矩。
應該注意到,一階原點矩就是數學期望,二階中心矩就是方差。
(2)偏度系數和峰度系數
①偏度系數
β1=2稱為隨機變量或其概率分布的偏度系數,該變量用來檢驗分布是否為對稱分布。如果該值為負值,那么稱分布左偏或負偏;如果為正,則稱分布右偏或正偏。
②峰度系數
β2=μ4/μ22稱為隨機變量或其概率分布的峰度系數。該變量用μ4衡量分布(密度)在均值附近的陡峭程度。
(三)協方差和相關系數
1.協方差和相關系數的基本概念
(1)協方差
稱E[(X-m1)(Y-m2)]為X,Y的協方差,并記為cov(X,Y)。
(2)相關系數
隨機變量協方差與各自標準差積的商即為隨機變量的相關系數:
E[(X-m1)(Y-m2)]/
2.協方差和相關系數的性質
(1)定理1:獨立隨機變量的協方差為零;。
當且僅當X,Y有嚴格的線性關系時等號成立。
(2)定理2:獨立隨機變量的相關系數為零;相關系數絕對值不大于1,當且僅當X,Y有嚴格的線性關系時等號成立。
注意:
①當協方差為零時稱兩個隨機變量不相關。也就是說由獨立性可以推出不相關,但是不相關并不能推導出獨立性;
②相關系數又稱作線性相關系數。因為相關系數并不是刻畫隨機變量之間一般的相關關系,而是“線性關系”的程度。
(四)大數定理和中心極限定理
1.大數定理
設做了n次獨立實驗,每次觀察某事件A是否發生。定義隨機變量Xi,i=1,2,…,n,為:
則在n次實驗中,A發生的次數為X1+X2+…+Xn次,而頻率為:
若P(A)=p,則“頻率趨于概率”是說,在某種意義下,當隨機變量的個數很大時Pn接近于隨機變量的期望值。“大數”的意思就是涉及大量的觀察值,該定理也只有在大量次數的實驗和觀察之下才能成立。
對于一組有共同期望值a,服從獨立同分布的隨機變量而言,“大數定理”闡明的是,如果它們的方差存在,那么對于任意給定的無限小量ε>0,都有
這個式子指出了“當n很大時,接近a”的確切含義:它的內涵是在概率意義下體現出來的,這不同于微積分意義下某一數列的收斂于a。上式只是說:不論你給定多么小的正值,頻率和均值的偏離是可能比ε大的,但是如果所考察的n很大時,出現這種情況的可能性就會很小,以至于趨于0。像上式這樣的收斂性稱作“
概率收斂于a”。
2.中心極限定理
在概率論中,存在這樣一種情況,一組隨機變量和的數字特征除了一些例外情況以外,刻畫起來是非常復雜的。其實這種問題可以通過極限的方法解決,而且更有利的是,在很一般的情況下和的極限分布就是正態分布。在概率論中,把和的分布收斂于正態分布的那一類定理稱作“中心極限定理”。
定理:對于一組均值為n,服從獨立同分布的隨機變量,如果它們的方差存在并有限,則有對于任何z都有:
這里φ(x)是標準正態分布的分布函數。注意到X1+X2+…+Xn有均值na,方差aσ2。因此,標準化后的隨機變量之和依概率收斂于標準正態分布。由中心極限定理得知,雖然在很多情況下,很難求出隨機和分布的確切形式,但是當變量個數很多時,可以通過標準正態分布函數給出其近似值。從這種意義上可以說,中心極限定理是用分布模擬分布。
四、統計學概述
(一)統計總體和總體單位
1.統計總體
統計總體(簡稱總體)是根據一定的統計目的與要求所確定的客觀事物的研究對象,它是由客觀存在的、在同一性質基礎上結合起來的許多事物所構成的整體。
2.統計單位
總體單位(簡稱單位)是指組成總體的各個單位(或元素),是各項統計數字的原始承擔者。
(二)標志和標志值
1.標志
標志是總體單位所共有的某一屬性或特征,它是說明總體單位屬性或特征的名稱。
2.標志的分類
(1)品質標志和數量標志
標志按照表現形式可以分為品質標志和數量標志。
①品質標志表明單位屬性的質的特征,只能用文字來說明,如工人的性別、工種等;
②數量標志表明單位數量方面的特征,可用數值來表示,如人的年齡、企業的利潤等。
(2)不變標志和可變標志
標志按變異情況可以分為不變標志和可變標志。
①不變標志是指在一個統計總體中,總體單位的表現都相同,例如,在工人的總體中,職業這一標志各單位表現都是相同的,職業就是不變標志;
②可變標志是指在一個統計總體中,總體單位的表現不盡相同,存在差異,例如,在工人的總體中,工資這一標志的各單位可能表現不同,所以職工的工資就是一個可變標志。
3.標志值
標志值是總體中各單位的屬性或特征的具體表現,例如,職工的工資,對每個總體單位來講是不同的,每個工人的工資就是標志的具體體現,也稱為標志值。
4.變量和變量值
可變的數量標志稱為變量,變量的數值表現就是變量值。
5.變量的分類
①按照變量值的連續性可以把變量分為連續變量和離散變量;
②按照變量的性質可以分為確定性變量和隨機變量。
(三)指標
1.指標的定義
指標是反映統計總體數量特征的概念和數值的,由兩項基本的要素組成,即指標的名稱和指標的數值。
(1)指標的名稱是對所研究現象的本質概括,即對總體數量特征的質的規定;
(2)指標的數值是反映所研究的現象在具體時間、地點、條件下的規模和水平,是具體的,不是抽象的。
2.數量指標和質量指標
指標按照所反映的數量特點不同,可以分為數量指標和質量指標。
(1)數量指標
凡是反映現象總規模、總水平和工作總量的統計指標稱為數量指標,例如,人口數、企業數、工資總額等;
(2)質量指標
凡是反映現象的相對水平和工作質量的統計指標稱為質量指標,例如糧食平均畝產量、職工平均工資、人口密度死亡率等。
五、數據的收集和描述
(一)數據的收集
1.原始統計數據
原始統計數據產生于統計調查階段,主要是說明總體單位特征的,通常稱為標志值。
2.綜合統計數據
綜合統計數據是經過統計整理以及相應的匯總計算后形成的,用以說明總體特征,通常稱為統計指標。
3.原始數據的獲得不像綜合數據那么輕松,可以取自有關文獻資料和媒體,其獲得的手段更重要的是直接的調查。
(二)統計調查
統計調查就是數據的收集,它是根據統計研究的目的和任務,運用科學的調查方法,有計劃、有目的地向客觀實際收集資料的過程。統計調查在統計研究中處于基礎階段,是統計整理、統計分析、統計預測的前提,是整個統計研究工作的重要環節,因此,統計調查所收集的數據必須滿足準確性、及時性、系統性和完整性的要求。
1.統計調查方案的設計
(1)確定調查目的
調查目的是統計研究所要解決的問題。調查目的決定調查的內容、調查對象和調查項目的方式方法,所以要求明確具體。
(2)確定調查對象和調查單位
①調查對象
調查對象是某項調查中被研究的總體,是由性質相同的許多調查單位組成的。調查對象由調查目的所決定。
②調查單位和報告單位
a.調查單位也就是總體單位,它是調查對象的組成要素。
b.報告單位又叫填報單位,也是調查對象的組成要素,是提交調查資料的單位。
(3)確定調查項目
調查項目就是要確定調查的內容,即向單位調查什么。這應根據調查目的和調查對象的性質、特點、變化來確定,應本著需要和可能的原則,列出滿足調查目的所必需的項目,各次調查的同類項目應盡可能保持不變,以便進行動態研究。
(4)調查表和問卷的設計
①調查表
將各個調查項目按照一定的順序排列在一定的表格上,就構成了調查表。利用調查表能有條理地填寫需要搜集的資料,還便于調查后對資料進行匯總。
②調查問卷
在市場調查中,經常把調查目的轉化為一些被調查者可以回答的問題,調查項目和調查表為一張調查問卷,它是由一系列問題、被選答案、說明及碼表組成的一種調查表形式。
(5)確定調查時間
①調查期限
調查期限是指進行統計工作的起止時間,包括搜集和報送資料的整個工作時間。
②調查資料所屬的時間
調查資料所屬的時間根據不同調查項目的要求確定,例如,調查的對象是時期現象,就要規定資料反映的是從何時始至何時止的資料,如調查對象是時點現象,就要規定統一的標準時點。
(6)調查方法的選擇
根據不同的調查對象,可以選擇不同的調查方法。常用的調查方法有直接觀察法、報告法、采訪法、登記法和衛星遙感法等。在實際調查中,還可以根據被調查對象的具體特點,選擇電話和計算機輔助調查等方法。
2.統計調查的種類
(1)統計報表制度
①統計報表制度是一種以全面調查為主的調查方式,它是由政府主管部門根據統計法規,以統計表格形式和行政手段自上而下布置,而后由企、事業單位自下而上層層匯總上報的統計報告制度。
②它的任務是經常地、定期地搜集反映國民經濟和社會發展基本情況的資料,為各級政府和有關部門制定國民經濟和社會發展計劃,以及檢查計劃執行情況服務。
③統計報表按報送周期的長短不同,分為日報、旬報、月報、季報、半年報和年報等。
(2)普查
①普查是國家為了詳盡地了解某項重要的國情國力而專門組織的一次性全面調查。普查的目的主要是調查一定時點上的資料,涉及面廣,調查內容多。
②普查的主要特點
a.普查所包括的單位、分組目錄和指標內容都比統計報表更廣泛、更詳細。
b.一次重大的國情國力普查,其調查登記的時間雖然不長,但是復雜的準備工作和大量的數據處理工作都需要較長的時間。
③普查的要求
a.必須規定普查的標準時間
普查的標準時間是資料所屬的時間,以避免由于時間變動使資料重復或遺漏。
b.普查的基本內容和指標解釋應統一規定
同一類型的各次普查,其調查項目應相對穩定,以便于歷史資料的對比研究。
c.普查步調一致
在普查范圍內各調查點的調查登記工作應盡可能同時進行,盡快完成,以便及時匯總整理,保證資料的及時性和準確性。
(3)重點調查
①重點調查是專門組織的一次性非全面調查。它是在所要調查的總體中選擇一部分重點單位進行調查,用以反映總體基本情況的一種非全面調查。這里重點單位是全部單位中的一小部分,但從調查所關心的某項標志值來看,這些單位的標志值在總體標志總量中占有較大的比重,能起到反映總體基本情況的作用。
②重點調查的優點
重點調查的優點主要是能以較少的投人、較快的速度取得某些社會經濟現象主要標志的基本情況和變動趨勢。
(4)典型調查
①典型調查是專門組織的一次性非全面調查。它是在對調查對象有一定了解的基礎上,有意識地選擇少數典型單位進行的調查。這里典型單位的某種數量表現最具普遍意義和代表性,可以用于對總體數量的推斷。
②典型調查的作用
a.研究尚未充分發展、處于萌芽狀況的新生事物或某種傾向性的社會問題。通過對典型單位深入細致的調查,可以及時發現新情況、新問題,探測事物發展變化的趨勢,形成科學的預見。
b.分析事物的不同類型,研究它們之間的差別和相互關系。例如,通過調查可以區別先進事物與落后事物,分別總結它們的經驗教訓,進一步進行對策研究,促進事物的轉化與發展。
c.在總體內部差別不大,或分類后各類型內部差別不大的情況下,典型單位的代表性很顯著,也可用典型調查資料來補充和驗證全面調查的數字。
(5)抽樣調查
①抽樣調查是以概率論和數理統計的理論為基礎,按照隨機原則從調查對象中抽出一部分樣本單位進行調查,再用樣本資料推算總體數值的一種非全面的調查方式。
②抽樣調查與其他非全面調查相比所具有的特點
a.按隨機原則抽取樣本單位。
b.其目的是對總體數量特征進行推斷。
c.抽樣誤差可以事先計算并加以控制。
③應用抽樣調查的幾種情況
a.某些不可能進行全面調查的情況。
b.雖然可能取得全面資料,但不必進行全面調查的情況。
c.對全面調查的資料進行驗證和修正。
d.對于要求資料及時性很強的事物,如產品的驗收檢查、農作物收割前產量預計和其他應急的社會問題的調查等。
3.統計整理
(1)統計整理
統計整理是指根據統計研究的需要,將統計調查階段所搜集到的大量個體資料進行科學的分類匯總、加工處理,或對加工過的次級資料再加工,使之系統化、條理化,成為能夠反映事物總體特征的過程。
(2)統計整理的作用
統計整理是從統計調查到統計分析的中間環節,是統計調查的繼續,是統計分析的前提和基礎。統計活動是從個體的實際表現到總體的綜合表現的認識過程,也是從對現象的感性認識到對現象的規律性認識的過程。統計整理正是從對現象個體量的觀察到對現象總體量的認識的連接點,在統計工作中起著承前啟后的作用。統計資料整理的質量,將直接影響統計對現象總體數量描述的準確性和分析的真實性。
(3)統計整理的內容
①統計數據的處理,即統計資料的分組、匯總、制表;
②統計數據的管理,即數據的輸入、儲存、更新、輸出。
(4)統計整理的步驟
①制定統計整理方案
為了做好統計整理工作,需要制定一套具體可行的工作計劃,把統計設計階段確定的統計指標體系、統計分組體系具體地設計到統計整理表和統計綜合表中。工作計劃包括人力的組織培訓,技術設備和財力的保證,對整理工作各個環節的要求,應承擔的責任及其相互銜接的具體做法等。
②對原始資料進行審核
a.完整性審核
完整性審核主要是看應該調查的單位是否有遺漏,調查項目填寫是否完整,調查表是否已按規定收齊等;
b.準確性審核
準確性審核包括數據的計算口徑、計算方法、計量單位是否符合規定,計算結果是否正確等。
對于檢查出來的問題,應根據統計整理方案規定的辦法加以處理和修正。
③數據處理
手工整理時通常是將原始數據過錄到整理表上,再經過計數和計算,求出單位數、合計數以及綜合表所要求的統計指標。計算機處理時需要先通過鍵盤、掃描儀、磁帶機等輸入設備,將數據記載到磁介質上,然后再用統計數據庫軟件進行處理。
④編制統計表或繪制統計圖
把手工匯總整理得到的綜合數據填寫到正式提供的綜合表上;將電子計算機匯總整理得到的綜合數據制表打印。繪制統計圖則是把統計整理結果用直方圖、折線圖、曲線圖、扇形圖等直觀的形式表現出來,這種表現形式易于人們了解和接受。
六、抽樣推斷
在實際的工作中,由于很多原因不能對統計總體的所有單位進行調查,只能從中抽出一部分進行調查,不同的樣本得到的結論也不一樣,都可能出現誤差,但抽樣的誤差可以通過事先計算加以控制。
(一)抽樣推斷的含義
抽樣推斷又稱抽樣估計,它是在抽樣調查的基礎上,利用樣本的實際資料推斷總體相應數量特征的一種統計分析方法。
(二)有關抽樣的基本概念
1.總體和樣本
(1)總體
總體也稱全及總體,是指所要認識的研究對象的全體,它是由所研究范圍內具有某種共同性質的全體單位所組成的集合體。
(2)樣本
樣本又稱為子樣,它是從總體中隨機抽取出來的,作為代表這一總體的那部分單位組成的集合體。
2.總體指標和樣本指標
(1)總體指標
總體指標是反映總體數量特征的綜合指標,給定一個總體,它的總體指標值是確定的,這個值也被稱為參數。對于總體中的數量標志,常用的總體指標有總體平均數、總體方差等。
(2)樣本指標
樣本指標是根據樣本各單位標志值計算的綜合指標,它是樣本變量的函數,是用來估計總體指標的,常用的樣本指標有樣本平均數、樣本方差和樣本成數等。
3.重復抽樣和不重復抽樣
(1)重復抽樣
重復抽樣也稱為回置抽樣,即從總體N個單位中隨機抽取一個容量為n的樣本,每次從總體中抽取一個單位,把結果登記下來,又重新放回,參加下一次抽選,而且每次抽選是在完全相同的條件下進行,每個單位中選的機會在各次都完全相等。
(2)不重復抽樣
不重復抽樣也稱為不回置抽樣,即從總體N個單位中隨機抽取一個容量為n的樣本,每次從總體中抽取一個單位,把結果記下來,但不放回,不參加下一次抽選,其實質上是等同于一次從總體中抽取n個樣本單位,每個單位的中選機會在各次是不同的。
(三)抽樣誤差
1.抽樣誤差及其影響因素
(1)抽樣誤差
抽樣誤差是指由于抽樣的偶然因素使樣本各單位的結構不足以代表總體各單位的結構,而引起抽樣指標和總體指標之間的絕對離差。
抽樣誤差之所以不同于登記誤差和系統誤差是因為登記誤差和系統誤差都屬于思想、作風、技術問題,可以防止或避免;而抽樣誤差則是不可避免的,只能加以控制。
(2)影響因素
①總體各單位標志值的差異程度;
②樣本的單位數;
③抽樣方法;
④抽樣調查的組織形式。
2.抽樣平均誤差
(1)抽樣平均誤差
由于樣本是按照隨機原則抽取的,在同一總體中,按照相同的抽樣數目,可以抽取許多相同和不同的樣本,而每次抽取的樣本都可以計算出相應的抽樣平均數、抽樣成數和抽樣誤差。為了利用樣本的指標去推算總體的指標,就需要計算這些抽樣誤差的平均數,這就是抽樣平均誤差,用以反映抽樣誤差的一般水平。
(2)抽樣平均誤差的計算
在實際的抽樣過程中,由于誤差有正、負之分,需要計算樣本平均數的標準差,來衡量抽樣平均誤差的大小。
在純隨機抽樣的方式下,抽樣平均誤差可以采用下面的計算公式:
①抽樣平均數的平均誤差
在重復抽樣條件下:
當N很大時,在不重復抽樣情況下:
②抽樣成數的平均誤差
在重復抽樣條件下:
當N很大時,在不重復抽樣條件下:
注:在應用以上公式時,標準差δ和成數P是總體的標準差和成數,通常是未知的,一般用樣本的標準差和成數來代替。
3.抽樣極限誤差
(1)抽樣極限誤差
在對總體指標進行估計時,一般事先確定一個誤差范圍。抽樣誤差范圍就是變動的抽樣指標與確定的總體參數之間的離差的可能范圍。它是根據概率論,以一定的可靠程度保證抽樣誤差不超過某一給定的范圍,統計上把這個給定的抽樣誤差范圍叫做抽樣極限誤差。
(2)抽樣極限誤差的計算
抽樣誤差范圍△是用一定倍數的抽樣平均誤差來表示的,這個倍數一般用t表示,它是以抽樣平均誤差為尺度來衡量的相對誤差范圍,稱之為概率度,通常給出一定的概率保證程度,查正態分布表得出t值。這樣就得到了抽樣極限誤差的計算公式:
(四)抽樣估計的方法
1.點估計
點估計是指直接以樣本的指標作為相應的總體參數估計量。例如,樣本的平均數作為總體的平均數的估計,樣本成數作為總體成數的估計等。
2.區間估計
(1)區間估計
區間估計就是對于未知的總體指標,在點估計的基礎上,尋求一個區間使得總體指標落在這個區間內具有給定的可信程度。
(2)區間估計的計算公式
在給定了一定的概率保證程度后,求出樣本平均數的標準差,就可以進行區間估計了。區間估計的公式如下:
上下波動的范圍就是抽樣的極限誤差,這個范圍是以抽樣平均誤差的一定倍數來表示的。
七、相關關系和回歸分析
在人類的生產實踐活動中,各種客觀現象之間的依存關系可分為函數關系和相關關系,且相關關系更具普遍性。研究這些客觀事物的相關關系,既要做定性分析,又要做定量分析,測定它們相關的緊密程度,以揭示其變化的具體形式和規律性。
相關和回歸分析便是這種定量分析的重要統計方法,通過相關分析,可以判斷兩個或兩個以上的變量之間是否存在相關關系,相關關系的方向、形態及相關關系的密切程度;回歸分析是對具有相關關系現象間數量變化的規律性進行測定,建立一個回歸方程式,并對所建立的回歸方程式的有效性進行分析、判斷,以便進一步進行估計和預測。
(一)相關關系
1.相關關系的意義
相關關系是指變量之間存在一種不確定的依存關系。它和函數關系不一樣,函數關系是變量之間確定的依存關系,當自變量數值給定時,便有唯一的一個因變量和它對應,而相關關系則不同,對應于一個變量的某個數值,另一個變量可能有幾個甚至許多個數值和它相對應。
在社會經濟領域中,社會和經濟變量受隨機因素的影響很大,它們之間的關系主要表現為相關關系。相關關系的變量之間,盡管沒有確定性的關系,但當對現象的內在聯系及其數量間的規律性了解得越加深刻的時候,則相關關系越有可能轉化為或借助函數關系來描述,其分析的任務是判斷變量之間是否存在相關關系、相關的形態、變動的方向以及測定相關的密切程度,并檢驗其有效性。
2.相關關系的種類
由于客觀現象之間的聯系、變化復雜多樣和不同的研究方法,變量之間的相關關系可分成以下幾類:
(1)按照研究變量的多少,分為單相關和復相關。
(2)按照變量之間依存關系的表現形式,分為線性相關和非線性相關。
(3)按照變量變化的方向,分為正相關和負相關。
(4)按照變量之間關系的密切程序,分為完全相關、不相關和不完全相關。
3.相關關系的測定
相關關系的測定方法有定性分析、相關表、相關圖和相關系數等,比較常用的是相關系數法。
相關系數是在直線相關的條件下,說明兩個變量之間的相關關系密切程度的統計分析指標,通常用r來表示。相關系數的測定方法,直接來源于數理統計中相關系數的定義。相關系數的計算公式為:
式中,n表示資料的項數,xi和yi分別表示變量x和y的第i個值。
(二)回歸分析
1.回歸的概念
回歸分析就是在相關分析基礎上,借助于函數關系式來表達具有相關關系的現象之間數量變動的統計規律性,并由給定的自變量X值,來揭示因變量Y在數量上的平均變化和求得因變量的預測值,這種統計分析方法就稱為回歸分析。
2.回歸分析與相關分析的關系
(1)回歸分析和相關分析的聯系
回歸分析和相關分析都是對客觀事物數量依存關系的分析,在理論基礎和方法上具有一致性。只有存在相關關系的變量才能進行回歸分析,相關程度越高,回歸測定的結果越可靠。相關系數同回歸模型中的參數可以相互換算,特別是多元相關和非線性相關的相關系數,必須利用回歸模型才能求得。
(2)回歸分析和相關分析的區別
①相關分析是研究變量之間的依存關系,這些變量是對等的;而回歸分析卻是在控制或給定一個或幾個變量條件下來觀察另一個變量的變化,給定的變量稱為自變量,不是隨機變量,被觀察的對應的變量稱為因變量,卻依然是隨機變量。
②相關分析主要是測定變量之間關系的密切程度和變量變化的方向,而回歸分析卻可以對具有相關關系的變量建立一個數學方程(也稱回歸模型)描述變量之間具體的變動關系,通過控制或給定自變量的數值來估計或預測因變量可能的數值。
3.回歸模型的種類
(1)按自變量的多少,可分為一元回歸模型和多元回歸模型。
(2)按變量之間的具體變動形式,可以分為線性回歸模型和非線性回歸模型。
在實際中,把這兩種分類標志結合起來,就有一元線性回歸模型和一元非線性回歸模型,多元線性回歸模型和多元非線性回歸模型。其中,一元線性回歸模型是最簡單、最基本的一種回歸模型。
4.一元線性回歸模型
(1)一元線性回歸模型
一元線性回歸模型又稱簡單直線回歸模型,它是根據成對的兩個變量的數據,配合直線方程,并根據自變量的變動,來推算因變量的發展趨勢和水平的一種數學表達式。當Z和Y變量只有單向的依存關系時,只能建立一個直線回歸方程,一般是Y對Z的回歸直線。這條樣本回歸的直線方程是:
式中,是因變量的估計值,x是自變量的實際值,
和
是待估參數。對模型參數估計的方法有多種,對于一元線性回歸模型的估計最簡便最常用的是普通最小二乘法(簡稱0LS)。
(2)最小二乘法
在簡單線性回歸中,對于樣本回歸函數和既定的樣本觀測值,用不同的估計方法可能得到不同的樣本回歸參數的估計值和
,用樣本回歸函數所估計的
也可能不同。總是希望所估計的
偏離實際觀測值yi的殘差ei越小越好。可能因為ei可正可負,殘差直接的代數和會相互抵消,為此可以取殘差平方和
作為衡量
與yi偏離程度的標準,這就是最小二乘準則,即
很明顯,的大小依賴于
和
的取值,根據微積分中求極值的原理,為使
達到最小,待定系數
和
應滿足:
從而得如下方程組:
其中:n為樣本容量,這個方程組稱為最小二乘的正規方程,根據克萊姆法則求解得:
這樣就得到了和
最小二乘估計公式,也可簡化地表示為離差形式:
其中:和
分別為樣本觀測值xi和yi的平均值;
及
分別是其樣本觀測值與平均值的離差。
這樣得到估計方程后,根據自變量的值,就因變量的估計值做出預測,但需要指出的是,一個直線方程只能作一種推算,不能相反進行推算。
八、時間序列分析
(一)時間序列的定義
1.時間序列
把反映某種現象隨時間變化、發展的一系列統計指標數值按時間先后順序排列起來所形成的序列,稱為時間序列,亦稱動態序列。
2.基本要素
①現象所屬的時間;
②反映現象在不同時間上數量表現的指標數值。
(二)時間序列分類
1.總量指標序列
(1)總量指標序列,又稱絕對數序列,是將反映現象總規模、總水平的某一總量指標在不同時間上的指標數值按時間先后順序排列起來所形成的序列。總量指標序列是計算相對指標和平均指標、進行各種時間序列分析的基礎。
(2)按其指標所反映時間狀況的不同,總量指標序列又分為時期序列和時點序列。
①時期序列
時期序列中所排列的指標為時期指標,各時期上的數值分別反映現象在這一段時期內所達到的總規模、總水平。
時期序列的特點是:
a.指標數值是現象在這一段時期內發展過程的累積總量。
b.指標數值具有可加性。
c.指標數值大小與所屬時期長短有密切聯系的特點。
②時點序列
時點序列中所排列的指標為時點指標,各時點上的數值分別反映現象在各該時點所達到的總規模、總水平。
時點序列的特點是:
a.指標數值是現象在某一時點上的數量表現。
b.指標數值具有時間上的不可加性。
c.各時點上的指標數值大小與相鄰兩時點間隔長短無密切聯系。
2.相對數時間序列
相對指標是說明現象之間數量對比關系的指標,用兩個或兩個以上有聯系的指標數值對比求得,結果表現為相對數。把同一相對指標在不同時間上的數值按照時間先后排列而形成的時間序列稱為相對數時間序列。
3.平均數時間序列
平均數時間序列是把同一平均指標,在不同時間上的指標數值按時間先后順序排列所形成的序列,反映現象在一段時間內一般水平發展變化的過程。
(三)編制時間序列的原則
1.基本原則
編制時間序列的目的是要觀察序列各期數值的變化和前后進行比較分析,因此,保證各期指標數值的可比性,是編制時間序列的基本原則。
2.應注意的問題
(1)時間跨度或間隔立相等
在時期序列中,由于各個指標數值的大小與時期長短直接有關,因此,如果各期指標時間跨度不一,就很難直接比較。
(2)總體范圍應該一致
總體范圍變化,指標數值必然不同。必須對資料進行適當調整,使總體范圍一致,再作動態比較。
(3)計算方法、度量單位應該一致
例如,研究某企業勞動生產率增長變動,如果各期指標計算方法不一致,有的按生產工人計算,有的按全部職工計算;或者有的按實物量計算,有的按價值量計算,前后各期就沒有可比性。
(4)指標含義和經濟內容應該一致
例如,研究某地工業生產發展情況,用產值指標進行前后比較,如果有時用總產值,有時用增加值,這種比較就沒有意義。
(四)時間序列水平分析指標
1.發展水平
(1)發展水平
發展水平是現象在不同時間上所達到的規模或水平的數量反映,也就是時間序列中的每一項指標數值。
(2)發展水平的分類
發展水平按在時間序列分析中所處的位置和作用不同,分為期初水平、期末水平以及報告期水平、基期水平等。
①如果序列中各指標數值按時間先后順序依次記為a1,a2,…,an,則首項a1稱為期初水平,最末一項an稱為期末水平,其余稱為發展水平。
②如果將不同時間上的發展水平進行比較,例如,將2002年的銷售額與2000年作比較,則把作為比較基礎的時期2000年稱為基期,其對應的發展水平稱為基期水平;把需要分析研究考察的2002年稱為報告期,其對應的發展水平稱為報告期水平。
(3)發展水平變化比較的方法
①相減的比較
相減的比較有增長量和平均增長量。
②相除的比較
相除的比較有發展速度、增長速度、平均發展速度和平均增長速度。
2.增長量
增長量是時間序列中報告期發展水平與相比較的基期發展水平之差,反映社會經濟現象報告期比基期增加或減少的數量,根據基期的不同,可將增長量分為累計增長量和逐期增長量兩種。
(1)逐期增長量
逐期增長量是指時間序列中各期發展水平與其前期發展水平之差,說明現象逐期增加或減少的數量,用公式表示為:
逐期增長量=報告期發展水平-報告期上期發展水平=ai-ai-1
(2)累計增長量
累計增長量是指時間序列中報告期發展水平與某一固定基期發展水平之差,說明現象在一定時期內總的增加或減少的數量,用公式表示為:
累計增長量=報告期發展水平-固定基期發展水平=ai-a0
在同一時間序列中,各逐期增長量的代數和一定等于相應時期的累計增長量,即
3.平均增長量
平均增長量是指時間序列中各逐期增長量的序時平均數,說明某社會經濟現象在一段時期內平均每期增加或減少的數量。一般用簡單算術平均法計算。其公式為:
4.發展速度
(1)發展速度
發展速度是反映社會經濟現象發展變化快慢程度的動態相對指標,它是根據兩個不同時期的發展水平對比求得的。其計算結果一般用倍數或百分數表示。用公式表示為:
發展速度=報告期發展水平/基期發展水平
(2)環比發展速度和定基發展速度
根據對比的基期不同,可分為環比發展速度和定基發展速度兩種。
①定基發展速度
定基發展速度是時間序列中報告期發展水平與固定基期發展水平對比所得到的相對數,說明某種社會經濟現象在較長時期內總的發展方向和速度,故亦稱為總速度。即報告期的水平是該固定基期的多少倍或百分之多少。
②環比發展速度
環比發展速度是時間序列中報告期發展水平與前期發展水平之比,說明某種社會經濟現象的逐期發展方向和速度。即報告期是上一期的多少倍或百分之多少。用公式表示為:
③定基發展速度與環比發展速度的數量關系
a.相鄰若干個環比發展速度的連乘積等于相應的定基發展速度。
b.相鄰兩個定基發展速度之商等于相應的環比發展速度。
5.增長速度
(1)增長速度
增長速度是表明社會經濟現象增長程度的動態相對指標,它是根據增長量與基期發展水平對比求得的,用以說明報告期水平比基期水平增加了若干倍(或百分之幾),其計算結果一般用倍數或百分數表示。用公式表示為:
增長速度=報告期增長量/基期發展水平=(報告期發展水平-基期發展水平)/基期發展水平=發展速度-l
(2)定基增長速度和環比增長速度
增長速度由于采用的基期不同,可分為定基增長速度和環比增長速度兩種。用公式表示為:
(3)增長率和降低率
①當報告期水平高于基期水平時,發展速度大于1或100%,增長速度為正值,表示現象增長的程度,亦稱增長率;
②當計算期水平低于基期水平時,發展速度小于1或100%,增長速度為負值,表示現象降低的程度,亦稱降低率。
6.平均發展速度與平均增長速度
(1)平均速度指標
①平均速度就是速度指標的動態平均數。
②平均發展速度與平均增長速度
a.從理論上講,所謂平均發展速度是指時間序列中各期環比發展速度的序時平均數,它表明社會經濟現象在一個較長時期內逐期發展變化的平均程度;
b.所謂平均增長速度也是指時間序列中各期環比增長速度的序時平均數,它表明社會經濟現象在一個較長時期內逐期增長的平均程度。
③平均速度指標的計算方法
平均增長速度并不能根據各期環比增長速度直接計算,而是先計算平均發展速度。然后,根據平均發展速度與平均增長速度的關系來計算平均增長速度,即
平均增長速度=平均發展速度-1
因此,所謂平均速度指標的計算方法,實際上就是指平均發展速度的計算。
(2)平均發展速度的計算方法
①幾何平均法
幾何平均法,又稱水平法,它的基本出發點是從時間序列的最初發展水平a0開始,以序列的平均速度去代替各期的環比發展速度,由此推算出期末理論發展水平與期末實際發展水平相一致,即在基期發展水平a0的基礎上,平均每年以多快的發展速度發展(),經過若干(季、月)后,才能達到報告期的發展水平(an)。公式為:
,其中,
表示平均發展速度。
這一公式變形,可得平均發展速度的“幾何法”計算公式:
根據定基發展速度和環比發展速度的關系,即將公式
代入上式得平均發展速度的另一個計算公式:
②方程法
方程法又稱累計法,它的基本出發點是從時間序列的最初發展水平a0開始,以序列的平均速度去代替各期的環比發展速度,由此推算出各期理論發展水平之和與各期實際發展水平之和相一致,即:
解這個高次方程,其正根即為平均發展速度。
(五)時間序列預測
1.時間序列預測
在客觀現實中,社會經濟現象很多是按照曲線軌跡演進的,因此,曲線模型在經濟社會中是大量存在的,但曲線又是由很多直線聯結而成的,因此,研究直線模型是研究各種曲線模型的基礎。選擇直線模型來分析其長期趨勢,并假設其方程為:y=a+bt,其中y表示時間序列的實際水平值Y的估計值或稱為長期趨勢值;t表示時間變量,a、b是兩個待定系數,分別表示趨勢線在Y軸上的截距和斜率。
依據這一時間序列的實際資料和“最小二乘法”的正規方程組求出這一直線方程中的兩個參數。正規方程組如下:
得出a、b兩個參數的具體數值,則可得到方程y=a+bt。
最后,把各個時期的時間變量代入這個趨勢方程中,便得到各期的長期趨勢值。
2.簡化方法
在實際的計算中,為了簡化計算,可以將時間序列中的自變量,即時間變量的原點移動若干期。具體做法是:
(1)當時間序列的項數為奇數項時,可以取最中間一項的時間順序號為0,中間以前的時間序號從中間往前依次為-1,-2,-3,…,中間以后的時間序號從中間往后依次為l,2,3,…。
(2)當時間序列的項數為偶數項時,將最中間的兩項,前面的一項取為-1,后面的一項取為l,然后從中間到兩邊,以前各期依次取-3,-5,-7,…;以后各期依次取3,5,7,…。
若按上述規則取值,從而使正規方程中的,做到了這一點,就可以使正規方程簡化為:
在得到a和b的估計值后,就可以按照時間對時間序列進行外推了,也就是對時間序列進行預測。
用簡化公式計算的直線趨勢方程和正規方程組所求出的方程實際上是同一條趨勢線,所不同的只是原點的改變,但原點改變后的趨勢值和改變前的趨勢值肯定是相等的。
九、指數
指數的概念起源于l8世紀中期歐洲資本主義迅速發展時期。當時由于美洲新大陸開發的大批金銀貴金屬源源不斷輸人歐洲,使歐洲物價驟然上漲,引起社會的不安,經濟學家為了測定物價的變動,開始嘗試編制物價指數。此后指數的應用和理論的不斷發展,逐步擴展到工業生產、進出口貿易、鐵路運輸、工資、成本、生活費用、股票證券等各個方面,現在指數不僅是分析社會經濟和景氣預測的重要工具,而且還被應用于經濟效益、生活質量、綜合國力、社會發展水平的綜合評價研究。
(一)統計指數的概念與分類
1.統計指數的概念
(1)廣義的指數概念
廣義的指數是指用來測定社會經濟領域內一個變量相對于指定的另一個變量數值大小的相對數。或者說,是反映社會經濟現象變動與差異程度的相對數,廣義的指數包括一切靜態和動態各種相對數。
(2)狹義的指數概念
狹義的指數是一種特殊的相對數,它是指用來反映不能直接加總的復雜現象總體數量綜合變動程度和方向的特殊相對數。例如,產量總指數、物價總指數、成本總指數、生活費用指數等。統計指數理論上主要是探討復雜現象總體的綜合變動狀況和對比關系。
2.統計指數的作用
(1)綜合反映復雜現象總體數量變動的方向和程度
由于社會經濟現象錯綜復雜,一個總體中各單位變動方向并不一致,變動程度也不相同,這就需要一個指標能夠綜合地描述復雜現象變動的一般情況。
(2)分析各因素變動對現象總體變動產生影響的方向和程度
這種分析法又稱為因素分析法,主要用于對復雜現象的分析,復雜現象是受多種因素影響的。
它有兩種情況:①現象的總量由各因素之和構成;②現象的總量由各因素之積構成。
利用指數進行因素分析,就是分析現象的總變動中,各個因素的影響方向和影響程度,這種影響可以從相對數與絕對數兩個方面進行分析。
(3)研究現象在較長時期內的變動趨勢
連續編制指數序列,可以研究現象在長時期內的發展變化趨勢。這種方法特別適用于對比分析有聯系、性質又不同的動態序列之間的變動關系,因為用指數的變動進行比較,可解決不同性質序列之間不可比的問題。
3.指數的分類
(1)個體指數和總指數
按指數反映的現象范圍不同,分為個體指數與總指數。
①個體指數
個體指數是指反映個體現象或個別事物的變動或差異程度的相對數。
②總指數
總指數是指反映特殊總體(多種現象或多個事物)綜合變動或差異程度的相對數,是嚴格意義上的指數,是需要特別研究的指數。
(2)質量指標指數和數量指標指數
按指數化指標的性質不同,分為質量指標指數與數量指標指數。
①質量指標指數
質量指標指數是反映現象總體內涵數量變動程度的指數,例如,反映商品質量優劣度的單位商品價格指數,反映勞動者技術水平的勞動生產率指數。
②數量指標指數
數量指標指數是反映現象總體規模變動程度的指數,例如,反映商品銷售量變動的指數,反映工業產品產量規模變動程度的產品產量指數。
(3)動態指數和靜態指數
按照指數反映現象時期的不同,分為動態指數和靜態指數。
①靜態指數
靜態指數是指由同一時期不同地區間同一性質指標對比所形成的指數,或同地區同一單位計劃與實際指標的對比所形成的指數。
②動態指數
動態指數又稱時間指數,它是將不同時間(時期或時點)的同類現象水平進行比較的結果,反映現象在時間上的變化過程和程度。
(4)綜合指數和平均指數
按照指數編制的方法不同,分為綜合指數和平均指數。
①綜合指數
綜合指數是指通過同度量因素,將兩個時期不能同度量的現象過渡到新度量的指標,然后進行計算的指數。
②平均指數
平均指數是從個體指數出發,通過對個體指數加權平均計算而編制的指數。
4.統計指數的性質
(1)綜合性
同一現象總體在各項目間變化的狀況往往相差懸殊,如果說反映所研究現象(如物價)綜合變化的程度,就必須綜合概括每個商品中這一現象變化的大小和方向,而不能只簡單地反映個別商品這一現象的變化,故指數實質上是一種綜合性的數值。
(2)代表性
指數既然是所研究現象每個項目變動的綜合反映,就應包含所有項目。然而,同一現象所包含的項目品種繁多,例如,全社會的消費品數以千萬計,不可能將所有項目一一列入計算范圍。所以,指數是作為代表身份出現的數值。
(3)相對性
指數是某一現象在不同時期的兩個數值進行對比的結果,常用相對數或比率形式表示,來表明現象發展變化的程度。所以,指數是一種相對性的數值。
(4)平均性
指數所表示的綜合變動是所研究現象每個項目共同變動的一般水平,也可以說是平均的變動。
(二)綜合指數
1.綜合指數的編制原理
綜合指數是總指數計算的基本形式,反映了復雜經濟總體中不能直接對比的多種現象的總的變動。綜合指數的編制原理就是通過引入同度量因素,使原來不能直接相加的現象過渡到能夠加總綜合的價值量,轉化為兩個時期的價值指標再進行對比。
2.綜合指數的編制過程
(1)先加總再對比
綜合指數是通過兩個時期的綜合總量對比來計算的總指數。總指數是反映復雜現象總體綜合變動的相對數,而構成現象總體的多種事物由于其使用價值不同、度量單位不同,不能直接加總,統計上稱之為不同度量。因此,要綜合反映它們的變動,就必須首先解決加總的問題。
(2)引入同度量因素
為了變不同度量為同度量,需要引入一個媒介因素,使不同度量、不能加總的現象轉化為同度量的、可加總的另一現象。能使不同度量的現象過度為可以同度量的媒介因素在統計指數理論中被稱為同度量因素,而所研究的現象稱為指數化指標,轉化為同度量的、可以加總的另一現象稱為總量指標。即:
價值量指標=指數化因素×同度量因素
(3)固定同度量因素時期
引入同度量因素后,現象總量的變動中不僅包含了所研究現象(即指數化指標)的變動,也包含了同度量因素的變動。于是,還必須將同度量因素的水平固定在同一時期,使所得的現象總量的變動只反映指數化指標的變動,這樣將兩個時期的現象總量對比所得的指數就是綜合指數。
3.綜合指數的基本形式
綜合指數按照說明現象的性質不同,可分為數量指標綜合指數和質量指標綜合指數。綜合指數的編制過程完全適合這兩種指數的編制,但在同度量因素固定的時期上,兩者有所不同。我國綜合指數編制的實踐是:在編制數量指標指數時,將同度量因素固定在基期;在編制質量指標指數時,將同度量因素固定在報告期。即
(1)數量指標指數(或稱為物量指數)為:
(2)質量指標指數(或稱為物價指數)為:
(三)平均數指數
1.平均數指數的編制原理
(1)編制平均數指數的“權”的問題和“型”的問題
平均數指數是綜合指數的變形,與綜合指數恰好相反,編制平均指數的基本方式是“先對比,后平均”,即首先通過對比計算個別現象的個體指數,然后將個體指數加以平均后得到總指數。
①“權”的問題
由于總體中的不同個體常常具有不同的重要性程度,因而在平均指數的編制過程中必須對個體指數進行適當加權,這是平均指數的“權”的問題。
根據經濟分析的一般要求,平均指數的權數應該是與所要編制的指數密切相關的價值總量,權數的水平一般取自基期的總值資料(p0q0)和報告期的總值資料(p1q1)。
②“型”的問題
在對個體指數進行平均時,又可以考慮各種不同的平均數形式,這是平均指數的“型”的問題。平均指數的形式一般有算術平均指數、調和平均指數兩種形式。
(2)加權平均指數的基本編制原理
①為了對復雜現象總體進行對比分析,首先對構成總體的個別元素計算個體指數,所得到的無量綱化的相對數是編制總指數的基礎。
②為了反映個別元素在總體中的重要性的差異,必須以相應的總值指標作為權數對個體指數進行加權平均,就得到說明總體現象數量對比關系的總指數。
2.加權算術平均指數
編制加權算術平均指數的步驟如下:
(1)計算所研究現象的個體指數:。
(2)對它以基期總值加權計算算術平均指數,因此,一般給出基期總值為權數資料。
(3)以個體指數為變量,以p0q0為權數,用加權算術平均數形式,求得總指數。
因此,加權算術平均的物量指數分別為:
加權算術平均數指數是綜合指數中的數量指標指數的變形,二者就是根據不同的資料而采用不同的方式進行計算,如果資料全面,二者計算得到的數值是相等的。
3.加權調和平均數指數
編制加權算術平均數指數的步驟如下:
(1)用已知的資料計算個體指數:。
(2)對它以報告期總值加權計算調和平均數,一般給出(或搜集)報告期總值為權數資料。
(3)以個體指數為變量,以p1q1為權數,用加權調和平均數形式,求得總指數。
因此,加權調和平均的物價指數為:
從加權調和平均的物價指數可以看出,它是綜合指數中的質量指標指數的變形,二者就是根據不同的資料而采用不同的方式進行計算,如果資料全面,二者計算得到的數值是相等的。
(四)指數體系分析
1.指數體系的概念
在統計研究中,把經濟上有密切聯系,數量上保持一定關系的三個或三個以上指數構成的整體,稱為指數體系。
在實際生活中,社會經濟現象反映總體變動所形成的指數也可分解成為數量指標指數和質量指標指數,其相乘關系的等式仍然成立。如:
銷售額指數=銷售量指數×銷售價格指數
總產值指數=產量指數×產品價格指數
總成本指數=產量指數×單位產品成本指數
銷售利潤指數=銷售量指數×銷售價格指數×銷售利潤率指數
這些指數體系都是建立在有關指數化指標之間的經濟聯系基礎之上的,具有非常實際的經濟分析意義。
2.指數體系分析的作用
(1)進行“因素分析”
從數量方面研究分析社會經濟現象的總變動中各有關因素變動的影響程度和絕對效果。
(2)進行“指數推算”
根據已知的指數之間的聯系,推算未知的指數。
3.指數體系的分析
由于復雜現象總體的變動是受多個影響因素變動共同作用的結果,利用指數體系,就可以分別測定各個影響因素對所研究現象的影響。
綜合指數,以總量指標指數、質量指標綜合指數和數量指標綜合指數分別表示銷售額指數、銷售價格指數和銷售量指數,它們之間構成的指數體系如下:
銷售額指數=銷售量指數×銷售價格指數
銷售額的變動=銷售量引起銷售額的變動+價格引起的銷售額的變動
這樣可以從絕對量和相對量上分析銷售額的變動受銷售價格和銷售量的影響大小及影響的方向。
- 稅務系統會計業務能力應知應會習題集及要點精析
- 黑龍江省會計從業資格考試《會計電算化》【教材精講+真題解析】講義與視頻課程【20小時高清視頻】
- 注冊會計師《審計》歷年真題與模擬試題詳解【視頻講解】
- 會計從業資格考試《財經法規與會計職業道德》歷年真題詳解與考前押題試卷
- 甘肅省會計從業資格考試《會計基礎》歷年真題與模擬試題詳解
- 中國銀行業從業人員資格認證考試真題題庫:公共基礎
- 初級會計電算化(2012年度會計從業資格考試學習叢書)
- 全國會計從業資格考試標準教材與機考題庫:財經法規與會計職業道德
- 2019年經濟師《保險專業知識與實務(中級)》復習全書【要點精講+歷年真題詳解】
- 吉林省會計從業資格考試《財經法規與會計職業道德》歷年真題與模擬試題詳解
- 上海市會計從業資格考試《財經法規與會計職業道德》歷年真題與模擬試題詳解
- 稅法
- 深圳市會計從業資格考試《財經法規與會計職業道德》【教材精講+真題解析】講義與視頻課程【21小時高清視頻】
- 福建省會計從業資格考試《會計基礎》歷年真題與模擬試題詳解
- 2019年經濟師《工商管理專業知識與實務(中級)》過關必做1000題(含歷年真題)【視頻講解】