- 中國民生發展報告(2018~2019)
- 黃國英 任強 謝宇 涂平 張曉波
- 5350字
- 2019-10-14 12:30:47
第一章 收入分配
本章的主要內容是基于2016年中國家庭追蹤調查(China Family Panel Studies,CFPS)數據,描述2016年中國家庭純收入和人均家庭純收入的水平和構成,同時基于CFPS 2014,與2014年中國家庭純收入和人均家庭純收入的水平進行比較。我們將家庭收入按其來源分為工資性收入、經營性收入、轉移性收入、財產性收入和其他收入。其中,工資性收入是指家庭成員從事農業或非農受雇工作掙取的工資(稅后)、獎金和實物形式的福利。經營性收入是指家庭從事農、林、牧、副、漁業生產經營扣除成本后的凈收入(包括自產自銷部分),以及從事個體經營和開辦私營企業獲得的凈利潤。轉移性收入是指家庭通過政府的轉移支付(如養老金、補助、救濟金)和補償金(征地補償金、住房拆遷補償金)以及社會捐助(包括現金和實物)獲取的收入。財產性收入是指家庭通過投資及出租土地、房屋、生產資料(如機械設備、運輸工具、耐用品、牲畜)等獲得的收入。其他收入是指通過親友的經濟支持或贈予等其他途徑獲取的收入。
首先,我們對收入數據的清理過程進行說明。2014年和2016年的CFPS在個人問卷和家庭問卷中都調查了工資性收入,即通過個人問卷收集了每個從事受雇工作的受訪者的工資性收入,同時由家庭問卷的填答者報告家庭總收入。由于大量家庭(尤其是農村家庭)有家庭成員外出務工,部分家庭問卷的填答者不一定了解外出務工家庭成員的確切收入,只能依據寄回家的工資性收入進行估計,因此通過家庭問卷調查所得的家庭工資性收入可能偏低。為了避免家庭收入被低估,在數據清理過程中,我們以家庭問卷報告的工資性收入為基礎,如果遇到缺失值、0值或農村家戶個人問卷加總的工資性收入高于家庭問卷報告的收入的情況,則用個人問卷工資性收入的加總值來插補。需要注意的是,由于電子問卷跳轉的問題,CFPS 2016個人問卷中主要工作的工資性收入出現了大量缺失值,我們在插補這些缺失值的基礎上,利用收集和插補的個人工資性收入計算每個家庭中個人工資性收入的加總值。個人問卷中主要工作工資性收入的插補方法參見章后附錄。
一 2016年家庭純收入的水平和結構
表1-1描述了全國和五個獨立抽樣省份2016年家庭純收入的水平和結構。2016年全國家庭純收入的均值為67608元,中位數為45000元。從收入構成來看,工資性收入所占比重最高,為62.1%;其次是轉移性收入,為19.5%;再次是經營性收入,為13.9%;財產性收入和其他收入占家庭純收入的比重較小。為了更好地分析轉移性收入的性質和結構,我們將轉移性收入進一步細分為三類:第一類為各種政府和社會補助,如低保、救濟金等;第二類為養老金;第三類為住房拆遷補償金和征地補償金。通過分析這三類轉移性收入的占比,我們發現,從全國來看,轉移性收入的主要組成部分是養老金以及住房拆遷補償金和征地補償金。就養老金占比而言,上海和遼寧的養老金占家庭純收入的比重接近1/5。五個獨立抽樣省份的養老金比重主要是由地區經濟實力和人口老齡化水平兩方面因素決定的:一方面,東部發達地區的養老金水平較高;另一方面,上海和遼寧的人口老齡化程度相對較高——2016年我國65歲及以上老年人口占總人口的比重為10.8%,遼寧和上海的老年人口比重均高于全國平均水平,分別為13.2%和13.0%,河南、甘肅和廣東的老年人口比重均低于全國平均水平,分別為10.1%、10.0%和7.7%(國家統計局,2017)。同時,住房拆遷補償金和征地補償金也是轉移性收入的重要組成部分,這可能與我國近年來快速的城鎮化建設和城區改造相關。在五個獨立抽樣省份中,上海的家庭純收入最高并且優勢突出,均值為169516元,中位數為101080元;而家庭純收入最低的是甘肅,均值為49238元,中位數為37900元。平均而言,上海家庭的純收入是一個甘肅家庭的3.44倍,是同為經濟發達省份的廣東家庭的1.95倍。從收入構成來看,地區差異也很明顯:在遼寧、河南、甘肅和廣東,工資性收入是家庭收入最主要的來源,占比均在60%以上;而在上海,工資性收入所占比重接近50%,略高于轉移性收入。從轉移性收入的三個組成部分來看,一方面,上海的人口老齡化程度在全國名列前茅,社會保障體系相對健全,因此養老金占比相對較高;另一方面,更重要的是,上海住房拆遷補償金和征地補償金占家庭純收入的比重達到22.2%,是轉移性收入最主要的組成部分,這與上海的高房價密切相關。一些家庭通過近些年來的征地或住房拆遷等迅速致富,從而帶動了上海家庭純收入均值的大幅上升。另外,經營性收入的占比在一定程度上體現了一個地區的現代化程度,在現代化程度較高的地區,工資性收入占家庭總收入的比重一般也較高,而經營性收入所占的比重則相對較低。上海的經營性收入占比僅為3.1%;河南的經營性收入占比在五個獨立抽樣省份中最高,為16.2%。
表1-1 2016年五個獨立抽樣省份家庭純收入的水平和結構
表1-1描述的家庭純收入尚未控制家庭人口規模。在表1-2中,我們用家庭收入除以家庭人口規模得到了人均家庭純收入。表1-2顯示,全國人均家庭純收入的均值為20909元,中位數為12940元。從五個獨立抽樣省份看,五個獨立抽樣省份的人均家庭純收入差異較大。與表1-1相比,在控制了家庭人口規模的影響后,五個獨立抽樣省份的人均家庭純收入水平的排序發生了一些變化。從均值來看,上海依然最高,其次分別是廣東、遼寧、河南和甘肅,這在一定程度上體現了我國東、中、西部地區經濟發展水平的不均衡,上海人均家庭純收入的均值約為甘肅的4倍。從收入構成來看,上海的人均家庭工資性收入僅占人均家庭純收入的43.4%,人均家庭轉移性收入已經超過人均家庭工資性收入,成為人均家庭純收入最主要的來源,較高的人均家庭轉移性收入是上海的城市擴張和房價上漲造成的;同時上海的人均家庭經營性收入較低,不足3%,其余四省的人均家庭工資性收入占比均在60%以上,人均家庭經營性收入均在10%以上,人均家庭轉移性收入的占比在9.3%(廣東)到23.3%(遼寧)之間,和上海相比有較大差距。
表1-2 2016年五個獨立抽樣省份人均家庭純收入水平和結構
表1-3分城鄉描述了2016年家庭純收入的水平和結構。城鎮家庭純收入的均值和中位數明顯高于農村,這反映了城鄉在家庭純收入水平上仍存在巨大差異。從收入結構上看,農村家庭工資性收入的占比甚至高于城鎮家庭,這主要是因為大量農村年輕勞動力進城務工,他們的工資性收入已成為農村家庭非常重要的收入來源。城鎮家庭經營性收入的比重低于農村,因為絕大多數農村家庭仍在從事農業生產經營。轉移性收入體現出非常明顯的城鄉差異:在城鎮,養老金、住房拆遷補償金和征地補償金的占比大約為1/4;而在農村,以上轉移性收入的占比僅為9.6%。城鄉家庭在經營性收入上的差異反映了城鄉在現代化水平上的差異,而轉移性收入的差異主要反映了城鄉社會福利水平的差距以及城市化給城鎮居民帶來的補償性收益。
表1-3 2016年城鄉家庭純收入水平和結構
按人均家庭純收入計算,城鄉家庭在收入水平和結構上的差異依然明顯(見表1-4)。城鎮人均家庭純收入的均值為27654元,中位數為18333元;農村人均家庭純收入的均值為13794元,中位數為8500元,城鎮的人均家庭純收入均值為農村的2倍。與表1-3的結論相同,在收入結構上,城鄉家庭在工資性收入占比上的差異不大,農村家庭工資性收入所占比重略高于城鎮家庭,同時農村家庭相對較多地依賴經營性收入,而城鎮家庭的轉移性收入、財產性收入所占比重較高。從表1-1至表1-4可以看出,無論從地區來看還是分城鄉來看,財產性收入占家庭總收入的比重都不高。
表1-4 2016年城鄉人均家庭純收入水平和結構
二 2014年、2016年家庭收入水平的變化
在這一部分,我們比較了CFPS的追蹤家庭樣本在2014年和2016年調查時的收入變化。表1-5描述了2014年、2016年家庭純收入的變化情況。從全國來看,2016年家庭純收入的均值比2014年增長了28%,年平均增長率約為13%。各地家庭純收入均值的增長率差異較大:最低的是甘肅,為4%;最高的是廣東,為35%。由于樣本量的限制,各地的家庭純收入增長率可能并不十分準確,而全國的家庭純收入增長率則相對比較可信。
表1-5 2014年、2016年五個獨立抽樣省份家庭純收入的變化情況
表1-6描述了人均家庭純收入在2014年、2016年的變化。2016年全國人均家庭純收入增長了33%,年平均增長率約為15%。分地區來看,上海增長最慢,廣東增長最快。同樣由于樣本量的原因,五個獨立抽樣省份人均家庭純收入的增長率可能并不很準確。
表1-6 2014年、2016年五個獨立抽樣省份人均家庭純收入的變化情況
表1-7和表1-8分城鄉描述了2014年、2016年家庭純收入和人均家庭純收入的變化情況。無論城鎮還是農村,家庭純收入均有一定程度的增長。
表1-7 2014年、2016年城鄉家庭純收入的變化情況
表1-8 2014年、2016年城鄉人均家庭純收入的變化情況
參考文獻
國家統計局,2017,《中國統計年鑒(2017)》,北京:中國統計出版社。
附錄 個人問卷中主要工作工資性收入的插補方法
1.CFPS 2016主要工作工資性收入缺失
CFPS 2016成人問卷在跳轉過程中存在問題,導致受訪者主要工作的工資性收入(變量“incomeb”)出現了大量缺失值。造成該問題的主要原因是個人問卷只詢問了那些在2014~2016年間換過主要工作的個人的工資性收入,即這部分人的主要工作在CFPS 2014和CFPS 2016兩期調查之間發生了變化。而對那些主要工作未發生變化的個人,CFPS 2016調查未針對他們過去一年的主要工作工資性收入進行提問。
2.插補對象
在成人數據庫(cfps2016adult)中,有主要工作工資性收入記錄的樣本有5796個。我們的插補主要針對那些在2014~2016年間沒有換過主要工作(cfps2016adult庫中變量egc104c=1)、2016年主要工作為雇傭勞動(jobclass∈[3,5])、2016年受訪時無他人代答(proxyrpt=0)的受訪者,這部分樣本有4921個。此外,在CFPS 2016成人數據庫中,1044個樣本在2014~2016年間換過主要工作的受訪者的收入信息也存在缺失,他們的主要工作工資性收入也將被插補。綜上,有5965[4]個樣本是我們計劃插補主要工作工資性收入的對象,剔除插補預測變量缺失和2014年收入為0的缺失值樣本后,最終CFPS 2016成人數據庫中主要工作工資性收入缺失值可被填補的樣本為5793個。
3.插補方案
插補主要工作工資性收入缺失值的步驟如下。
(1)用OLS回歸模型(參見Eq.1)預測2014年主要工作工資性收入的自然對數值log_incomeb2014i′,這里的log_incomeb2014i′根據各省分城鄉的CPI調整為與2016年可比的值(參見Eq.2),i表示各樣本的序數。根據樣本的性別和城鄉居住地的不同,我們共建立了4個回歸模型來估計收入,基于城鎮男性、農村男性、城鎮女性和農村女性四個不同群體建立的回歸模型的R2依次為0.29、0.23、0.34和0.33。
(2)計算殘差εi,即2014年真實收入對數值與估計收入對數值之差(參見Eq.3)。
(3)用相同的回歸模型預測2016年主要工作工資性收入的自然對數值,對于有2014年主要工作工資性收入信息的受訪者,我們將其2016年收入對數值的估計值加上其本人2014年收入的殘差ε2014i,從而得到既包含預測模型的系統部分(systematic part)又包含隨機部分(random part)的估計結果(參見Eq.4),之后通過自然指數變換得到收入的估計值。
(4)對另一部分無法獲得2014年殘差的樣本(即缺少2014年主要工作工資性收入的信息或者收入為0),我們僅考慮回歸模型的系統部分,即以回歸模型估計出的主要工作工資性收入填補缺失值。
對于已收集到主要工作工資性收入的樣本,我們通過對比主要工作工資性收入的估計值和真實值發現,考慮了殘差項的這部分樣本(N=1417)的估計收入和實際收入的相關系數為0.43,并且配對樣本t檢驗的結果顯示兩者的均值沒有顯著差異;對于僅考慮回歸模型系統部分的這類樣本(N=4035),其估計收入和實際收入的相關系數為0.42。
Eq.1:
log_incomebi=β1nochangei+B2EDUi+β3expe_sqi+β4expei+β5whouri+B6OCCi+B7INDi+B8EMPi+β9hhwagei+B10PROVi+B11EDUi*nochangei+β12expe_sqi*nochangei+β13expi*nochangei+B14OCCi*nochangei+B15INDi*nochangei+B16EMPi*nochangei+β17hhwagei*nochangei+B18PROVi*nochangei+a+εi
其中,log_incomebi表示第i個人主要工作工資性收入的自然對數值;β和B分別表示回歸系數和回歸系數向量;nochangei表示2014~2016年間未換主要工作,EDUi表示受教育程度(包括文盲/半文盲、小學、初中、高中、大專、本科、碩士研究生及以上),expei和expe_sqi分別表示工作年限和工作年限的平方,whouri表示平均每周工作小時數,OCCi表示職業類型(兩位國標碼的職業分類),INDi表示行業門類(包括農、林、牧、漁業,采礦業,制造業,電力、熱力、燃氣及水的生產和供應業,建筑業,批發和零售業,交通運輸、倉儲和郵政業,住宿和餐飲業,信息傳輸、軟件和信息技術服務業,金融業,房地產業,租賃和商務服務業,科學研究和技術服務業,水利、環境和公共設施管理業,居民服務、修理和其他服務業,教育,衛生和社會工作,文化、體育和娛樂業,公共管理、社會保障和社會組織,國際組織,其他),EMPi表示雇主性質(包括政府部門/黨政機關/人民團體、事業單位、國有企業、私營企業、外商/港澳臺商企業、其他類型企業、個人/家庭、民辦非企業、其他),hhwagei表示人均家庭工資性收入加1后取對數(該變量從家庭經濟庫中獲得,分母為掙工資的家庭成員數),PROVi表示居住省份,a是常數項,εi是誤差項。
Eq.2:
log_incomeb2014i′=log_incomeb2014i*(CPI2015/100)*(CPI2016/100)
其中,log_incomeb2014i′代表每個樣本根據CPI調整的同2016年可比的2014年主要工作工資性收入對數值,log_incomeb2014i表示2014年主要工作工資性收入原始值的對數值,CPI2015和CPI2016分別表示國家統計局公布的2015年和2016年的消費者物價指數(分省份和城鄉)。
Eq.3:
其中,ε2014i代表2014年每個樣本收入對數值的殘差,log_incomeb2014i′表示每個人實際的2014年主要工作工資性收入(與2016年可比)的對數值,表示利用回歸模型估計的每個人主要工作工資性收入的對數值。
Eq.4:
其中,表示包含預測模型系統部分和隨機部分的2016年收入對數的估計值,
表示僅包含預測模型系統部分的2016年收入對數的估計值,ε2014i代表2014年每個樣本收入對數值的殘差。
[1] 趙曉航,香港中文大學社會學系博士研究生。
[2] 黃國英,深圳大學心理與社會學院助理教授。
[3] 謝宇,北京大學講席教授、社會研究中心主任,美國普林斯頓大學社會學教授、當代中國中心主任。
[4] 5965=4921+1044。