- 深圳大學理論經濟學博士后研究報告文集(第一輯)
- 陶一桃主編
- 1469字
- 2022-07-26 18:46:12
3.3 研究樣本與變量構建
3.3.1 中國健康與營養調查數據
本研究使用中國健康與營養調查(China Health and Nutrition Survey,CHNS)數據。該微觀調查數據庫針對遼寧、黑龍江、江蘇、山東、河南、湖北、湖南、廣西和貴州等9個省份,采用追蹤入戶調查的方式,采集了人口特征、教育、就業、社區等信息。CHNS調查范圍覆蓋了中國北方與南方、沿海與內地、發達與欠發達省份,具有較好的代表性。截至2015年4月,CHNS調查公布了9次調查數據,分別為1989年、1991年、1993年、1997年、2000年、2004年、2006年、2009年和2011年。該項目采用多階段整群抽樣,采集了4400個家庭、26000個體數據。本研究基于CHNS構建面板數據。首先,基于親屬關系識別碼進行父親—子女關系配對。其次,剔除子女出生晚于1989年或早于1960年的觀察值。最后,剔除農村家庭樣本,重點分析城鎮家庭。(7)經過父子關系配對,刪除不可靠信息和農村樣本,最終得到適合本研究的有效樣本量為1025。本文將研究對象劃分為三個年齡群組:“60后”群組(出生于1960—1969年);“70后”群組(出生于1970—1979年)和“80后”群組(出生于1980—1989年)。
3.3.2 實證分析所用變量構建
職業。本研究根據CHNS提供的職業信息確定父親和子女職業類別,并在CHNS的職業信息基礎上進行二次分類,以便制作實證分析所需的社會流動表。由于職業狀態隨著年齡增長而趨于穩定,當子女職業在CHNS調查期內存在多次變動時,則使用最后一次調查的職業狀態數據。如果調查期內父親職業有過變動,則以父親40歲左右時的職業狀態確定職業類別。我們參考Long & Ferrie(2013)的職業分類,結合李路路和朱斌(2015)、周興和張鵬(2014)的分類方式,依據CHNS提供的主要職業信息,將職業分為以下4種類型:管理人員、技術人員、服務職員和普通工人。本研究重點分析城鎮部門代際流動性,職業類別中未包含“農民”階層。(8)
收入。CHNS將收入數據折算為2009年價值。父親收入以調查期內各期收入的均值表示;子女收入取最新一期調查結果。(9)本研究還使用收入數據構建代際流動表,以考察結論的穩健性。將樣本數據中父親和子女的收入分別依據25%、50%和75%分位數劃分為4個階層,即低收入階層、中低收入階層、中高收入階層和高收入階層。在劃分收入階層時,子女收入地位的比較范圍是其所屬年齡群組。本研究之所以使用相對收入劃分階層,原因在于代際流動性更關注階層之間的流動,而非絕對收入的變動。表3-1的數據表明,不同年齡群組的收入具有顯著差異,子女收入普遍高于父親收入。“60后”“70后”與“80后”父親收入的方差不斷增大,表明家庭背景日益分化。
教育。教育變量為接受正規學校教育的年數。由表3-1可知,三個群組平均受教育程度逐漸提升,且子女受教育程度普遍高于父親。“70后”群組的平均受教育水平比“60后”平均受教育水平提升了1.85年。“80后”群組的平均受教育水平達到13.44年,比“70后”群組提高了2.64年,比“60后”群組提高了4.49年。“80后”受教育年限方差顯著小于“60后”和“70后”,表明“80后”的教育公平性有所提升。
表3-1 描述性統計

注:數據來源為中國健康與營養調查(CHNS),表格統計了各變量均值,括號中的統計量為方差。身體質量指數BMI=體重(kg)/身高的平方(m2),中國衛生部確立的BMI健康區間為18.5~23.9。城市化指數已剔除教育指數影響。
其他控制變量包括年齡、性別、婚姻、健康、父親變量和環境變量等。本研究使用身體質量指數(Body Mass Index,BMI)衡量健康狀況,當指標在18.5~23.9區間時,健康虛擬變量值為1。為控制環境特征的影響,本研究借鑒秦雪征和王天宇(2014)引入沿海虛擬變量控制地區效應。若被調查家庭處于沿海省份,則“沿海”虛擬變量值為1。我們用CHNS提供的城市化指數控制經濟社會發展程度,以CHNS提供的描述社區平均教育水平的社區教育指數控制子女教育的內生性。