
第二节 中国基尼系数估计:基于问卷调查数据
中国的收入差距大是共识,但到底有多大一直存在分歧,有诸多国内外学者曾对中国的基尼系数进行过估计。根据2012年西南财经大学发布的《中国家庭金融调查报告》,2010年中国家庭基尼系数为0.61,但引起较大的争议。李实等(2013)认为,抽样方法和数据的结构偏差以及城乡低收入人群收入被低估造成了基尼系数的高估。一般认为,很难找到很完美的数据来准确地计算一个国家的基尼系数。但即便如此,我们还是试图用我们的调查数据对中国的基尼系数进行估计,仅供参考。
一 样本和收入
我们调查了中国31个省、区、市城乡居民的收入,共获得城镇个人有效问卷21425份,农村个人有效问卷4868份。这一数据样本的不足之处在于:一是城乡数据不平衡,城镇问卷明显多于农村问卷,这主要由农村问卷调查难度大所致;二是城镇问卷调查得到的是城镇居民的工资收入,农村问卷调查得到的是农民农业收入和非农收入,并未获得城镇和农民的财产性收入,尽管财产性收入很低;三是我们调查得到的是个人收入数据,而不是家庭人均的收入数据。
考虑不足之处一,为了计算出城乡平衡的基尼系数,我们对数据作如下调整:保留所有农村问卷4868份,根据2012年城镇化率51.27%,我们从城镇问卷中随机抽选5122份与之匹配。其方法是,根据2011年各省、区、市城镇务工人员占全国城镇务工人员比例在各省、区、市分配,随机选取,最终用于计算的问卷为9990份。
考虑不足之处二,根据2012年《中国统计年鉴》,2011年城镇居民人均年财产性收入只有649元,平均每月为54元。相比较我们调查得到的2012年中国城镇居民平均月工资收入3994元,因此,忽略财产性收入对估计基尼系数影响不大。
考虑不足之处三,由于讨论更多的是家庭人均收入的基尼系数,计算采用的也是家庭人均收入数据。为了和通常讨论的基尼系数进行对比,我们利用个人收入数据估计家庭人均收入,进而计算家庭人均收入的基尼系数。
我们基于这样的简单假设:一个家庭中,夫妻双方都有收入,并且双方的总收入是该家庭的总收入。根据调查数据,我们得到城镇居民中男性的平均收入是女性的1.4倍,农民中男性的平均收入是女性的1.36倍,这样我们就可以通过调查得到的男女一方的收入进一步估算出这个家庭的总收入。根据《中国住户调查年鉴2011》,城镇居民平均每户2.9人,农民平均每户4.0人,如此便可推算得到每个家庭的人均收入。由此我们可估算出9990个家庭的人均收入。
二 基尼系数计算方法
基尼系数的值取决于劳伦斯曲线与绝对平均分配线之间面积的大小,为此我们先画出劳伦斯曲线。
1.劳伦斯曲线
把9990个城乡家庭的人均收入从低到高排序,分成20组,这样就可以求得每组人口数量在总人口中的比例,和每组人口的收入在总收入中的比例,进而求得累计各个组的人口比例和累计各个组收入比例(见表3-11),在此基础上勾画出劳伦斯曲线(见图3-5)。
表3-11 各组人口分布和收入分布
图3-5 劳伦斯曲线
2.基尼系数
在图3-5中,用A 表示实际收入分配曲线与绝对平均曲线之间的面积,B表示实际收入分配曲线与绝对不平均曲线之间的面积,则基尼系数为G=A/(A+B)。
在具体计算基尼系数时,我们采用以下计算公式:
公式(3-1)中,Wi是按收入分组后各组的人口数占总人口数的比例,Yi是按收入分组后,各组人口所拥有的收入占收入总额的比例,Vi是Yi从i=1到i的累计数,即:
Vi=Y1+Y2+Y3+…+Yi (3-2)
根据表3-11中的数据,我们计算出:中国内地2012年城镇居民家庭人均收入的基尼系数为0.388,农村居民家庭人均收入的基尼系数为0.491,全部城乡居民家庭人均收入的基尼系数为0.475。
2013年1月18日,国家统计局公布了2003~2012年各年基尼系数,其中2012年基尼系数为0.474,结果和我们所估计的几乎无差别。国家统计局基尼系数公布后一直受到广泛的质疑,但基于我们问卷调查数据所计算出来的基尼系数支持了国家统计局公布的2012年的基尼系数。
此外,我们计算基于2012年问卷调查数据的城乡个人收入基尼系数,这一基尼系数所采用的数据是直接调查所获得的个人收入数据,且所用样本和估计家庭人均收入所用样本相同。经计算求得的城乡个人收入的基尼系数为0.488,和基于同样样本估计的城乡居民家庭人均收入的基尼系数0.475相差不大。
三 基尼系数的变化——基于近几年郑州数据
近年来中国的收入差距是拉大还是缩小,一直是一个有争论的问题。根据2013年1月18日国家统计局公布的2003~2012年基尼系数,中国基尼系数从2008年始呈下降趋势(见图1-1)。对此,学术界和民间都普遍质疑。许小年感慨:“连童话都不敢这么写。”中国人民大学经济学院副院长刘元春却认为,国家统计局的基尼系数样本量较大,而且基本保证了时间上的连续性,因而相对更科学、更有参照性。
我们2012年的问卷调查数据是横截面数据,不能用于分析基尼系数的变化趋势,但本书作者之一樊明2004年至2012年多次调查了郑州市居民的工资收入。采用这些问卷数据,可以对郑州市基尼系数从2004年到2012年的变化趋势进行估计,因为这是在同一个地方采用相同的问题进行的问卷调查,有较高的可比性。虽然这一估计无法回答中国基尼系数的变化趋势,但可提供一定的参考。表3-12和图3-6报告了5个时间点的郑州基尼系数变化,从中可以看出,郑州工资收入的基尼系数呈明显下降趋势。由此我们认为,全国基尼系数在近几年下降是可能的。
表3-12 近几年调查的郑州市居民工资收入及基尼系数
图3-6 郑州市居民工资收入基尼系数变化