首页 » 妇女权益 » 浏览内容

2020年人口普查仿真分析(二)

3257 0
标签:

作者:易富贤                                    2020-11-11

 

编者按:易富贤,美国威斯康星大学麦迪逊分校研究员、美国妇产科医生、长期研究中国人口及计划生育政策等社会问题。2007年出版《大国空巢:走入歧途的中国计划生育》专著,引发广泛讨论。易富贤多年来一直是为数不多的中国人口研究领域令人瞩目的主要批评者之一。中国妇权组织创办人张菁曾在2008年、2009年间与易富贤先生探讨合作“计生项目”方案,但由于中国妇权基于以人权为基础的研究方向,可能会令易富贤的人口科学及中国人口传承的研究成果努力在中共体制内宣导、促使其改变政策將會遭到更大的阻力,因而没能共同合作。但支持和推广易富贤的研究成果,一直是中国妇权的重要关注点之一。

 

(接上文之一)

 

5、2000年、2010年普查存在的问题

 

统计局高估了出生数,也因此高估了总人口数,公布1998年、1999年总人口为12.48亿、12.59亿,预计2000年为12.70亿。但是2000年普查汇总人数远低于预期,经过复查、补漏,才凑成12.4亿;又额外“评估”出1.81%的漏报率,公布为12.658亿,才勉强与过去的数据衔接。但年龄结构却矛盾重重,比如普查表0-9岁只有15913万人(1991-2000年出生16424万人),那么2000年总人口=1990年人口+出生-死亡-净移出=114333万+16424万-7923万-116万=122718万人。

 

2010年普查实行“见人就登”、“见户口信息就登”,“区不漏房”、“房不漏户”、“户不漏人” ,并给各地“参考数”,要求符合预期。这种设计有利于重报,但是汇总数仍低于预期,比如福建省汇总人数只有3329万,但最后却公报为3689万,比汇总数多了10.8%。

 

即便依照2010年普查,0-19岁也只32274万人(有水分),意味着1991-2010年只出生33201万,那么2010年总人口=1990年人口+出生-死亡-净移出=114333万+33201万-16701万-531万=130302万人,但人口普查却公布为133972万人,与统计局公布的134091万人一致,公安部户籍、联合国也公布为134531万人、134134万人。其实这三套数据都存在巨量水分,只是存在于不同年龄组。2010年0-19岁的人口,户籍、统计年鉴分别为28063万、36149万;如果用户籍0-19岁加上统计年鉴的20+岁人口,那么2010年总人口只126005万。

 

为了让总人口数保持连续,2010年普查将大约7000万水分“塞”进了各年龄组,导致年龄结构失真。比如1990年普查的时点是7月1日,2010年普查时点是11月1日。1990年1岁、0岁分别有2333万人、2322万人;根据年龄别死亡率计算,到2004年、2005年15岁时,将减少到2304万、2285万;到2010年是21岁、20岁,将减少到2287万、2271万。教育数据佐证1990年普查是准确的:1990年的1岁、0岁孩子在2004年、2005年初中毕业,分别只有2087万、2123万毕业生;由于初中毛入学率为94.1%、95%,意味着15岁人口为2218万、2235万。但是2010年普查却公布21岁、20岁人口为2689万、2840万;平移到7月1日应为2619万、2791万,虚高了15%、23%。

 

1990年普查显示1989年出生了2385万人,总和生育率为2.25,其中一孩次生育率1.009(已经虚高了)。但是2010年普查公布21岁人口为2619万,意味着1989年出生了2740万人,那么总和生育率为2.58,一孩次生育率高达1.16,不但不存在单身、不孕、丁克,而且相当比例的妇女生了双胞胎?

 

其他年龄组也如此,比如1990年普查的2-29岁共61927万人,由于死亡,2010年22-49岁应减少到60071万人;但是2010年普查的22-49岁却有62035万人,20年来不但没有死亡,反而增加了。可见,2010年普查的质量非常差!

 

联合国的人口数据比中国官方的更加夸张,比如《世界人口展望-2019》公布中国2000年、2010年、2020年的总人口为12.906亿、13.688亿、14.393亿;并公布1989年的0岁人口为3095万,意味着总和生育率为2.98,一孩次生育率高达1.34!

 

2000年普查的年龄结构没有失真太多,2010年普查年龄结构已严重失真,但是两次普查以及2015年小普查、2016年抽样的生育率还是原始数据,可以根据生育率大致还原出生数。用生育率计算的出生数与国家统计局公布的出生数存在巨大的差值,比如根据2015年1.05、2016年1.24的总和生育率推算只出生了1000万人、1200万人,但是统计局公布出生了1655万人、1786万人,用“超生隐报”来解释数据差异。

 

2016年实行了全面二孩政策了,不存在“超生隐报”了。于是2017年、2018年年度抽样调查也调整生育率了,公布总和生育率为1.58、1.50,一孩次生育率高达0.67、0.64(比2015年小普查的0.56还高,也与社会发展水平不符),据此推算的出生数与统计局公布的出生1723万人、1523万人基本一致。如果2020年普查也调整生育率,那么不但总人口、年龄结构会失真,而且生育率也会失真,今后还原人口真相的难度很大。

 

人口普查对人力、财力的调动不亚于一场战争,比如2010年人口普查直接投入80亿元;600万人参与,间接成本600亿。但是2000年、2010年两次普查的质量都非常差,不但延误了人口政策调整,也误导了其他很多政策。

 

影响人口走势的因素很多,但是主流人口学家(国内、国际)的知识面非常狭窄,无力把握人口变化规律。当生育率和人口变化超出他们的预测时,他们不去充实自己的理论,而是削足适履,修改人口数据以“符合预期”。笔者并非科班出身的人口学者,但是作为医学博士和妇产科研究员,接受过人口学培训,尤其是还掌握与生育相关的生理学、病理学、心理学、伦理学、行为学、精神分析学等学科的知识(这是人口学家所不可能具备的知识),知识结构比人口学家要全面的多,因此每次判断都“不幸言中”。

 

水桶能装多少水取决于短板,但是有关部门每次都用“长板”思维来拼凑各套数据,导致虚报上亿出生人口。无利不起早,1997年之前,教育数据还没有水分,因为教育经费是由乡镇承担;2008年之前,活产数没有水分,因为农民生孩子是自费的;2012年之前户籍低龄组也还没有太多水分。在这些数据还是“清洁数据”时,相关部门不去参考这些数据,等到因为利益而变成了“污染数据”后,就一窝蜂用之修订生育率,这些数据看起来“互相佐证”,其实是互相污染。今后鼓励生育,相关部门必将虚报出生数以获取生育补贴。

 

6、根据社会发展水平判断生育率

 

随着社会发展水平的提高,生育率自发下降。收入、健康、教育是社会发展的三个维度。

 

图1 2000年世界各国、中国各省的社会发展水平与生育率

 

2000年各国的总和生育率、人均GDP、出生时预期寿命、女性中学教育毛入学率,来自世界银行。中国2000年各省的人均GDP来自国家统计局公布数据、出生时预期寿命来自《中国统计年鉴2012》。2000年“6+岁妇女受教育程度”是指6岁及以上妇女受过初中及以上教育者占同龄人的比例,来自2000年人口普查。

 

人均GDP提高,既提高养育成本(不利生育),也提高养育能力和社会福利(有利生育),世界各国、中国各省人均GDP与总和生育率都非直线相关,因此对于“诊断”生育率的价值较小。“生死相依”,各国和中国各省的预期寿命都与总和生育率强负相关。健康水平影响生育率的原因是多方面的,有社会行为学因素、心理学因素,比如婴儿死亡率降低,人们不再因为害怕未来孩子的成长风险而多生孩子;有生物学因素,比如长寿社会的人群中精子数量减少、内分泌水平改变、基因表达改变,长寿的日本佛系青年比例高,在18-39岁的日本成年人中,从没有过性生活的人高达1/4;有社会经济学因素,比如老年福利压制儿童福利。教育既改变了生育观念,又导致婚育年龄推迟,因此世界各国的女性中学毛入学率、中国各省6+岁妇女受教育程度都与生育率强负相关。人均GDP是影响生育率的“长板”,健康、教育指数是“短板”,某一块短板就足以导致生育率的下降,可以用健康和教育指标“诊断”生育率。

 

依照官方公布的数据,2010年、2015年、2020年中国大陆的预期寿命为74.83岁、76.34岁、77.6岁,相当于中国台湾1996年、2000年、2005年的水平,韩国1998年、2001年、2004年的水平,当时中国台湾的总和生育率为1.76、1.68、1.12,韩国的总和生育率为1.45、1.30、1.15。而如果依照2010年人口普查,中国大陆的预期寿命为77.9岁,相当于中国台湾2006年、韩国2005年的水平,当时两地的总和生育率为1.12、1.08;依照2015年小普查,中国大陆的预期寿命为81.3岁,比台湾地区2020年还高。中国台湾、韩国是鼓励生育,而中国大陆实行独生子女政策,可见中国普查、小普查所获得的2000年1.22、2010年1.18、2015年1.05的总和生育率是可信的。

 

图2中国人口上百万的17个少数民族的社会发展水平与生育率

 

预期寿命是根据人口普查的原始数据计算。“6+岁妇女受教育程度”是指6岁及以上人口受过初中(2000年)或高中(2010年)及以上教育者占同龄人的比例;“20-39岁妇女受教育程度”是指20-39岁妇女受过初中(2000年)或高中(2010年)及以上教育者占同龄人的比例。

 

除汉族、壮族外的人口上百万的17个少数民族2000年的出生时预期寿命、6+岁妇女、20-39岁妇女受教育程度(初中以上)与总和生育率强负相关、极强负相关。2010年的出生时预期寿命、6+岁妇女、20-39岁妇女受教育程度(高中以上)与总和生育率也是负相关。用2000年、2010年各自三个拟合公式推测,即便全国实行与少数民族同样宽松的生育政策,2000年的总和生育率也只会有1.323、1.374、1.325(均值为1.34),2010年只会有1.235、1.287、1.242(均值为1.25)。可见,2000年、2010年普查全国1.22、1.18的总和生育率误差并不大。而根据上面分析的1990年0岁、1岁数据,1990年普查的低龄组并不存在隐报。

 

全国在2014年、2016年相继实行单独二孩、全面二孩政策,仍然还达不到少数民族2010年的宽松度。2010年后中国的健康平和教育水平在大幅提高,比如预期寿命从2010年的74.83岁提高到2015年的76.34岁、2020年的77.6岁。6+岁妇女接受高中以上教育者的比例从2010年22.4%提高到2015年的27.7%、2018年的29.6%,预计2020年为31.4%。20-39岁妇女接受高中以上教育者的比例从2010年的34.2%提高到2015年的47.8%,预计2020年为54.9%。可见,2010年后的生育率下行势能很大。根据2010年的拟合公式推测,即便全国实行与少数民族同样宽松的生育政策,2015年的总和生育率也只会有1.123、1.123、0.939(均值为1.06),2020年只会有1.029、1.008、0.781(均值为0.94)。

 

2015年由于是单独二孩补偿性出生高峰年,因此小普查1.05的总和生育率是可信的;0.56的一孩次生育率(没有隐报的必要)也佐证了1.05的总和生育率是可信的,因为2015年中国台湾、香港、新加坡、韩国的一孩次生育率为0.60、0.64、0.60、0.65,总和生育率为1.18、1.20、1.24、1.24。全面二孩的补偿性出生到2020年已经消退,那么2020年的总和生育率应该低于0.94。

 

除了健康和教育参数外,生育意愿、离婚率、结婚率、妇女劳动参与率、避孕率也影响生育率。中国台湾目前的理想子女数还在2个以上,而中国大陆只有1.8-1.9个。2019年日本、韩国、台湾的粗离婚率只有1.7‰、2.2‰、2.3‰,而中国大陆高达3.4‰,尤其是东北高达4.8‰。2019年韩、台的离结比(离婚数与结婚数的比率)为46.3%、40.5%,而中国大陆高达49.5%。中国大陆的妇女更忙于“造物”而不是“造人”,2018年妇女劳动参与率为61%,而韩、台只有53%、51%。中国大陆的避孕率也比韩、台要高。2019年韩、台的总和生育率分别只有0.92、1.05,根据2020年上半年的出生数粗估2020年总和生育率约只有0.85、0.97,一孩次生育率约为0.48、0.50。中国大陆2020年的总和生育率应该低于中国台湾,而与韩国类似。计划生育不可逆地改变了中国的社会经济结构和人们的生育观,因此今后的生育率将比韩、台要低。

 

日本、韩国、中国台湾的每年出生数随着初婚人数的减少而直线下降,尤其是与20-24岁结婚人数极强正相关。中国的初婚结婚数从2013年的2386万人减少到2018年的1599万人,尤其是20-24年岁的结婚数从2011年的953万人锐减到2018年的436万人,意味着出生数会暴跌。结婚率的下降,一方面是年轻婚龄人口减少,一方面是婚育观念的改变、婚育年龄的推迟。25-29岁、30-34岁妇女中未婚比例从2010年的21.6%、5.4%提高到2015年的26.9%、7.0%,再提高到2018年的28.7%、8.5%。

 

日本、中国台湾、韩国都是随着离结比的提高,一孩次生育率直线下降。中国普查和小普查显示1989年、2000年、2010年、2015年的一孩次生育率为1.009、0.867、0.728、0.556,民政部的数据显示离结比分别为8.0%、14.3%、21.5%、31.1%,二者极强负相关,R值高达-0.999。东北的一孩次生育率领跌全国5年,2000年、2010年、2015年分别为0.79、0.59、0.41。京津冀、沪江浙则是领跌全国2年,2015年都为0.50。江西、河南的生育率相对较高,但是2015年一孩次生育率也只有0.56、0.55了。2019年全国的离结比高达49.5%(相当于东北2014年的水平),2015年后一孩次生育率应该并非随着离结比的提高而直线下降,但是肯定也大幅下降。中国台湾、韩国2015-2019年的一孩次生育率占总和生育率的比例平均为51%、54%;中国大陆2015年、2016年、2017年、2018年一孩次生育率占比分别为53%、55%、42%、43%(2017年、2018年是全面二孩补偿性出生高峰年),预计2020年会接近50%。假设2020年一孩次生育率占比为50%、46%,如果一孩次生育率为0.40,那么总和生育率为0.80、0.87;如果一孩次生育率为0.45,那么总和生育率为0.90、0.98;如果一孩次生育率为0.50,那么总和生育率为1.00、1.09。2020年的真实总和生育率不可能超过1.1,很可能低于0.90。

 

2020年由于疫情停工、封城,一季度结婚数减少44.7%,原以为二季度会反弹,但是同比只增加7.3%。全年的结婚数可能跌破800万,2021年的总和生育率可能会低于0.8,出生数将跌破700万,人口负增长400万。疫情会永久性地改变人们的习惯和社会经济结构,如果不采取措施,总和生育率可能会沿着东北的老路狂跌;东北从2000年的0.90降至2010年的0.75、2015年的0.56(意味着下一代人只是上一代人的1/4)。

 

7、2020年的人口数据仿真

 

经济数据的水分可能会被时间所消化,但人口数据是不可能长期隐瞒的。一方面人的平均寿命有七十多岁,今后的人口普查和其他数据会逐渐还原人口真相;一方面人口危机所引发的社会经济危机是无法隐瞒的(比如苏联人口问题早在1960年代就出问题,一直被隐瞒,但是1990年还是暴露出真相)。2020年11月1日将进行第七次全国人口普查,希望能获得客观真实的人口数据,不要像2000年、2010年普查那样为了“数据连续”而篡改人口数据。本文根据人口变化规律对2020年人口进行仿真分析,盼能为普查提供参考。

 

表1 1991-2000年出生的各套数据

 

 

“公报”是国家统计局公布的出生数据。“生育率”是用2000年普查、1995年小普查、年度抽样调查的总和生育率推算的出生数。“2000年普查”是将2000年普查的0-9岁的数据(时点是11月1日),先调整到7月1日(1990年普查的时点是7月1日),再用年龄别存活率逐年回推到出生年的出生数。“初中毕业”是根据2006-2015年的初中毕业生数推算的出生数,比如2007年、2015年初中毕业生为1963.7万人、1417.6万人,除以毛入学率98.0%、104.0%,推算15岁人口为2004万、1363万,再用年龄别存活率推算1992年、2000年出生了2084万人、1418万人。“2010年户籍”、“2015年户籍”是根据2010年户籍10-19岁、2015年户籍15-24岁用存活率推算的出生数。可见,后面5套出生数都远比统计局公布的要少。

 

那么哪一套数据最可靠?上面根据少数民族的生育率分析,2000年全国的总和生育率应该低于1.34(对应的出生数是1405万),可见“2015年户籍”、“2010年户籍” 、“初中毕业”的2000年出生数都偏高。2000年的总和生育率是来自人口普查、1995年是来自小普查,比较可靠。而年度抽样调查的总和生育率应该偏高,因为一孩次生育率偏高,比如1997年、1998年、1999年的一孩次生育率为1.043、1.043、1.030,高于1.0,违背生物学原则。用2000年人口普查0-9岁推算的出生数可能更可信。本文用两套方案估算1991-2020年的出生。A方案更接近实际,B方案作为上限参考。

 

A方案:1991-1999年的每年出生数是将“生育率”推算的出生与“2000年普查”这两套数据平均。2000年、2010年、2015年的总和生育率为1.22、1.18、1.05(普查、小普查的数据),中间年份线性穿插。假设2016年、2017年、2018年、2019年的出生数是2015年的1.079倍、1.041倍、92.1%、88.5%(统计局公布出生数据的比例),2020年的总和生育率为0.90。

 

B方案:1991-1999年的每年出生数是将“初中毕业”、“2010年户籍”、“2015年户籍”这三套数据平均。假设2000年、2010年的总和生育率为1.34、1.25(与少数民族一样宽松政策下的生育率),2015年为1.15,中间年份线性穿插。假设2016年、2017年、2018年、2019年的出生数是2015年的1.079倍、1.041倍、92.1%、88.5%,2020年的总和生育率为1.1。

 

表2 2020年年龄结构 单位:万人

 

可见,2020年中国的实际人口很可能只有12.55亿,不可能超过12.83亿。如果普查汇总数据略低于12.55亿,也是可能的;如果高于12.8亿,说明普查设计和方法可能存在问题。2020年0-17岁、18-64岁、65+岁、50+岁人口比例,在A方案下分别为15.5%、70.5%、14.1%、36.7%,在B方案下分别为16.5%、69.7%、13.8%、35.9%。老龄化指数是指100个儿童(0-14岁)对应的65+岁老人数,越高说明老龄化越严重,在A、B方案下,分别为111%、102%,相当于日本1999年、1997年的水平。

 

比较儒家文化圈地区(包括中国各省)、欧洲各国的人口结构和经济增长率,发现随着中位年龄、50+岁人口比例的提高、劳动力/老人(18-64岁/65+岁)的下降,经济增长率直线下降。2020年A、B方案的中位年龄分别为42.1岁、41.4岁,相当于日本2002年、2000年的水平。A、B方案的65+岁人口比例相当于日本1994年、1993年的水平,50+人口比例相当于日本1998年、1997年的水平。A、B方案的劳动力/老人为5.0、5.1,相当于日本1992年、1991年的水平。

 

表3 历年人口比较 单位:万人

 

 

 

 

 

 

中国妇权Women’s Rights in China
邮箱E-mail:wrichina@yahoo.com
网址Website:www.wrchina.org
回到页首