ARIMA模型在区域人口预测的应用分析
摘要:通过时间序列的推移以及人口相应年龄段的死亡变化情况,对人口数量、结构等方面的数据进行预测是人口学常用方法之一,也就是人口年龄移算,这种方法主要运用的是ARIMA模型的推演。本文将以Q市数据为例,主要以六普静态数据为基础,结合六普之前五年人口变化趋势,进行ARIMA模型的实例分析。这在“两孩政策”全面放开的背景下,对政策效果实施前后效果变化进行评估等方面具有非常重要的借鉴意义。从人口的机械变动方面看区域人口数量变化:人口变化主要受内部推力和外部拉力的作用。区域经济、文化等方面发展现状对区域人口流出与流入产生有重大影响,把区域人口自然变动与区域机械变动综合考虑,最终做出科学的区域人口预测。
关键词:人口预测;年龄别死亡率;分性别死亡率;育ฝ龄妇女;预期寿命
2015年10月底,党的十八届五中全会召开,最引人注目的就是十八届五中全会公报允许普遍二孩,这就意味着我国将会全面放开二胎政策,对人口的变化态势有一个清楚的认识或者科学的预测是非常重要的,这关系着国计民生的发展,这意味着不仅在宏观上对人口结构做出调整,影响着整个经济社会的发展态势,也与千千万万个家庭生命周期的变动息息相关。
人口预测就是根据现有的人口状况并考虑影响人口发展的各种因素,按照科学的方法,测算在未来某个时间的人口规模、水平和趋势。ARIMA模型全称为“自回归移动平均模型”(Autoregressive Integrated Moving Average Model),该模型充分考虑时间序列下人口数量的变化的一项综合分析技术①。因为全面二孩的放开必然会引起出生水平的变化,同时对于相应的妇幼保健等社会保障体系也提出相应的高要求。本文以人口的自然变动为对象,在Q市2010年六普常住人口数据基础上对未来十年的人口数据进行预测,通过Excel表格统计,预测内容包括未来十年的出生人口、分性别分年龄人口数量,以及人口分性别预期寿命等数据。
一、人口自然变动预测所需数据简述
因为在十八届五中全会公报中提出了普遍二孩政策,也可以通过以后生育水平的变化来对比政策变动前的人口结构等方面的变化,也能为新的人口政策的效果评估提供相应的支持。在ARIMA模型的应用中,将会用到Q市六普人口年龄别死亡率Dn (右下角标n代表相应年龄)、六普人口分年龄分性别死亡率(男性为Dnm,女性为Dnf)、分年龄人口数Nn、分性别分年龄人口数(男性为Nnm,女性为Nnf),分年龄性别比,另外还有育龄期女性数量(NB)以及育龄期女性总ห体生育率(Bn ,n代表相应年龄)。
1、人口年龄别死亡率Dn与人口分年龄分性别死亡率
人口分年龄别死亡率是人口预测的基本要素,它决定着预测人口群体的预期寿命,影响着社会的社会幼儿抚养比与老年抚养比这两个社会重要负担指数。具体来讲,人口分年龄别死亡率就是某一年龄阶段的死亡人口数量占相应年龄阶段人口总数的比例,按千分数来计。例如Q市在六普中,0―1②岁人口数6140人,其中男性3318人女性2822人,男性死亡人数为22人女性死亡人数为31人。那么就可以计算出男性在此年龄段的死亡率D0m为6.63‰,女性在此年龄段的死亡率D0f为10.99‰,在此年龄段的总死亡率D0为8.63‰。从数据中可以看出Q市的出生性别比(只考虑活产婴儿数)是117.6,远高于合理的出生性别比范围上限107,另外在此年龄段女婴死亡率要高于男婴,综合这两方面因素可以看出,这是非常不利于本地人口结构中的男女比例走势的。
2、分年龄人口数Nn与分性别分年龄人口数
在人口自然变动中,分年龄人口数的按年数序列走势变动情况是每个年龄段死亡率直接后果。单纯考虑生命周期因素,处于相同年龄的人口数量是递减的,这就形成了总体人口的死亡率。但是由于处于育龄期的女性这一人口再生的承担者,人口就可以得以源源不断的延续下来。
本文在Q市人口ฐ数据推演中,以六普静态数据为基础,假定人口以当前的再生速度逐年变化来计算处于某一年龄段未来十年的变化。
例如在上面提到的六普数据:男性在0岁段的死亡率D0m为6.63‰,女性在0岁段的死亡率D0f为10.99‰,在0岁段的总死亡率D0为8.63‰,另外0岁断男性3318人,0岁段女性2822人。上述数据为六普统计的在2010年的静态的数据,0岁段人口在2011年按照时间序列来看,自动变为1岁段人口,1岁段人口正是0岁段人口数量减去0岁段人口死亡数量,也就是0岁段人口能存活至下一年的数量就是我们所要预测的在人口自然变动下1岁段人口数量。
同样的,2011年的2岁段人口我们用2010年的1岁段人口来计算,也就是2010年的1岁人口减去相应的岁数群体的死亡数量。后面年龄的人口数量以此类推,最终止于100岁年龄段,100岁以上年龄段由于人口很少,❅本文在预测中将100岁以上的人口划归为一组。
3、育龄期女性数量NB以及育龄期女性总体生育率Bn
在上面的人口推移中,我们很容易发现一个问题,那就是2011年的新生人数从何计算,到后面2012年0岁和1岁人口数量也是不知道的,后面的2013年、2014年……直至2020年1-9岁的分年龄段人口数量都不存在的,这部分人口又怎样计算呢?这就需要我们看育龄期女性的数量以及这一群体的生育率水平了。
育龄期数量和生育率水平仍是根据六普静态数据来看的,人口学对育龄期妇女的年龄规定是15-49岁,在本文中,我们按照人口学规定来计算以及预测。在Q市的六普数据中,15-49岁的育龄期妇女总数为131901人,而2010年活产婴儿数为6140人,这样生育率水平就得出为46.55‰。我们将假定2010年未来十年生育率水平稳定不变,那么通过对后面相应年份的育龄期妇女进行预测,我们将得到2011年的0岁婴儿数量为2011年15-49岁育龄期妇女数量乘以46.55‰,2011年15-49岁人口数量为152049人,那么2011年的0岁组人口数量为7078人,同样2012年缺失的0岁组与1岁组人口也可以相应的求出来,以此类推将会得到2013年0-2岁人口数据、2014年0-3岁人口数据……2020年0-9岁人口数据。 二、人口自然变动在人口预测应用
在根据Q市六普数据进行人口预测后,还可以对分年龄分性别人口数量进行预测,当完成分年龄分性别人口数量预测后就能对Q市人口预期寿命以及分性别预期寿命进行预测了。
首先是分性别人口预测,难点在于怎样对新生人口性别作出预测。在这里本文将不再单纯采用六普静态数据,而是借鉴2006-2010年五年的性别比,性别比数据ฌ均来自Q市的人口统计数据。通过对五年的分年龄性别比进行加权求平均值,最终确定新生婴儿的出生性别比。例如从06年至10年,Q市0岁人口性别比分别为121、120、109、116、117,那么进行加权求均值以后出生性别比为116.6。所以本文按照116.6的性别比,结合分性别分年龄死亡率来推算随后几年的男女人数。
当利用ARIMA模型完成上述预测步骤时,我们就可以利用人口学平均寿命计算公式来预测预期寿命了,平均寿命计算逻辑是某一固定群体他们存活的总年数闭上这一群体的数量。本文上面所做的人口预测就是看某年出生的那群人经过逐年的死亡概率最终全部死亡的过程,最后超过一百的人口因为数量较少,且不会超过一百岁太多,在计算过程中暂且按照100岁来计算。具体公式如下(1.1):
简单来讲就是活一年而死亡的人数乘以1,活两年而死亡的人数乘以2……活一百年而死亡的人数的乘以100。一百年以上的因为数量少,为了方便计算也乘以一百。这样全体人口能够存活的年龄总和再除以相应年份死亡人口的总数,就得出这一年的人口平均寿命。因为我们可以通过ARIMA模型对相应年份的人口数据作出预测,包括分年龄分性别死亡数量,我们就能计算出预期总体平均寿命和分性别预期平均寿命。
三、人口机械变动预测所需考虑因素
人口在社会经济发展过程中起着决定作用:人口的数量、质量等因素是区域发展重要考虑的问题,在Q市近年来的发展中,很难留住高素质人才以及大量劳动力的流失一直制约着本地区的发展。新的社会规划中就将重点提到人口这一因素,提出相应人口变化指标。人口机械变动和自然变动是完全不同的两个概念,自然变动是依靠相对稳定的人口出生率与死亡率,而机械变动就要看之前几年的人口变化趋势结合经济发展趋势,找出机械变动与经济等因素的相关性规律。区域经济的发展、生活水平的提高等因素不仅可以留得住人口,也能起到吸引人口的作用。
奥肯对美国经济发展的研究,得出奥肯定律。奥肯定律是指随着经济发展,社会失业率有规律下降,并且指出相关指数关系。但是这在我国是不适应的,我国经济发展与失业率的关系表现为经济发展速度是大大高于失业率的降低幅度的。因为后发的中国经济发展所走的资本不断深化道路,伴随着劳动生产率的提高,实际上对于劳动力的需求并没有预期中那么大,甚至有个别企业行业会缩减行业从业人口③。另外,产业结构调整带来的产业区域转移必然会影响人口动态:Q市因为把生态保护放在重要位置,所以在经济发展过程中对于重工业的迁入是持非常谨慎的态度。对于传统的农耕区采取了引导当地村民发展旅游业,通过服务行业来创收。但是也有学者对于区域经济与人口的关系研究,研究指出在SPSS分析结果中,生产总值与人口数量存在着0.825的强相关关系。
环境社会学家陈阿江曾经对“不可持续发展”做出如下判断:以破坏生态环境为代价来换取经济效益是不可持续发展道路,但是以贫穷状态持续下去也是一种不可持续发展。Q市马上出台新的五年规划,从政府办公室获悉,在这五年规划当中,对经济发展、生态保护以及人口指标都将提出具体要求。生态环境政策在Q市也影响着人口的发展,生态政策会引导甚至是带有强制色彩的行政命令,造成区域人口的迁移,可能在短期可能会造成一些人口的经济收入下降,但是对于区域经济的长远发展是非常有利的。这对于政府也提出了相应的高要求:在政策制定与实施中,要与政策承受者进行换位思考,不仅能考虑到区域的发展,也能兼顾到群众的切身利益。
Q市近年来人口流动情况是流出大于流入,但是流出趋势是减缓的,一方面是因为本地区的产业发展留住了很多劳动力,另一方面Q市开始重视人才的培养与吸引。对于人口的迁移状况,可以根据近年来的流动趋势,结合未来将要发展的产业数量、产业规模,考察劳动力吸纳情况。
四、讨论
单纯的依靠年龄推移来计算区域人口虽然符合生命走势展规律,但是因为人口个体是具有自主意志决定自身空间区位的,所以要相对区域人口的变动做出预测,一定要结合未来可能的机械变动,而机械变动某种程度上也是可预见的。一个区域将要调整的产业结构、将要发展的项目都是有规划的,这会带来多少人口新的就业、将会吸引多少人口都是可以预测的。另外,由于区域规划的需要,或许出于经济发展考虑,或许出于环境保护的考虑,人口的动向都应是政府实时掌握以及提前预见到的。Q市由于在新的规划中,将会迁移一个生态保护区的全体人口来保护生他环境、发展旅游业,另外引入新的铝厂、火电厂等实业来发展经济。如果在未来几年,相应的工作规划能够达到的话,那么再结合人口的自然变动,人口预测将会对社会发展具有重要风向标作用。
十八届五中全会公报允许普遍二孩,这是我国计划生育政策的重大调整。人口预测必须以事实为依据,重新考察以往数据的适用性,做出人口学具有学科背景的理性判断。通过科学方法对人口做出预测不仅对于经济社会的发展做出导向作用,也为政策的评估提供科学依据。
注释
① 安和平:《中国人口预测的自回归分布滞后模型研究》,《统计与决策》2005年第16期,第4~7页。
② 在此处0-1岁人口统计为活产婴儿数量,死亡婴儿数量为出生以后未满一岁的婴儿数量。
③ 李晓嘉,刘鹏:《我国经济增长与就业增长关系的实证研究》,《国民经济管理》2005年第5期25~28页
参考文献
[1] 安和平.中国人口预测的自回归分布滞后模型研究[J],统计与决策,2005,16:4~7.
[2] 王婷,王国梁.清徐县人口的时空变化特点及原因分析[J].山西师范大学学报,2015,1:123~128
[3] 涂雄苓,徐海云.ARIMA与指数平滑法在我国人口预测中的比较研究[J],统计与决策,2009,16:21~23.
[4] 马晓红,侯亚非.北京未来50年人口变动趋势预测研究[J],市场与人口分析,2004,2:46~49.
[5] 田飞.21世纪初人口场景预测研究回顾[J],人口与发展,2010,2:48~51.
[6] 李晓嘉,刘鹏.我国经济增长与就业增长关系的实证研究[J],国民经济管理,2005,5:25~28
[7] 温勇,尹勤,帅友良.人口统计学[M].南京:东南大学出版社,2006:285~295.
[8] 陈阿江.次生焦虑――太湖流域水污染的社会解读[M].中国社会科学出版社,2010