随着网络时代到来,大数据逐渐成为表征居民社会活动的重要载体。对此,国务院发展研究中心宏观经济研究部和国务院发展研究中心宏观决策支持大数据实验室,基于百度地图慧眼人口大数据开展了研究尝试——在数字中寻找迁徙的人,感受变动的城,也为研究城镇化提供了一个全新视角。
根据国家统计局公布数据,2015年末,我国常住人口城镇化率为56.1%,比全球中等偏上收入国家平均水平低7.5个百分点。然而,最新的时空大数据测算却显示,我国城镇人口比重已达62.2%,与中等偏上收入国家平均水平相当。
同时,研究还发现,目前我国实际形成了17个城市群,而“十三五”规划中的19个城市群中,部分城市群人口集聚功能并不明显。
这些研究成果,来自国务院发展研究中心宏观经济研究部和国务院发展研究中心宏观决策支持大数据实验室,基于百度地图慧眼人口大数据开展的一次研究尝试。
在数字中寻找迁徙的人,感受变动的城,也为研究城镇化提供了一个全新的视角。
原理:
过去3个月中出现频率最高的地方就是用户常住地
以往对城市人口的研究多借助政府统计部门的常住人口数据进行分析。在我国,人口统计数据的收集来自10年一次的全国人口普查,5年一次的1%人口抽样调查以及每年的抽样更新。我国刚刚决定于2020年11月1日起,正式开展第七次全国人口普查。普查得到的数据,具有较高的权威性。
随着网络时代的到来,大数据逐渐成为表征居民社会活动的重要载体,智能终端、社交网络、移动通信等信息技术的发展,足以勾勒出用户长期待在什么地方,什么时候从哪里去了哪里,待了多久,等等。而且,不同于一般意义上的常住人口分布或迁徙数据,这些居民地理行为的大数据在样本量、实时性和精确性等方面具有更大优势。
这正是此项研究的基础。据百度地图事业部总经理李莹介绍,截至目前,百度地图开放平台日均位置服务请求次数已经超过1200亿次,月活硬件设备数达到11亿,涵盖全国主要省市区行政区划。将上述匿名化数据合理处理并加密脱敏(目的是保护隐私),就可以得到百度位置大数据。
基于这些大数据,国务院发展研究中心宏观经济研究部开创了一个全新的研究思路。
课题协调人卓贤介绍,课题组将全国960余万平方公里陆地国土划分为连续的一平方公里方格,将每位百度用户在过去3个月中出现频率最高的方格定义为其常住地,并计算出每个方格内的百度用户数量及人口密度。
课题组还根据城乡人均手机保有量,将移动用户密度折算为人口密度;参照第六次全国人口普查乡镇街道平均密度,将人口密度超过1000人/平方公里的方格记为城镇方格;参照国际相关标准,将人口密度超过10000人/平方公里的方格定义为城市高密度区方格。
研究涉及的另一个数据是城市群。“我们主要应用DMSP-OLS夜间灯光大数据和百度位置大数据识别和界定城市群。”卓贤说。
夜间灯光大数据来源于美国国家海洋和大气管理局的国家地理数据中心,记录的是全球范围内夜间人类社会经济活动的强度信息,该系列数据已广泛应用于城市扩展经济评估、人口估算等人类活动研究中。而百度位置大数据不仅包括之前提到的慧眼常住人口密度数据,还包括百度迁徙数据。
“本研究共获取2015年到2016年每季度全国2870个县的平均常住人口。”卓贤透露,迁徙大数据主要是根据百度位置数据得到的城市与城市之间常住人口迁徙流动的数据,共获取2015年2至3月、2016年1至3月、2017年1至3月日均341个地级城市城与城之间迁徙人口,并选取了剔除节假日之外的迁徙人口总量进行分析。在数据样本上,尽量确保了研究的真实可信。
发现:
8385万人已经城镇化,却没有被统计
大数据打开了一扇观察我国城镇化发展现状的新窗口。
根据国家统计局公布数据,2015年末,我国城镇常住人口77116万人,乡村常住人口60346万人。而课题组根据大数据测算,我国城镇人口比重比统计数据高6.1个百分点,相当于有8385万人口已经长期生活在城镇地区,但是还没有被统计到城镇化人口之中。
“世界银行数据显示,2015年全球城镇化率平均为53.9%,其中高收入国家平均为81.1%,中等收入国家平均为50.5%,而中等偏上收入国家平均为63.6%。”卓贤介绍,我国作为中等偏上收入国家,按照统计城镇化率比同类国家明显低7.5个百分点,而按照大数据测算结果,两者相差缩小为1.4个百分点,并不存在城镇化明显滞后问题。
在城市群研究方面,大数据也给出了不一样的答案——根据夜间灯光密度分析,我国目前大致可划分为21个城市群,分别为长三角、珠三角、京津冀、成渝、武汉、长株潭、环鄱阳湖、中原、关中、南宁、山东半岛、晋中、滇中、海峡西岸、辽中南、宁夏沿黄、兰西、天山北坡、哈长、呼包鄂和黑龙江东北部城市群。而慧眼常住人口密度分析则显示,中国目前有22个城市群,多出了黔中城市群。
“我们认为,城市群应该是城市间人口流动强度更大,且本地区密度更大的地区。”卓贤说,综合各种分析,经过初步排除,基于联系度、集聚度和中心度综合识别的城市群,课题组最后确定了我国目前有17个城市群,分别是长三角、珠三角、京津冀、成渝、长株潭、武汉、中原、关中、北部湾、晋中、滇中、黔中、山东半岛、辽中南、海峡西岸、哈长及宁夏沿黄城市群。
大数据提示:
要突出对已进城常住人口的市民化
将大数据用于宏观经济管理已成为国际趋势。大数据不仅构建了一幅中国城市人口分布与流动的全景图,也提供了一种可能,让推动新型城镇化真正做到以人为核心,进而制定更有针对性的政策,体验数字变动背后的温情。
在技术逐渐消弭地区地理区隔的今天,城市最大的财富无疑是人。将人和城联系在一起的是公共服务和基础设施。“然而,在推进新型城镇化过程中,2017年户籍城镇化率已经比2012年提高了7个百分点,但非城镇户籍的城镇常住人口仅从2.34亿下降到2.25亿。”卓贤说,“如果再加上研究发现的约8000万没有当地户籍的城市流动人口,我国约有3亿城镇居民处于不能享受均等化公共服务的不稳定状态,对整个社会的和谐持续产生着不利影响。”
研究得到的启示就是,我国新型城镇化在吸引农村人口进一步转移的同时,政策重点应更加突出对已进城常住人口的市民化。卓贤表示,大数据告诉我们,约8385万人口实际已经进城,而且大多属于适龄劳动人口,但尚未纳入城镇常住人口体系,难以公平享有城镇居民医疗、教育、住房等基本公共服务。农村人口大规模向城市转移的阶段已经过去,在农业转移人口速度明显放缓的背景下,应尽快将城镇公共服务延伸至全部城镇常住居民,实现进城人口市民化。
国家对城市群界定最新的表述是 “十三五”规划中有关加快城市群建设的要求,其中提出的城市群包括京津冀、长三角、珠三角、山东半岛、海峡西岸、哈长、辽中南、中原、长江中游、成渝、关中平原、北部湾、晋中、呼包鄂榆、黔中、滇中、兰西、宁夏沿黄、天山北坡19个城市群。
“从城市群数量上看,‘十三五’期间,国家将重点打造的19个城市群与本研究得到的17个城市群有所出入。”卓贤说,“实际存在的城市群与国家城市群发展的规划目标是不一致的,间接反映了我国目前城市群还缺乏有效的区域协调。对此,课题组建议从国家层面建立城市群协调机制。同时应该科学建立城市群标准,建立动态调整机制。”