——基于2015年小普查思考
胡 英 李 睿
内容摘要:中国在2015年小普查结束了传统纸质问卷调查方式,在数据采集手段方面进行了改革和创新。调查采取两种方式,一是调查员利用手持终端设备(简称PDA)入户登记;二是住户通过互联网自主填报网络调查表。这两种调查方法是普查方法的一种全新尝试。本文通过分析总结2015年PDA入户登记和互联网填报方法应用的特点经验,为2020年人口普查利用现代信息技术改进数据采集的方法提供参考。
关键词:人口普查;数据采集方法;PDA入户登记;互联网填报
中图分类号:F325 文献标识码:A 文章编号:1004-7794(2017)07-0051-04
DOI: 10.13778/j.cnki.11-3705/c.2017.07.010
一、2015年小普查的数据采集方法
中国是世界上人口最多的发展中国家,2016年年末人口已达到13.83亿。根据《全国人口普查条例》,中国每10年(逢0)开展一次人口普查,两次人口普查之间(逢5)开展1%人口抽样调查(简称小普查)。改革开放以来,从1982—2015年,中国进行了4次人口普查和4次小普查,前7次都是调查员入户登记采用纸质调查表。
2015年小普查数据采集方法采取两种方式。一是调查员手持PDA入户登记。在入户登记时调查员根据申报人的回答在PDA中填写电子调查表,填报完成后由申报人进行电子签字确认,调查员核实无误后将这些信息直接上传到国家统计局数据平台。一个调查小区平均户数为80户,要求调查员在15天内完成。二是互联网填报方式。调查员上门摸底时确认调查小区内愿意进行互联网填报的受访户,在登记开始后,互联网在线调查表将由受访户根据网络密码,在7天内填报完成,并上传数据平台,如超过7天未填报,再由调查员使用PDA上门进行补报(见图1)。
图1 2015年小普查调查员工作流程图
按照调查方案的规定,采用哪一种数据采集方式是由住户根据自己的意愿自行选择的。调查员入户摸底时,会向住户发放《致调查户的一封信》,详细介绍两种数据采集方式。对选择互联网调查的住户,调查员需要向住户告知网络填报的用户名和密码,以及填报注意事项。网络填报的用户名和初始密码相同,是该住户的18位户编码。18位户编码由6位省地县码、3位乡镇街道码、3位村居委会码、3位调查小区码和3位小区内户码组成,能够反映每个住户的地址信息,是识别住户的唯一编码。住户使用户编码在线填报调查表,国家数据平台可以准确分辨和定位任何一个住户;同时,住户通过修改登陆的初始密码,也可以保护申报信息的安全。
2015年小普查登记的样本量为2453万人,登记户数为721万户,其中PDA 登记户数719万户,使用了PDA数量约10万台,互联网填报2.3万户。从调查时点2015年11月1日零时开始电子数据上报的情况看,调查登记期间国家数据平台运行正常,顺利接收了PDA端和互联网端采集的基础数据。数据上报呈现前缓后快的特点,上报进度从0~50%用时9天,而从50%~90%仅用时4天。截止到11月15日,上报进度达到了99.84%,在数据上报环节,实现了调查的预期目标。
二、2015年小普查数据采集方法比较
1. PDA入户登记的特点。
2015年小普查中,PDA入户登记同传统填写纸质调查表相比(见表1),体现了以下特点:一是节省了调查成本。小普查从传统的纸介质改变为电子介质,省掉了纸质调查表的印刷、分发运输、审核、录入、密封储存的环节。二是减轻了普查员携带调查表入户和核查调查表质量的负担。PDA调查问卷设计了详细的项目间的逻辑审核关系,即录、即审、即改,提高了效率。三是可随时掌握调查进度,实时监控。网络平台上可查到调查员用PDA登记的户数和人数等基本信息。四是数据传输避免了再生性的差错,提高了数据的保密性和准确性。过去普查中数据处理所用的模式是“统一组织,光电录入,分级处理”。PDA入户登记,调查数据一次性录入直接传送到国家数据平台,减少了中间环节和数据审核工作量。同时PDA调查数据提交后,不能修改数据,避免了人为修改。从这次调查的数据审核工作看,上报到国家平台的数据仅有极少量强制性逻辑审核错误,这一阶段只需完成确认性审核修改和职业编码工作,大幅减少了数据审核净化的工作量,为尽早开展数据评估和发布公报奠定了基础。
尽管使用PDA填报和互联网填报与纸质调查表相比优势明显,能够便捷、快速实现调查数据采集、报送、处理一体化管理,但在小普查中也反映了一些问题。
一是选聘“两员”(调查员、指导员)难。PDA调查对“两员”素质要求高。不仅要求调查员工作责任心强,有入户调查经验,熟悉调查小区环境,还要能够熟练操作PDA等电子设备。首先是“找人难”,在社区有一定工作能力的青壮年,大多是上班族或在外打工,很难有时间从事调查工作,“两员”工作报酬较低,也缺少吸引力;还有“专心难”,社区、村(居)委会熟悉当地情况的文书、会计,还有乡镇、街道办事处统计站工作人员,往往肩负多项工作,只是兼职从事调查工作,不能集中精力,调查工作很难做细。
二是PDA培训效果难到位。调查人员现场工作能力参差不齐,熟悉PDA调查操作程序需要较长时间,而小普查培训时间较紧,对程序的推送、下载、注册、安装、登录、录入、修改、保存、上传、备份、软件更新等操作以及实地演练的时间较短,调查员在培训后摸索体会的时间短,而普查是10年一次非经常性调查,调查员存在临时思想,对熟练掌握PDA下功夫相对较少,由于缺乏熟练度,有的调查员用PDA调查所花费的时间更长。例如个别调查员使用PDA完成一户3口之家的登记,大约需要20~30分钟,比使用纸质调查表还多用10分钟。特别是年纪偏大的普查员,使用PDA更困难。
三是PDA维护难。电子设备更新快,寿命较短,易损坏,且维修费用高。小普查中采用的多是其他调查使用过的PDA、设备旧,不同程度存在待机时间短、充电困难、反应迟钝,影响调查进度。
四是PDA网络平台不稳定,对设备的环境要求较高。调查员在使用PDA调查过程中,上传数据存在丢包、信息不完整等问题,影响了调查工作进度和数据的安全性。从2015年小普查现场调查情况看,由于对使用PDA采集数据设备环境稳定性和安全感的怀疑,一些地区为了防止PDA调查丢失数据,在入户登记调查时还是采用先填写纸质表、最后再集中录入到PDA的方式。这样既降低了工作效率,又增加了成本,还会产生再生性误差。
2.互联网填报方法的特点。
互联网填报方法除了上述手持PDA入户登记的4个优点外,还解决了调查员入户难和保护被访问者的隐私的问题,这是PDA入户登记和传统的填写纸质调查表难以解决的。由于社会公众越来越重视个人隐私的保护,不愿意向外人透露自己的信息,拒绝配合调查的情况时有发生。如果住户选择网络填报,并在网上能按时填报,调查员人数和工作量会大大减少。互联网填报方法解决了“上门难”问题,还能打消被调查户的顾虑,保护个人隐私。而PDA登记,调查员可能需要多次入户才能与被调查户见面。同时,在现场调查时,PDA使用中出现的故障、丢失数据等拖延了调查时间,容易使被调查户失去耐心。
2015年小普查互联网填报方式在实践中也存在一些问题。
一是填报质量受到质疑。小普查调查表户记录12项,人口记录32项,内容多、逻辑性强,涉及到人口婚姻,生育、死亡、流动、户籍登记现住地,原住地,受教育程度,就业、失业,职业行业,社会保障和住房条件。填报者没有像调查员那样受过专门培训,对调查表部分指标难以理解,在填报过程中遇到疑难点,仅凭个人理解填写,出现了填报错误,加大后期审核的工作量。
二是受城乡差异、教育程度、年龄差别等因素的影响,使得调查对象中相当部分老人及外来务工人员等缺乏网络填报的能力,也使本次调查互联网填报方式的推广受到很大的制约。
三是调查户自行上网填报意愿不强烈。尽管在调查摸底时,由于不希望调查员入户,自行选择愿意互联网填报,但在填报中遇见困难或者其他事务耽搁,最后还是放弃或者忘记填报,调查员还需上门持PDA进行补报,延误了调查进度。
四是网络填报环境受到局限,网络填报的用户界面不完善。由于网络填报对计算机硬件、软件系统有一定的要求,调查涉及到住户必须用电脑上网填报,而现在大多数人在家是采用手机上网。
表1 数据采集方法的比较
| |||
特点 | 纸质调查表 | PDA入户登记 | 互联网自填 |
调查成本 | × | × | √ |
调查时间 | √ | √ | - |
问卷难度 | √ | √ | × |
回答率 | √ | √ | - |
数据质量 | √ | √ | - |
入户难 | × | × | √ |
保护住户隐私 | - | - | √ |
两员选调难度 | × | × | √ |
调查适应人群 | √ | √ | - |
“注”表1中优良√、一般 -、较差×。 |
三、2020年普查数据采集方法思考
1. 普查应用多模式的数据采集方法。
根据联合国统计司的统计,截至2014年,全球已有214个国家和地区完成了2010年人口普查,覆盖人口达到64亿人,占全球人口的93%。在2010年普查中,一些新技术获得了更多地应用,包括地理信息系统(GIS)、手持电子设备、互联网调查、智能手机和其他移动设备和电话调查等。在2010年人口和住房普查中,有30多个国家使用互联网进行普查,其中:加拿大54%、葡萄牙50%、韩国47.9%、新西兰35%、澳大利亚33%、意大利33%、英国15% 的人通过互联网普查。对于2020年的人口普查,联合国统计司已发布《人口和住房普查原则与建议》(第三版),用于指导世界各国开展2020年人口普查。主要有3种方法:一是基于全面行政登记的普查;二是采用抽样调查、行政登记、普查表相结合的方法;三是仍采用传统的普查登记方式,但应用多模式的数据采集方法,包括互联网和手持设备采集技术。
目前中国人口普查遇到的关键问题是调查员难聘和入户难的问题。互联网填报在这两方面具有优势,是PDA入户登记和填写纸质调查表方法不可比拟的。互联网填报不仅在减少调查成本和数据传输高效便捷方面具有PDA登记方法的同等优势,而且能解决调查员选聘难和入户难的问题,是调查方法本质的改变。随着计算机网络的技术发展和网络应用的不断普及,中国人口素质及普查意识的提高,互联网填报在问卷难度、回答率、数据质量等方面出现的问题都将不断改进和完善。2016年6月底,中国网民规模达7.10亿,互联网普及率达到51.7%,半数中国人已接入互联网。当前在全社会大力发展“互联网+”的形势下,互联网填报方法优势突出,普查采用互联网或手机填报的模式将是一种发展趋势。我们认为,2020年人口普查数据采集方法应加大互联网填报的比例。
2. 改进完善互联网填报方法。
我国2015年1%人口抽样调查结束了传统纸质问卷调查方式,在数据采集手段方面进行了改革和创新。在软件使用方面,尽管还有一些方面尚需完善,但PDA和互联网数据采集程序总体上运行稳定、易于操作,确保住户基础数据成功采集,实现入户调查与数据采集录入的同步进行,有效提供了工作效率,减少了再生性差错的产生。此外,在降低调查成本、实时掌握调查进度、保护住户隐私等方面,电子采集方式尤其是互联网调查都具有明显的优势。中国在2015小普查中采用互联网络填报,全国尽管仅有2.3万户,比例为3.2‰,但在有的省互联网填报取得了良好效果,互联网填报的户数比例达到4.11%,有的市达到13.1%。这些为2020普查开展互联网填报的可操作性分析提供了依据。
通过分析2015小普查中2.3万户互联网络填报数据的质量,结合学习国内外使用互联网填报的经验和数据评估方法,2020年人口普查可进一步改进互联网填报的方法。
一是提高互联网填报人比例。要加大互联网填报宣传力度,通过各种宣传让被调查人及时了解政府采取的新手段,让用户了解互联网填报的安全性和保密性。特别是对年轻人居住较多的地区以及较新的住宅区开展宣传。年轻人更喜欢互联网填报,较新的住宅区生活网络设施齐全,便于互联网填报。创造条件使民众适应网络填报,强化填报责任意识。同时对参加互联网填报的调查者给予鼓励,例如给予参加网络填报的家庭一些奖励,鼓励被调查者的参与。
二是在普查表项目设计更适合被调查户网络自填。简化操作流程及调查内容,创新网络填报手段。简化登陆用户名及密码,例如,2015年小普查鉴于18位密码过长,较难填写,在下次普查可以采取技术手段将密码压缩至9~10位,能达到相同的效果,在心理降低受访户填报的难度感。为保证填报质量,在社区内配备调查员或者指导员进行帮助指导,以便受访户填报出现问题时可及时联系。
三是健全优质的网络环境和网络平台,创建灵活多样的互联网填报方式。如利用通信网络平台,智能手机填报,更方便、更快捷,增强调查对象参与调查的意愿。在各居(村)委、社区活动中心设立网络调查登记站,家里不具备网络填报条件的调查户可到调查登记站进行填报,在社区居住的外来务工人员可到调查登记站登记,登记站工作人员将给予指导和帮助。
四是积极探索互联网填报数据质量控制方法。同时充分利用大数据和人口行政记录信息作为辅助变量,评估互联网填报数据质量。
五是加强普查前的试点。互联网填报是一种循序渐进的过程,加强普查前的试点,使互联网填报在2020年普查能较好的应用。
参考文献
[1] 国家统计局. 2015年全国1%人口抽样调查方案. 2015.
[2] 国家统计局人口和就业统计司. 2015年全国1%人口抽样调查调查员手册[M]. 中国统计出版社, 2015.
[3] 联合国统计司. 联合国人口和住房普查原则与建议[M]. 3版. 中国统计出版社, 2015.
[4] 国家统计局人口和就业统计司. 2015年全国1%人口抽样调查技术业务总结[M]. 中国统计出版社, 2017.
作者简介:
胡英,国家统计局人口和就业统计司副巡视员。
李睿,国家统计局人口和就业统计司普查处主任科员。
了解更多请登陆 动力配电箱 http://3683.bidadk.com/donglipeidianxiang/