大数据----如今经常在人们口中被提及的一个热门词语,其技术应用已经渗透到社会生活的方方面面,诸如经济形势分析、国家食品药品安全、金融保险、医疗卫生、商业运营及项目策划等各个领域。较以往历届人口普查,2020年开展的第七次全国人口普查虽然任务增加很多,但因为充分借助与运用大数据技术进行数据比对复查,大大减少重登、漏登、错登等错误现象,从而使普查的各项数据指标更科学精确。作为一名基层人口普查工作者,我有三点明显体会。
一、大数据是排重查漏的“小能手”
2020年以前的历届人口普查都是用纸质调查表进行上户填写的,然后通过审表、编码、上机光电录入等程序,各个普查机构很难知道重登了张三还是漏登了李四。整个普查登记过程中,流动人口一直是人口普查工作的重难点问题,是最难啃的“硬骨头”,也是普查数据质量最难控制环节。一般情况下,偏远贫困地区的流出人口多,经济发展繁荣的沿海城市流入人口多。流出地可以根据户籍资料和入户登记整理出外出人口数量及去向,流入地因为难以及时准确接收到流出地提供的详细信息,而且经济发展地区普查任务重、人员结构复杂,加上人是随时流动的,导致大量外出半年以上的常住人口很容易漏登,居住地和户籍地则互相推诿扯皮。在2010年第六次全国人口普查期间,笔者就提出人口普查工作要充分运用网络平台共享流动人员信息的建议,但因为互联网发展还不发达,如何准确把握外出人口的流向也只有依靠这一次人口普查检验了。
第七次全国人口普查首次全程采用电脑和电子设备端(PAD或手机)进行上户调查工作。县市级普查机构前期把户口整顿后的户籍资料和卫健部门0-5岁低龄人口全部导入系统大数据平台,在普查人员正式入户登记采集完所有普查对象信息后,就开始在大数据平台进行“内部比对、户籍比对、低龄人口比对”三个比对复查。三个比对复查工作让基层的普查员叫苦不迭,经常加班加点,付出了比以前普查更多的时间和精力。但通过这三个比对后,对于户籍漏报、错填,流出流入人员去向与来源,低龄人口漏登等现象基本有效地解决,大大提升了普查的数据质量。
二、大数据是把准常住人口的“精算师”
常住人口一直是人口普查最重要的数据指标之一,是各级党政领导制定教育、医疗、养老、交通等政策决策的重要参考依据,广泛应用于经济社会,诸如人均GDP、人均财政收入、城镇化率等指标计算,均是以常住人口为基础计算的。之前的几次普查工作,有的地区为了增加常住人口数量,人为地把一些外出人口拉回来登记为“人在户在”,或者把明明外出半年以上人员选为“离开户口登记地不满半年”的,更有甚者编造假姓名等人员信息来增加常住人口。开展一次人口普查工作,各级政府都需要投入大量的人力、物力和财力,数据质量得不到保证,就让普查失去了原本的意义。
第七次全国人口普查,采用全新的登记方式,拥有最先进的设备和大数据技术,新增身份证号码这个具有唯一识别性的指标,并且每户调查对象都有联系电话,这些指标的设置是各地准确掌握常住人口最有利的“秘密武器”。通过大数据平台比对,提高常住人口准确率,有两个明显优势:一是确保每一个调查对象只能在一个居住地登记,平台会自动排重,然后删减重登的常住人口;二是对于户籍地填了外出到某个地区又未被普查到的常住人口,通过户籍地提供的详细住址及联系电话,反馈到居住地的普查机构,再次入户核实、补登,确保了所有普查对象不重不漏,有效地提高了包括常住人口在内的各项普查数据质量。
三、大数据是提高数据质量的“护航者”
数据质量是普查的“生命线”。以往人口普查所公布的人口数据往往遭受社会各界的质疑,参加过多次人口普查的笔者被周围的人问及“有那么多人口吗?”时,解释的理由大都是因为户籍人口和常住人口的统计口径问题而信心不足。笔者深知历届普查由于选调的普查员素质参差不齐,对普查业务知识掌握不准确,工作责任心不强,摸底等基础工作做得不够扎实等等因素,导致普查总体数据质量不高,重登、漏登、错登现象时有发生,普查数据质量普遍偏低。
第七次全国人口普查,充分借助和运用了大数据技术,对所有普查对象进行筛查,确保每个普查对象只能一个居住地和一个户籍地登记,有重登的自动删除,有漏登的及时反馈到各级普查机构,并充分利用各相关部门的行政比对资料,通过内部核查、户籍核查、低龄人口核查三个比对复查,让普查对象应统尽统,并且有效地保证了不重不漏的原则。大数据技术让“大国点名”更加科学、有效、精准,对摸清人口家底提供了强有力的支撑,为圆满完成第七次全国人口普查工作“保驾护航”。