
第二节 调查介绍
一 调查地的选择与概况
(一)调查地的选择
本次调查重点关注流动到西部中心城市的农民工。综合考虑人口、经济、地理环境等因素,确定在西安市进行本次调查。
1.西安是西部最主要的外来人口流入地
西安市是西北经济、文化中心,也是重要的人口流动和迁移枢纽,已经成为西部最主要的外来人口流入地。2010年第六次全国人口普查数据显示,西安市净流入人口为107.40万人。省内外市流入西安市人口为67.47万人,西安市流向省内外市人口为4.70万人,净流入为62.77万人。跨省流动人口主要以陕西省周边省份为主,外省流入西安市人口为58.55万人,西安市流向外省人口为13.92万人,净流入为44.63万人。
2.流动人口流动方向多元化
近年来,由于东部沿海地区劳动力、土地等要素成本上升,资源加工型和劳动密集型产业向中西部转移,全国流动人口流动模式发生了重要转变,人口流向由东南沿海单向集中向内陆中心城市集中转变,人口在东部、中部、西部和西北地区四大区域之间双向流动增多,中西部输出大省的外出务工人口开始回流,而东部地区流动人口的比例则出现下降趋势。西安作为内陆经济发展水平较高的城市之一,对流动人口的吸纳能力将进一步增强。
3.西安处于全国区域经济布局的战略性位置
西安位于我国陆地版图中心和中西部两大经济区域的结合部,是西北通往中原、华北和华东各地市的必经之路。在全国区域经济布局上,西安作为新亚欧大陆桥中国段——陇海兰新铁路沿线经济带上最大的西部中心城市,是国家实施西部大开发、“一带一路”战略的桥头堡,具有承东启西、连接南北的重要战略地位。西安是我国十大城市群之一的关中—天水经济区的核心城市,也是未来10年我国重点培育的流动人口重要吸纳地。
(二)西安市概况
西安是陕西省省会、副省级城市,世界著名的历史文化名城,是我国中西部地区重要的科研、高等教育、国防科技工业和高新技术产业基地。1992年7月,国务院批准西安市为内陆开放城市,是新亚欧大陆桥中国段——陇海兰新线上最大的中心城市。2012年,西安市全年实现生产总值(GDP)4369.37亿元,比上年增长11.8%。其中,第一产业增加值为195.59亿元,增长6.0%;第二产业增加值为1893.79亿元,增长11.8%;第三产业增加值为2279.99亿元,增长12.2%。第一产业增加值占生产总值的比重为4.5%,第二产业增加值比重为43.3%,第三产业增加值比重为52.2%。
西安市位于陕西关中平原的渭河南岸,背依秦岭,面向秦川,泾、渭、灞、沣、涝等水流经省内,形成沃野千里,号称“八百里秦川”。目前全市辖境东西204公里,南北116公里,面积10108平方公里,其中市区面积1066平方公里。至2010年底,全市常住人口846.78万人,其中,男性人口434.08万人,占51.26%;女性人口412.7万人,占48.74%。总人口男女性别比为105.18 ∶100。
目前,全市辖新城、碑林、莲湖、雁塔、未央、灞桥、阎良、临潼、长安9个区及周至、蓝田、户县、高陵4个县。“六普”数据显示,2010年西安市中城三区(新城区、莲湖区、碑林区)、郊三区(雁塔区、灞桥区、未央区)、远三区(阎良区、临潼区、长安区)和四县(高陵县、蓝田县、户县、周至县)的流动人口占全市流动人口的比例分别为26.9%、50.3%、15.1%和7.7%。西安市郊三区流动人口过半,吸纳流动人口最多[3]。
二 调查构成
本次调查主要包括问卷调查、质性访谈两种类型。
(一)个人问卷调查
问卷调查对象为在西安市生活工作、年龄在15~59周岁、户籍所在地为西安市城九区(新城、碑林、莲湖、雁塔、未央、灞桥、阎良、临潼、长安)以外的农业户籍人口。
(二)质性访谈
为了能够更形象、深入地了解课题组所关注的问题,通过质性访谈对农民工抽样问卷调查中一些不能覆盖的信息进行必要的补充。在抽样调查的同时,由调查指导员借助事先设计好的结构化访谈提纲,对部分农民工进行了访谈。
(三)调查内容
本次调查内容涉及基本情况、家庭信息、生计资本、意识与观念、日常行为等内容。各类问卷的主要调查内容如表1-3所示。
表1-3 调查内容
三 抽样过程
(一)个人问卷调查的抽样
本次调查为流入地调查,采用的是便利抽样与配额抽样相结合的方法,调查地点包括西安市新城、碑林、莲湖、雁塔、未央、灞桥、临潼、长安共8个区,基本覆盖了西安市整个市区范围[4]。在选定的各区中随机抽取街道,在抽取的街道内进行便利配额抽样。尽管没有抽样框可用,但调查试图覆盖农民工所从事的所有典型行业,并保证男性和女性具有相对比较均匀的分布。同时,本次调查试图从代次、区域(或地域)的视角对农村流动人口的发展状况进行比较分析,因此对调查样本的代次和来源地进行了比例控制,计划调查对象以新生代农民工为主(1980年以后出生),约占总样本的70%;考虑到西安市流动人口来源地的基本分布,故将省内流动农民工和跨省流动农民工比例控制在3∶2左右。样本量为1215人,样本中新生代农民工的比例达到67.3%,省内和跨省流动农民工比例约为5∶3。
非等概率抽样不可避免地会导致数据有偏,这限制了研究结论的推广。但是,鉴于样本量较大,并且符合西安市农民工的基本分布,配额抽样获得的样本可用于理论检验,因此这套数据适合对相关问题进行深入系统的分析研究。
(二)质性访谈的抽样
为了更直接地了解农民工在城市的就业、生活状况,综合考虑他们的年龄分布、职业分布和所在地区特征,最终选定了问卷调查中的25人作为对象,进行个人深度访谈。同时,也对这25人进行了问卷调查的复访工作,以检验问卷调查的信度。
四 调查执行
(一)调查时间安排
本次调查时间为2012年4月25日至5月30日,抽样调查由西安交通大学公共政策与管理学院流动人口课题组委托国家统计局陕西调查总队具体执行,课题组主要负责过程监控和质性访谈。具体时间和日程安排如下。
1.4月25日至5月3日:问卷调查培训
本次调查进行了两级培训,分别是课题组对调查队代表的培训和调查队内部的调查员培训。4月25日相关老师与调查队联系,确定培训时间。4月26日,西安交通大学公共政策与管理学院流动人口课题组在国家统计局陕西调查总队办公室召开“西安市农民工调查培训会”,对各调查队参加调查的相关负责人员进行了详尽的培训与指导。4月27日至5月3日,各调查队分别进行了内部的调查员培训,由参与第一次调查培训的各调查队的相关负责人,对调查队中参与调查的其他调查员进行培训与指导。由于各个调查队培训结束日期不一样,所以调查开始和结束的时间也不一致,最早的调查开始于4月30日。
2.5月4日:访谈培训
西安交通大学公共政策与管理学院流动人口课题组在西安交通大学人口与发展研究所会议室召开“西安市农民工调查访谈培训会”,对所有参与复访和访谈的指导员进行培训。
3.4月30日至5月30日:正式调查阶段
完成所有调查任务。
(二)参加人员
本次调查参加人员由西安交通大学公共政策与管理学院流动人口课题组和国家统计局陕西调查总队组成。
1.西安交通大学公共政策与管理学院流动人口课题组
在本次调查中,西安交通大学公共政策与管理学院流动人口课题组共派出17位成员参与调查工作。课题组成员主要承担调查指导员、个人访谈主持人的工作。由7名博士生、5名硕士生组成的调查指导员分成5组,负责相应调查点的调查指导、跟访、复访和个访工作;另有5位成员承担督导和协调工作。
2.国家统计局陕西调查总队
国家统计局陕西调查总队负责组织抽调协调员和调查员,并实施全部的问卷调查工作。本次调查共有5个调查队参与,分别为调查总队农村住户处、西安调查队、未央调查队、临潼调查队和长安调查队。他们对各自调查点的情况非常熟悉,并且有丰富的基层工作经验,便于工作的开展。根据各自负责区域流动人口特点、样本配额要求及各调查队人员配备状况,每个调查队抽调了人数不等的调查员进行调查工作。其中,农村住户处6人、西安调查队41人、未央调查队3人、临潼调查队10人、长安调查队8人,共计68人。
需要说明的是,为了对调查过程中出现的问题进行及时的沟通,本次调查安排调查联络员,由调查队和课题组分别指定,负责调查过程中相关问题的沟通和解决。
五 调查样本规模
(一)抽样调查实际数量
实际抽样调查样本数量为1215人,其中新生代农民工为817人,第一代农民工为398人。各区样本分布情况见表1-4。
表1-4 流动人口抽样调查实际数量
(二)各区个访数量
本次调查中,共进行个访25人,其中新生代农民工20人,第一代农民工5人。各区分布情况见表1-5。
表1-5 各区个访数量
六 数据质量控制与评价
整个调查以及数据录入过程如图1-3所示,在现场调查以及数据录入与清洗过程中均执行了严格的质量控制程序,主要包括调查之前的培训、调查过程中的跟访和调查结束后的问卷审核及复访,以及数据双工录入和逻辑检验控制。由于各种原因,调查数据难免会存在一定的误差,但是课题组采取了多种措施来保证数据质量,使误差在一个可接受的水平内。本次调查抽样复访与正式访问的一致率在可以接受的范围内,5%等距抽样双工录入的一致率在96%以上。
图1-3 调查数据质量控制流程
(一)调查前培训
本次调查共15位调查指导员,所有调查指导员均是本课题组成员。调查员共68位,均来自国家统计局陕西省调查总队。为了保证问卷质量,调查前课题组进行了两轮三次培训会,第一轮为问卷调查培训会,分为第一次的调查队负责人培训和第二次的调查员培训。问卷调查培训的重点在于讲解调查的目标、问卷结构、问卷中问题的具体含义,以及现场调查的注意事项,以保证每位调查员能够熟悉问卷,保证问卷的效度。第二轮为个人访谈培训会,主要针对质性访谈的内容、技巧及注意事项,以及可能出现的特殊情况的处理方案进行说明。
(二)现场抽样
由于本次调查抽样采取的是便利抽样与配额抽样相结合,在抽样时确保最终样本分布与要求的人口特征分布一致。
(三)跟访
跟访是指在调查过程中,调查指导员与调查员一起去农民工住处或工作所在地进行调查,针对调查过程中调查员处理不当的问题及时进行纠正,并且针对存在的特殊情况确定处理办法。要求调查指导员对所有的调查员进行随机跟访,以确保所有调查员对问卷有正确的理解。
(四)问卷审核与复访
问卷审核是调查指导员对调查员完成的问卷进行审核,发现不合格问卷并进行修正后的核查,以确保问卷质量。
调查过程中,对于每个调查员的问卷,调查指导员要随机选择3份问卷,并找到被访对象进行复访,以便检查两次调查的一致性。复访的结果会通知调查员,以便提高调查质量。
从表1-6可以看出,个人基本信息、家庭基本信息两部分不一致率较低,态度/意识/认同与行为评价、日常行为和经济活动三部分不一致率较高。但这并不表明这三部分数据质量较差。这是由量表的特性、所涉及的敏感和隐私问题以及时间的长短所决定的。由于政治现代化量表、政府信任量表、社会融合态度量表的特性,失范行为中涉及农民工不好回答的敏感问题,外出务工的具体月份会因时间久远而模糊不清,重复测量的不一致率较高;而经济活动属个人隐私问题,被调查者一般不愿回答真实准确的数值,因此重复测量不一致率也较高。
表1-6 实际调查与抽样复核情况
续表
(五)数据录入控制
数据是由调查指导员录入epidata数据库中的,通过epidata的附带程序可以进行初步的质量控制,例如,范围的大小、跳问等。在数据录入完毕之后,每位调查指导员等距抽样5%的样本进行轮换录入来检验数据录入的准确性和质量。两次数据录入的不一致率为3.04%,在可接受范围内。
(六)逻辑检验
在数据库建立后,编制了计算机程序来检验同一份问卷中的逻辑一致性。对于有逻辑问题的记录,寻找原始问卷进行核对,根据问卷内容进行修改。
总之,在调查执行和以后的数据录入及数据分析中,我们都采取了相应措施来保证数据质量。结果表明,这些措施对降低调查数据的误差是有效的。