调研中国:北大十七年的刻画和追踪
“大数据”时代,每个人的工作和生活都会以“数字脚印”的形式留下痕迹,这也让数据与量化研究的重要性得到越来越多的重视。与以痕迹为主的大数据相比,为研究“量身定制”的专业调查所获取的“小数据”却在统计代表性、数据可靠性和研究针对性等方面有诸多优势。
那么,从哪里能够获取到公开、免费、高质量的调查数据呢?北京大学中国社会科学调查中心可以为这个问题提供答案。调查中心成立于2006年,作为北大社会科学的数据调查平台和北大开展中国社会问题实证研究的跨学科平台,中心已经扎扎实实地开展了17年覆盖全国的调查研究。
近日,中共中央办公厅印发了《关于在全党大兴调查研究的工作方案》。北京大学随即召开调查研究工作座谈会,探讨如何进一步发挥北大学科交叉优势与人才优势,把调研工作、统计工作、数据工作与政府决策需要紧密结合,更好地为学术研究和治国理政服务。
在稳健踏实的调研中,北大人克服万难初心不渝;在真实可靠的数据里,中国的成长轨迹清晰可辨。
中国家庭追踪调查(China Family Panel Studies,CFPS)是北京大学中国社会科学调查中心的三个大型社会调查项目之一。中心成立之后,就立即开展项目的前期工作。
2007年到2009年间,先后在多地展开测试性调查、探索性调查和追踪调查,在测试计算机辅助面访(CAPI技术)和追踪策略的可行性之后,最终划定了15000户家庭作为目标样本,覆盖全国25个省区市。这些家庭来自于科学严谨的抽样选择,为了保证样本的科学性和代表性,项目必须尽全力争取被选定的家庭和成员接受调查,而不能随意替换这些家庭。唯其如此,这15000户家庭所具备的代表性才能得到保证。以年龄、性别的分布为例,15000户家庭中呈现出的特点与覆盖全国每个人的人口普查的结果高度一致。
CFPS基线调查中样本呈现出的年龄和性别分布情况与2010年进行的第六次全国人口普查基本一致
这15000户家庭中的所有成员,及其今后生养或领养的子女被称作“基因成员”, 他们都会被纳入项目调查的范围,是项目永久追踪的对象。“永久追踪”像一个口号,生动地阐释出项目名称中“追踪调查”的意涵。在中国,家庭扮演着代际关系的最重要桥梁,是经济活动与社会交往的基本单位。在关注家庭之外,项目还需要收集个体和社区层面的数据,因此项目所采用的问卷就包括社区问卷、家庭问卷、成人问卷和少儿问卷等不同类别。如此一来,国际上主要社会调查项目的主要内容就都被纳入到项目之中,调查所产生的数据就可以如实反映中国社会、经济、人口、教育和健康的变迁,为学术研究和公共政策分析提供基础。调查中心在成立之初,时任北京大学常务副校长林建华教授曾表示:“连我这样的理科学者都为这个计划激动不已。”
无论人口流动,还是家庭变迁,项目都需要在全国范围内持续开展调查,对15000户家庭的所有成员和从这些家庭中衍生出的家庭及成员不断追踪,其难度可想而知。因此,“永久追踪”更是一句庄严的承诺,代表着北大的决心与担当。北京大学中国社会科学调查中心首任主任、北京大学社会学系邱泽奇教授在忆及当初时坦言:“创建中国社会科学调查中心是我人到中年后进行的一次无比艰辛的尝试。”
经过2007年到2009年的准备,自2010年的全国基线调查开始,十几年间,中国家庭追踪调查CFPS已经实施了六轮追踪。两年一轮的追踪调查看似按部就班,实则千难万难。每轮全面调查都会有至少500名访员奔波于全国各地,风尘仆仆地奔走、锲而不舍地寻访。
CFPS访员到受访户家中开展面访调查
每年,都会有来自全国各地的新访员加入项目。从全国选拔访员,同样是出于科学严谨的调研需要,因为被选为目标样本的家户分布于全国各地,方言、风俗、文化等差异就要求有熟悉当地情况的访员来开展工作。北京大学中国社会科学调查中心的老师们都会为这些访问员安排培训,教会他们如何操作计算机辅助调查的系统,如何管理样本,如何规范地完成调查数据收集的任务。培训结束后,每名通过考核的访员都需要用宣誓的方式做出庄严承诺。
中国家庭追踪调查项目访员宣誓誓词
本着对国家负责、对社会负责、对历史负责的科学精神,访员需要克服许多意想不到的困难,来完成调查任务。被忽视、被拒绝、被误解……都不能成为访问员们放弃的理由。“敲门必须满三次,电话必须打够六遍,还是没人回应才能放弃”,访员也被要求“不要着急提问,要多听、多交流”。访员在调查中的角色也不只是提问者,他们还要通过观察记录更多细节以更全面地反映调查对象,其中关乎受访者生活环境的问题就有七个,对受访者个人状况的评价指标则涉及到10多个方面。为了保证数据真实、准确和完整,调查中心的质控团队对访问数据实时检验,并同步抽查访问录音,对受访者进行电话回访。
曾担任项目广西地区访问员的冯潇云回忆自己寻找受访住户时遇到过的难题,“居委会几经换届,想找到那些电话联系不上的受访户,就只能大海捞针似的询问路人。”回忆起自己在调查工作中的付出,她乐观地表示:“我们在这个过程中磨炼了意志,做一件对社会有意义的工作,本身就是一种极大的幸福。”
疫情期间CFPS访员开展线上电访调查
每一份问卷的完成都是时代的记录,无数份问卷的积累则为我国社会科学的繁荣和公共政策的完善提供了珍贵的数据基础。中国家庭追踪调查项目负责人、北京大学社会研究中心主任谢宇教授曾表示,“这是目前中国规模最大、内容最全的社会跟踪调查项目,这里有15000户家庭的轨迹,从某种程度上可以说是用这15000户家庭为中国画像。”如今,这幅画像正愈发生动完整。
2013年8月,北京大学中国科学社会调查中心的工作受到了著名学术期刊Science的报道。不过,被报道的并非中国家庭追踪调查CFPS,而是中心的另一项大型社会调查项目——中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS)。项目于2008年启动预调查,于2011年开展全国基线调查,覆盖150个县级单位,450个村级单位,约1万户家庭中的1.7万人。
中国健康与养老追踪调查项目负责人、北京大学国家发展研究院教授赵耀辉已经在这一项目中投入了十多年的心血,带领CHARLS走过缺乏数据的阶段,推动并见证了该项目的革命性变化。项目旨在收集一套代表中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析我国人口老龄化问题,推动老龄化问题的跨学科研究。
就在去年,《柳叶刀》(THE LANCET)发布了由赵耀辉教授牵头完成的特邀重大报告《中国健康老龄化路径》,系统总结了中国老年健康的现状和影响因素,并针对性地提出了实现健康老龄化的政策建议,对我国老龄化研究具有十分深远的影响。
在中国科协名誉主席、北京大学教授韩启德院士看来, CHARLS代表着北京大学能够做的事,也代表着我们国家、特别是社会科学应该如何做:“这一项目不仅对整个中国养老事业的推进有帮助,也对整个学术研究,尤其是社会科学的研究与发展有着重要意义。”
Science关于CHARLAS(上)和CFPS(下)的报道
2014年5月,中国家庭调查项目CFPS也受到了Science的报道。这仿佛预示了北京大学中国社会科学调查中心所做的工作开始受到越来越多的学界关注,其中蕴含的学术价值和学术影响力正蓄势待发。
就在这一年,北京大学中国社会科学调查中心获得了国家自然科学基金委的资助,成立国家自然科学基金-北京大学管理科学数据中心。时任调查中心主任的李强教授作为管理科学数据中心项目的负责人,多次表示国家自然科学基金的远见卓识和北大先行先做的实践实属“功在当代、利在千秋”。基于我国管理科学量化研究对于调查数据的需求,数据中心不仅持续开展中国家庭追踪调查CFPS和中国健康与养老追踪调查CHARLS两大旗舰调查项目的数据收集,还设立了中国调查数据资料库(China Survey Data Archive,简称CSDA),免费提供包括CFPS和CHARLS两个项目数据在内的一系列调查项目数据。
依托北大中国社会科学调查中心的数据管理能力和北大图书馆的平台服务能力,数据中心着力打造面向学术和政策研究的调查数据获取基地。值得一提的是,数据中心还积极推动基于实证的循证决策研究,以资政启民为目标,推出了各类重要政策研究成果,服务国家决策。
基于CFPS和CHARLS两项研究的中国民生报告和中国健康与养老报告
《数据与决策》系列报告及工作论文
最新数据显示,截至2022年,CFPS和CHARLS两个调查数据的用户总数已超过18万,基于这些数据所产生的学术成果已接近1万篇。在日前召开的北京大学调查研究工作座谈会上,国家自然科学基金委副主任、北京大学物理学院谢心澄院士表示,随着研究方法和调查技术的完善,高质量的调查数据已成为实证研究和循证决策的底层支撑:“希望北京大学中国社会科学调查中心可以持续开展求真务实的调查研究,拓展新的高质量调研项目,建设更开放的数据平台,成为高校调查研究的一面旗帜。”
“我的研究对象是老弱病残孕。”如今在浙江大学工作的张川川老师,这样概括自己在CHRALS项目中的工作。他指出,CHARLS项目具有无与伦比的学术价值与社会价值,“CHARLS仍然是涉及老年人的、针对健康问题的这些调查里最权威的一个调查,如果聚焦到45岁以上的人,我觉得CHARLS具有无可替代性,现在还没有另外任何一个数据能够像CHARLS一样,能够专门针对中老年群体,针对健康和养老的问题,有这么丰富的问卷,这么丰富的问题,这么丰富的信息。”
近年来,CFPS与CHARLS项目取得长足发展,用户总数和相关学术成果呈指数型增长,调查成果日益丰硕,引发国际学界的关注,成为国内外最知名的中国数据项目。这两项高质量的追踪调查记录了中国社会经济发展变迁的轨迹,使得更多学者得以利用社会科学的多元视角,立体透彻地理解我们所处的时代,“把论文写在祖国的大地上”。同时,两个项目充分发挥实证科学的优势,让调查研究成为政府决策的有力依据。CFPS和CHARLS两项调查的开展和推进印证了北京大学中国社会科学调查中心始终坚持与不断追求的方向。
2016年,北大中国社会科学调查中心的第三个大型社会调查项目中国企业创新创业调查(Enterprise Survey for Innovation and Entrepreneurship in China,ESIEC)开始运行。作为中国家庭追踪调查CFPS的项目负责人之一,北京大学光华管理学院张晓波教授曾在研究中国企业时遇到过缺乏可靠数据可用的问题。在2016年的预调查和2017年的试调查的基础上,张晓波教授担任主任的北京大学企业大数据研究中心在2018年实施了中国企业创新创业调查ESIEC的基线调查。项目确定了近6万家民营企业为样本,对其进行追踪调查。
中国企业创新创业调查发布的调研报告
近年来,实地调查、电话访问、追访、补访、补充抽样、发布数据……项目参与者们持续不断的努力,就是为了获得反映中国企业创新创业状况的微观数据,推动更高质量的学术和政策研究。2020年起,考虑到新冠肺炎疫情对经济活动造成的影响,北京大学中国社会科学调查中心和北京大学企业大数据研究中心启动了中国小微经营者调查(Online Survey of Micro-and-small Enterprises ,OSOME),主要关心小微经营者受到疫情影响的生产经营状况、融资需求、未来预期等内容。
中国小微经营者调查OSOME的独特之处在于,在项目的调查样本中未工商注册的个体户占四成。这填补了既往小微企业调查以工商注册企业或个体户为主,较少覆盖未注册个体经营户的研究空白。
中国小微经营者调查发布的漫画版解读
有了扎实的调查,有了可靠的数据,北大中国社会科学调查中心能做的事情越来越多。承接统战部、民政部、发展改革委、国研中心、兄弟院校和科研院所的搭载项目或委托项目,围绕数字与人文主题组织学术论坛,构建开放性、跨学科的智库研究平台……调查研究的意义正在北大不断释放。
北京大学副校长孙庆伟教授指出,调查研究是共产党人的传家宝,北京大学一向重视调查研究工作,有着开展社会调查、科学采集调查资料的光荣学术传统:“中国社会科学调查中心等研究机构和相关院系在把调查资料运用于学术研究、服务于国家社会经济发展等方面取得了丰硕成果。”
在2022年暑假,北京大学中国社会科学调查中心开展了两门暑期课程《社会调查实务》和《社会调查数据分析》,共有153名学生参与了课程学习,这已经是调查中心开展的第10期暑期课。在北大区域国别研究院的《量化区域国别研究》课堂上,调查中心的孔涛老师为博士生同学们分享量化研究相关概念、工具、种类及实践,帮助他们了解量化实证研究的基本思路和方法。这项课程目前已经纳入到了区域国别研究院的博士生培养计划。
去年秋季学期,北京大学开设了一门新课《理解中国:问题、方法与实践》。这门课程同样由北京大学中国社会科学调查中心承担,为北大的同学们提供中国家庭追踪调查CFPS和中国健康与养老追踪调查CHARLS的数据进行科学研究。
《理解中国:问题、方法与实践》学生讨论
北京大学光华管理学院的王子宁同学在选修课程后写下了自己的感受:“调查中心的各位老师们将一次社会调查的完整流程展示在我们面前,在顶层设计阶段就需要设计问卷、设计详细的抽样方案以确保最终获取的样本有统计推断意义;在实地调查过程中更是可能遇到各种各样的突发状况,而在完成入户或电话调查之后还要进行繁杂的质量控制与数据整理工作,最终才可以获得便捷、可取用的数据。CFPS和CHARLS两个大型调查项目已经走过了十多年的历程,这才构成了中国今年最全面最充实的大型追踪社会调查数据。”
从他的话语中可以看出,北京大学中国社会科学调查中心所从事的事业,正是“行稳致远”的生动写照。在调查中心主任张志学教授看来:“调查研究没有止境,北大也将永远走在调研的路上。
来源:北京大学融媒体中心、北京大学中国社会科学调查中心
转载自北京大学官方微信公众号:https://mp.weixin.qq.com/s/iL9PeGCCUOmqe3fHcQuB-A
参考:环球财经《数字里的中国》(记者刘洋)、中国青年报冰点特刊《一万五千里的中国》(记者陈卓)