CFPS小课堂 | 关系库父母相关变量缺失原因解析
来源:时间:2022-05-12 03:50阅读:
不少用户对于家庭关系库中父母相关信息的缺失存在疑问,不能确定CFPS发布的数据是否存在
错误,也不清楚缺失产生的原因。今天的CFPS小课堂,小编带大家一起来回顾一下这个与成员
问卷设计以及关系库的数据结构相关的问题。
用户疑问
问题1 请问2018年家庭关系数据库中父母是否健在为不适用,是什么情况?有没有其他信息
可以判断父母是否健在?
问题2 最近在整理CFPS数据时,我们发现关于“父母是否健在”和“父亲或母亲是否同住”
的变量中在5期的数据中都出现了很多赋值是“不适用”的信息,不知道这些变量中的“不适
用”表示什么意思。
问题3 请问CFPS2014数据中,如何得到个体的父母是否健在这一数据。家庭关系库中,
“父亲是否健在 ”和“母亲是否健在 ”这两个问题有很多不适用(-8)值。
问题4 我在研究2012-2018的调查问卷后还是不理解为什么自从2012起, famconf数据
里大约有30%对于“父亲是否健在” “母亲是否健在”的回答是不适用,而2010年时这个
数据基本是人人都做了回答。在相对应的问卷中,我无法找到询问 “父母是否健在”的问题,
所以我好奇这个回答是根据什么做出判断以及回答“不适用”的原因是什么?是因为有一部分
人在之前的问卷中已经回答过了吗?
项目组答疑
2010年家庭关系库中父母是否健在的信息相对完整
在第一次(也即基线)调查时,CFPS项目界定了初始的家庭成员,每个被界定为家庭成员的
个体在家庭关系库中占据单独的一行。
在基线调查时,CFPS对于每个被界定为家庭成员的个体在家庭成员问卷中询问了其所有关系
人(父、母、配偶、子女)的基本情况,包括他们是否健在,以及性别年龄等基本信息。2010
年的家庭关系库中父母是否健在的信息相对完整,如果回答人不知道成员父母是谁,保留缺失
状态。
关系库结构示意图
父母并不一定是CFPS界定的家庭成员
CFPS对于家庭成员的界定有着自己所确立的标准,简单来说是以经济上是否存在依附关系
并同时考虑婚姻、血缘或领养关系来判定。具体的家庭成员界定可以参考CFPS官方网站上
的用户手册P5-6相关信息。
在CFPS基线调查时,如果个体A在CFPS抽中的样本家庭中,但A和其父母在2010年并不
存在经济上的依附关系,A的父母不属于CFPS界定的家庭成员,A的父母在家庭关系库中
并不占据单独的行,父母信息只会以关系人的身份出现在2010年关系库。譬如,上图中
H102的父亲203和母亲204就只是作为H102的关系人,并不是CFPS界定的家庭成员,
所以203和204并不单独占据一行。
如果A和其父母在2010年在经济上互相依附,则他们都是CFPS界定的家庭成员,A的父
母的信息不仅会出现在A的关系人信息中,也会每人分别占据家庭关系库中的一行。
从2012年开始的追踪调查年中,父母的健在信息会一部分缺失
对于只是作为关系人存在的父母,CFPS从2012年开始的追踪调查中不再在家庭成员问卷
中逐一确认其是否健在,对应年份的家庭关系库只保留了父母-在基线调查之前已去世的信
息,其它信息在家庭关系库中就会以缺失值形式存在。自2016年起,在个人自答问卷的
“父母与子女关系”模块中会记录父母是否健在的信息(如下),用户可以根据该题的数据
补充父母健在信息。
图片来源 :个人自答问卷 “父母与子女关系” 模块截图
但是如果父母本身也是CFPS界定的家庭成员,只要其所在的家庭在当年被成功访问,他们的
健在信息都会被采集,不会缺失。
相关技术报告
CFPS技术报告-06,点击此处
CFPS技术报告-07,点击此处
CFPS技术报告-33,点击此处
上一篇: Q&A
下一篇: CFPS小课堂 | 家庭成员的定义