原文链接:固定效应模型——面板数据分析
固定效应模型(Fixed Effects Model,简称FEM)又称固定效应回归模型,是一种用于面板数据分析的方法。面板数据(Panel Data,也称纵向数据)多了时间维度信息,不论是个体或是实体(如国家),所收集的数据都包含不同时间点至少两次以上的状态信息。
FEM适用于无法观测到的遗漏变量(omitted variables,例如个体先天特征)的控制与处理。个体(包括实体,下同)间客观上会存在许多的差异,然而就某一段时间而言,个体内的许多方面都会保持不变。通过消除个体间不同但在时间上保持不变的遗漏变量的影响,能够更好地观察自变量与因变量随着时间的变化而呈现的关系(净效应)。
首先我们通过一个例子来快速建立概念。下图显示四个人在不同时间里收到的提醒频次,以及相应的健康饮食评分[2]。个体之间都会存在诸多的不同,例如自律程度、作息时间等,它们会对自主设置的提醒频次产生影响。假如要控制这些因素会有点难,好在个体内这些因素基本不会变化(只要开展研究的这段时间内没变就行)。
抛开个体间差异不管,此时提醒频次与评分的相关系数为0.111。固定效应的估计要从每个人的平均提醒频次和平均评分开始着手,再分别做去中心化处理(见下图)。去中心化的目的是为了消除个体间的差异,最终是要把它们叠加在一起(拥有相同的原点)。
结果如下。原始数据中两个变量存在较小的正相关,再到四组均值甚至存在负相关(上图计算均值部分)。而现在去中心化重叠后数据的相关系数为0.363,它是一个更能准确反映真实关系的结果。这个例子演示了固定效应回归分析的一种方式。
固定效应模型有两个核心的假设[3]。其一,遗漏变量与包含的回归因子存在相关;其二,遗漏变量随时间变化保持不变(研究数据获取期间)。它还假设所有个体回归方程的斜率相同,只是截距存在不同。而随机效应模型假设遗漏变量与回归因子之间不存在相关。
在随机效应模型中,需要包含可能会影响预测变量的个体特征,包括在时间上保持不变的因子。如果认为个体间的差异会对因变量产生影响,那么随机效应模型是合适的选择。对于不是研究所关心的变量,但存在于个体间的异质性,被处理成具有特定概率分布的随机变量是个好主意。随机模型回归方程包含个体内信息和个体间信息。
总结来说,固定效应模型假设遗漏变量只对自变量产生影响,而且在个体内这种影响保持恒定;而随机效应模型假设这些变量跟自变量没有关系,但是个体间的差异会对因变量产生不同的影响,因此需要包含在回归方程中。
固定效应回归方程如公式1所示,其中下标i表示不同的个体、下标t表示不同的时间点。公式表明每个个体都有自己的截距,但个体间的斜率相同都是β1。不同的截距能够更准确地反映不同个体内部的变异(想想最小二乘法OLS的原理)。
在“提醒频次与健康饮食评分”例子中,四个不同个体可以按照分类自变量的处理方式,转换成虚拟变量以实现个体间差异的控制(每个个体对应一个二分变量)。另外一种固定效应估计方法是个体内回归(Within Estimator),它只要计算每个个体因变量的均值及其离均差,再对自变量的离均差拟合回归方程(公式2),即例子中所演示的步骤。
根据因变量类型的不同,固定效应模型还包括负二项回归、逻辑回归等细分方法(本期阅读文献有涉及)。负二项回归相对比较陌生,它源自泊松回归[4]。泊松回归中,要求事件的发生是独立的,而且计数值的平均数要等于方差[5]。
当两个前提条件不满足时,特别是收集的资料平均数远小于方差,就存在过离散的问题。此时泊松回归结果标准误偏小,进而会导致假阳性比率的增加。负二项回归此时就派上用场了。负二项分布是指,当泊松分布参数λ(单位时间内随机事件平均发生次数)服从γ分布时,所得到的复合分布。
参考文章1共有四个研究。其中研究1的数据来自1272篇学术文章的致谢部分,研究4的数据来自维基百科编辑的会话部分,研究2和研究3是两个预注册实验。研究的自变量是相对权力,因变量是感恩表达和感恩之情。研究3探索心理权力和人际取向的中介作用,研究4探索关系历史的调节作用。研究结果见上图,加号和减号分别表示正向作用和负向作用。
LIWC测量的是感恩词汇的使用频次。根据作者身份对权力进行编码:1=研究生,2=博士后,3=助理教授,4=副教授,5=正教授。控制变量包括作者的人数、文章长度(即页数)、作者性别等,它们可能会影响因变量的测量和预测的结果。
上图显示,感恩表达测量的每个指标都与权力测量的三个指标存在及其显著的负相关关系(三个星号)。权力较低作者在致谢部分会进行更多的感恩表达,可能是因为作者得到过更多人的帮助。然而,这种假设在学术界不一定成立,文章里给出了三个理由。研究2和研究3通过操纵权力,并保持客观帮助大小不变,以便进一步探讨问题的实质。
--研究2--
使用在线聊天研究范式,依旧使用LIWC方式测量感恩表达。
--研究3--
相对权力分为三个水平,分别是较低权力(LP)、相同权力(SP)和较高权力(HP),并且被编码成连续变量,对应的值分别为-1、0和1。中介假设成立,人际取向95% CI是[−0.047, −0.001]),心理权力95% CI是[−0.038, −0.001]。
相对权力设定:维基百科编辑是否为管理员;关系历史设定:受帮助者发送给帮助者评论的数量。继续使用LIWC词典测量感恩表达,增设是否感恩作为二分因变量。控制变量有双方性别、双方编辑数量等,并设置年份用于固定效应分析。以受帮助者ID作为分组变量,进行线性混合效应的回归分析。
调节作用:当受帮助者权力较低时,帮助者相对权力与关系历史交互作用显著,b=0.022,SE=0.008,p=.006,95% CI=[0.006,0.038](见下图左)。Thanks, but No Thanks Unpacking the Relationship Between Relative Power and GratitudeChapter 16 - Fixed Effectshttps://theeffectbook.net/ch-FixedEffects.htmlPanel Data Analysis Using Stata: Fixed Effects and Random Effectshttps://libguides.princeton.edu/stata-panel-fe-re广义线性模型之泊松回归https://mp.weixin.qq.com/s/vrLnLBY8Tq9I6_UM10Lr1g负二项回归分析 (Negative Binomial Regression Analysis)——理论介绍https://mengte.online/archives/4377
评论留言