ATE、LATE、ITT、ATT、ATC 与 PSM
type
status
date
slug
summary
tags
category
icon
password
1. Local Average Treatment Effects
因果推断的最终目的就是确认 ATE (Average Treatment Effect)。一般来说,没有操纵就无法估计因果效应。操纵 Treat 就是因,而由于 Treat 导致的平均效应变化,自然就是果,也就是 ATE。追求无偏的的、有效的 ATE 就是因果推断的终极目标。
实验的一般流程就是,将被试分为实验组和对照组,实验组给予操纵,对照组不给予操纵,然后比较不同组别的关键变量变化,也就是测算 ATE,从而推断因果效应。这在实验室实验中是确实可行的,因为在实验室实验中,实验组的被试必然会受到操纵,而对照组的被试则必然接受不到操纵。
然而,实地实验让这个现象发生了变化。以投放广告为例,当我们对实验组进行操纵(投放广告)时,我们无法确保实验组的被试就一定会打开广告并阅读。这时,实验组的被试没有完全接受到操纵,导致实验出现了单侧不遵从 (one-sided non-compliance)。还有一种可能是,对照组的部分被试,可能在无意中从其他渠道看到了这个广告,这时实验就出现了双侧不遵从 (two-sided non-compliance)。
在这种情况下,如果我们不处理实验组和对照组中的污染数据,继续按照操纵时的分组来比较两组间的差异,得出的就不再是 ATE,这显然不是一个干净的因果效应,对于这样侧算出结论称之为 ITT (Intention-To-Treat Effect)。显然,如果实验没有出现不遵从现象,无论是单侧还是双侧的,ATE 就等价于 ITT。
最理想的情况是,我们能够清楚地知道每个被试到底有没有接受到操纵,然而在大多数情况下这并不可行。在这种情况下,一个次优解就是估计 LATE (Local Average Treatment Effect),在有的书籍和论文中,也将其称为 Complier Average Causal Effect。
1.1. 单侧不遵从时估计 LATE
现在,我们假设实验组和对照组各有 100 名被试。实验组中,有 80 名被试真正的接受到了操纵,而剩下的 20 人虽然在实验组,却没有实际受到操纵。在实验结束后,实验组的 DV 增加了 50,而对照组则没有变化。DV 不变
Type of Subjects | Treatment Outcome Increase 50 | Control Outcome Unchanged |
Never-Takers | 20 | 20 |
Compliers | 80 (really-treated subjects) | 80 |
如果这时,我们新增一个假设:实验组中没有接受到操纵的人(20 人),他不论被分配到实验组还是对照组,他都不会接受操纵。如果我们认为实验组和对照组是相似的,那么在对照组中也应该有 20 个这种人,这 40 人在实验组和对照组的表现都是一样的,他们对于关键变量的变化没有贡献。在这种情况下,。
1.2. 双侧不遵从时估计 LATE
现在,除了实验组有人没有接受到操纵,对照组还有一些人反而受到了操纵。在这种情况下估计 LATE 还要在新增一个假设,也就是人群中没有叛逆者 Defiers。叛逆者 Defiers 指的是,他们被分到实验组就不接受操纵,被分到对照组就寻求机会去接受操纵。
ㅤ | 实验组 / 给予操纵 | 对照组 / 无操纵 |
实际接受操纵 | Compliers | Always-Takers |
实际未接受操纵 | Never-Takers | Compliers |
现在,我们假设实验组和对照组各有 100 名被试。实验组中,有 80 名被试真正的接受到了操纵,而对照组中有 10 人受到了操纵,这时人群中的分布开始复杂起来了。注意,实验组和对照组的人群分布一定是镜像的,因为我们认为这两个组别是相似的。
Types of Subjects | Treatment Outcome Increase 50 | Control Outcome Unchanged |
Defiers | 0 | 0 (really-treated subjects) |
Never-Takers | 20 | 20 |
Compliers | 70 (really-treated subjects) | 70 |
Always-Takers | 10 (really-treated subjects) | 10 (really-treated subjects) |
在这种情况下,。
1.3. 使用工具变量估计 LATE
在实验中,我们实际想知道的自变量是是否接受治疗,这是我们的 X,而 Y 是我们的因变量,也就是我们关注的关键被解释变量。如果存在不遵从现象,我们的实验分配 Z 就不再与是否接受治疗 X 等价,这时我们也可以将 Z 视为工具变量。因为导致 ITT 与 ATE 不等价的实际原因是,我们遗漏了变量:被试是否真正接受到操纵。
如果我们没有办法知道被试是否真正接受到操纵,我们也可以退而求其次,通过 ITT 来估计。我们知道,LATE 与 ITT 之间的关系可以表达为 。不难发现,当 ITT 等于 0 时,LATE 也将等于零。换言之,如果 ITT 的估计结果不能拒绝原假设,那么 LATE 也将是显著的。同时 LATE 总是比 ITT 要大一些。
在鼓励设计 Encouragement Designs 中,估计 LATE 是必要的。一种情况是,将被试人为的区分为实验组和对照组可能是不道德的,这时会通过激励措施来鼓励被试接受操纵,也就自然的导致了自选择问题。在这种情况下,人群中必然存在着 Compliers、Always-Takers 和 Never-Takers。也因此,在这种情况下估计 LATE 是必要的,并设计下游实验 Downstream Experiments 来确保假设的成立。
最后,确认 Compliers 的一个简单方式就是安慰剂 Placebo-Controlled Design。比如在投放广告邮件时,可以向控制组投放一个不含油广告内容的邮件,这样就能对照组中寻找 Compliers。在前提假设,邮件内容不影响被试是否打开邮件,成立的情况下,我们有理由认为,对照组中接受安慰剂的被试是 Compliers。
2. ATE、ATT、ATC 与 PSM
ATE 就是我们要观测的终极变量,但是由于种种原因,我们很难观测到 ATE。除了之前提到的 LATE 还有一个办法就是结合 PSM 来估计 ATT 和 ATC。ATE 是所有被试(包括实验组的和对照组的)在操纵前后的平均差异;ATT 是实验组的被试在操纵前后的平均差异;而 ATC 则是对照组的被试在操纵前后的预期差异。当时实验是随机的,且所有被试正确的遵从了给予他们的操纵,那么 ATE、ATT 与 ATC 三者之间是等价的,然而在实践中这三者将具有差异。
在这个模拟数据集中,值得注意的是每个人接受操纵的概率 P 是不等,受到控制变量 X2 的正向影响。换言之,每个个体进入对照组还是进入实验组并不是随机的。
通过 PSM 计算倾向得分并进行逆概率加权,有三种加权方式。第一个是最常用的加权方式,目的是 ATE。在这种情况下,我们不关心个体在对照组还是实验组,而是想知道整体的处理效应。因此,对于实验组的个体用 来衡量,对于对照组的个体则是 来衡量, 的实际含意就是,一个个体进入实验组或对照组的条件概率。第二种就是对于 ATT,我们只关心实验组的个体,因此我们通过逆概率加权来将对照组的个体与他们相匹配。实验组中个体的加权依然为 1,而对照组中个体的权重变为了 。-1 的目的是为了不调整实验组的权重,因为逆概率加权后的权重总是大于一。类似的,在计算 ATC 时,我们只关心对照组的个体,因此对照组的个体权重依然为 0,实验组中的个体权重则变为 。
ATE 的估计系数在尽可能的接近 1,因为这是因为的真实模型是 ,、 服从标准正态分布,因此均值为 0,而 的真实影响,就是 1。而 ATT 和 ATC 与 1 相比,约有 0.5 幅度的上下波动,这是由于 P 决定了进入实验组或对照组的真实概率,而 P 的均值正是 -0.5。
参考文章
欢迎您在底部评论区留言,一起交流~
上一篇
Zotero 使用指南
下一篇
常用的学术网站
Loading...