文章目录
1、思维导图2、效应3、ITE / ICE(Individual Treatment/Causal Effect)4、ATE / ACE(Average Treatment/Causal Effect)5、ATT / ATC(Average Treatment Effect on the Treated / Controlled)6、CATE (Conditional Average Treatment Effect)7、LATE (Local / Complier Average Treatment Effect)8、它们之间的关系?参考资料
1、思维导图
学习因果推断的时候,发现各种书籍和文献里出现了纷繁复杂的各种效应,已经傻傻分不清楚了!今天系统的整理下,后面如果有新的认知再修改和完善。
2、效应
用于评判干预与否的结果差异的指标。通过对各个研究对象干预与否的潜在结果的比较得出。
3、ITE / ICE(Individual Treatment/Causal Effect)
定义:对于同一个对象,处置和不处置的效应之差;
τ
i
=
Y
i
(
1
)
−
Y
i
(
0
)
,
i
=
1
,
.
.
.
,
N
\tau_i = Y_i(1) - Y_i(0), i = 1, ..., N
τi=Yi(1)−Yi(0),i=1,...,N特点:不可观测的 (unobservable);举个例子:我们想知道对H同学而言,读博对她的收入有什么影响,那么我们需要知道读博后她的收入是多少,和不读博她的收入是多少,两者相减就可以得到
I
T
E
ITE
ITE。但是H同学不可能既读博,又不读博,所以我们说
I
T
E
ITE
ITE是不可观测的。
因此统计意义上,往往更关注总体的统计特征,即ATE。
4、ATE / ACE(Average Treatment/Causal Effect)
定义:假设所有对象都接受处置(
X
=
1
X=1
X=1)的平均结果是
E
(
Y
=
1
)
E(Y=1)
E(Y=1),所有对象都接受对照(
X
=
0
X=0
X=0)的平均结果是
E
(
Y
=
0
)
E(Y=0)
E(Y=0),那么:
τ
A
T
E
=
E
[
I
T
E
]
=
E
[
Y
i
(
1
)
−
Y
i
(
0
)
]
=
E
[
Y
i
(
1
)
]
−
E
[
Y
i
(
0
)
]
\tau^{ATE} = E[ITE] = E[Y_i(1)-Y_i(0)]=E[Y_i(1)]-E[Y_i(0)]
τATE=E[ITE]=E[Yi(1)−Yi(0)]=E[Yi(1)]−E[Yi(0)]特点:关注所有对象的平均水平;可以通过随机对照试验(RCT: Randomlized Controlled Trial)获得,也就是:
τ
A
T
E
=
E
[
Y
∣
X
=
1
]
−
E
[
Y
∣
X
=
0
]
\tau^{ATE} =E[Y|X=1] - E[Y|X=0]
τATE=E[Y∣X=1]−E[Y∣X=0] 公式中不再含有潜在结果变量
Y
i
(
1
)
Y_i(1)
Yi(1)和
Y
i
(
0
)
Y_i(0)
Yi(0)。举个例子:我们想知道读博对薪酬的影响,我们计算所有读博同学的收入和未读博这同学的收入差,即为
A
T
E
ATE
ATE。
这里经常会出现问题,就是读博的同学和未读博的同学,可能本身条件就有很大的差异,那这里的
A
T
T
ATT
ATT就出场了,帮助控制一些混杂变量。
5、ATT / ATC(Average Treatment Effect on the Treated / Controlled)
定义:受处理/不受处理对象的平均处理效应;
τ
A
T
T
=
E
[
Y
i
(
1
)
−
Y
i
(
0
)
∣
Z
i
=
1
]
,
τ
A
T
C
=
E
[
Y
i
(
1
)
−
Y
i
(
0
)
∣
Z
i
=
0
]
\tau^{ATT} =E[Y_i(1)-Y_i(0)|Z_i=1], \tau^{ATC} =E[Y_i(1)-Y_i(0)|Z_i=0]
τATT=E[Yi(1)−Yi(0)∣Zi=1],τATC=E[Yi(1)−Yi(0)∣Zi=0]特点:关注一部分对象(处置的或未被处置的);举个例子:上例中,所有读博同学揪出来,如果这些人没有读博,他们的收入会是什么水平呢?那只能在没有读博的人里面找到各方面条件都跟他们十分匹配的样本,然后两者的收入差异就是
A
T
T
ATT
ATT啦!
6、CATE (Conditional Average Treatment Effect)
定义:总体中某一个组别内的平均处置效应;
τ
C
A
T
E
=
E
[
Y
i
(
1
)
−
Y
i
(
0
)
∣
X
=
x
]
,
\tau^{CATE} =E[Y_i(1)-Y_i(0)|X=x],
τCATE=E[Yi(1)−Yi(0)∣X=x],特点:举个例子:比如我们想知道投放广告对转化率的影响有多大。这个时候,可能会首先根据用户画像,将所有用户分成不同的组别,然后在各个组别内部,去计算广告投放对这个组别内人群的转化的提升效果,这就是所谓的
C
A
T
E
CATE
CATE啦!
可以看到CATE和ATT上有一点点相似,一个是对『动作』做了分组后计算的处置效应,一个是对『对象』分组后做的处置效应。
7、LATE (Local / Complier Average Treatment Effect)
这个稍微复杂点:
定义:LATE就是compliers的ATE。什么是compliers?在随机试验中,根据施加treatmen和实际treatmen的不同,可以分为4种人群:
always takers:无论在treatment组还是在control组,都能够获得treatment;(一般认为不存在)never takers:无论在treatment组还是在control组,都不能够获得treatment;compliers:在treatment组一定会获得treatment,在control组则一定不会获得treatment;defiers:在treatment不会获得treatment,在control组则会获得treatment;(一般认为不存在) 《Regression discontinuity designs: A guide to practice》这篇论文里有对这四者的一些解释。
我们一般计算的ATE是针对never takers和compliers的,而LATE要计算的对象则是compliers。
这个的计算和比较复杂。未来要用的时候再来补吧!
8、它们之间的关系?
挨个讲完了各种效应的含义,那么各种效应之间从数学推导上看有什么关系呢?目前我学习到的主要有下面几种:
A
T
E
ATE
ATE和
I
T
E
ITE
ITE的关系,这个是最好理解的:
A
T
E
=
E
[
I
T
E
]
=
1
N
i
∑
i
I
T
E
i
ATE = E[ITE] = \frac{1}{N_i}\sum_iITE_i
ATE=E[ITE]=Ni1i∑ITEi
A
T
T
ATT
ATT和
I
T
E
ITE
ITE的关系:
A
T
E
=
E
[
I
T
E
]
=
1
N
i
∑
i
:
T
i
=
1
I
T
E
i
ATE = E[ITE] = \frac{1}{N_i}\sum_{i: T_i=1}ITE_i
ATE=E[ITE]=Ni1i:Ti=1∑ITEi
C
A
T
E
CATE
CATE和
I
T
E
ITE
ITE的关系:
A
T
E
=
E
[
I
T
E
]
=
1
N
i
∑
i
:
X
i
=
1
I
T
E
i
ATE = E[ITE] = \frac{1}{N_i}\sum_{i: X_i=1}ITE_i
ATE=E[ITE]=Ni1i:Xi=1∑ITEi
参考资料
[1] Why moving from ITE to ATE [2] 马忠贵, 徐晓晗, 刘雪儿. 因果推断三种分析框架及其应用综述[J]. 工程科学学报, 2022, 44(7): 1231-1243. doi: 10.13374/j.issn2095-9389.2021.07.04.002. [3] 聊一聊因果推断中的ATT、ITE、ATE和CATE [4] 快速理解因果推断的LATE问题 [5] Yao L , Chu Z , Li S ,et al.A Survey on Causal Inference[J]. 2020.DOI:10.48550/arXiv.2002.02770.