摘要
背景
越来越多的关注被给予评估治疗效果异质性个体属于定性不同的潜在亚群。推论通常是先将个体划分为子组,然后估计子组特定的平均治疗效果。然而,由于子群只与观察到的变量有潜在的关联,实际的个体子群成员关系在实践中很少确定,因此必须进行推断。忽略估计隶属度中的不确定性可以排除错误分类错误,从而可能导致有偏见的结果和不正确的结论。
方法
当使用这种分类分析方法进行亚群效应分析时,我们提出了一种评估推理对分类不确定性的敏感性的策略。我们利用每个个体典型的非零预测或后验子群体成员概率,来衡量在不同的、精心选择的个体子集上所产生的子群体特定的平均因果效应估计的稳定性。由于隶属概率受抽样变异性的影响,我们提出蒙特卡罗置信区间,通过使用参数自举的扰动显式承认估计子群隶属的不精确性。该建议具有广泛的适用性,避免了现有偏差调整或偏差修正方法所依赖的严格的因果或结构假设。
结果
使用两个不同的公开的现实世界数据集,我们说明了所提出的策略如何补充现有的潜在亚群效应分析,以阐明分类不确定性对推理的潜在影响。首先,个体根据他们的病史和健康史被划分为潜在的亚群。然后在每个固定潜伏亚组内,使用增强反倾向得分加权估计器评估平均治疗效果。最后,利用提出的敏感性分析揭示了不同的亚群特异性效应,这些效应大多对潜在的错误分类不敏感。
结论
我们提出的灵敏度分析很容易实现,提供了图形和数值总结,并易于评估任何基于机器学习的因果效应估计器对分类不确定性的灵敏度。我们建议在潜在亚群效应分析中使这种敏感性分析更加常规。
简介
行为、健康和社会科学领域的研究人员越来越感兴趣于研究一种治疗对结果的因果影响如何在定性不同的潜在亚群体中的个体之间存在差异;看到如(1,2,3.,4,5,6,7,8,9,10].例如,右心导管等医疗干预措施对危重患者6个月死亡率的影响[11]可能会因患者的医疗和健康状况而有不同的潜在风险情况。但是,测量所有可能的(基线或预处理)协变量往往不切实际或不可能,这些协变量与表征治疗效果异质性的潜在子组共同相关。此外,由于维数的诅咒,估计被观察到的协变量的所有可能组合调节的细粒度处理效果实际上可能是不可能的;而且,即使有可能,也可能缺乏足够的统计能力来检测明显的亚群体特异性效应。
另一种方法是首先通过利用观察到的协变量与潜在子组的关联来划分个体,然后估计每个归属子组的平均治疗效果(ATE)。例如,通过使用潜在类别模型[12,13,14,15,16,17,18,19],或高斯混合模型[20.,21],或(零膨胀)计数数据的混合(零膨胀)负二项回归模型[22],或对给定协变量的处理采用混合逻辑回归模型[23,24,25],或用于患者分类的纵向生长模式[26,27,28,29].因此,通常使用有限混合模型来估计每个个体属于每个不同潜在子群的(预测或后验)概率,例如(经典)潜在类模型[30.,31,32,33,34,35,基于模型的聚类[36],或有限混合回归[37];参见[38,以便在医学研究中应用这类模型。
现有方法的局限性
无论潜在子群是如何定义的,在“分类分析”方法(也称为“模态”或“硬分配”)下,每个个体的归属子群成员被简单地确定为他们的成员概率最大的子群。在分析亚组特定的平均因果效应时,产生的分区随后被固定。因此,每个归属的子群体都可能受到来自不同子群体的个体的污染,导致有偏见的估计和误导性的实质性结论。即使在“期望值”方法(也称为“比例”或“软”分配)下,也会出现这种分类错误,即使用与成员概率成比例的分数权重将每个个体分配给每个可能的潜在子群[39,40].由于错误分类是由预测而非抽样误差造成的,因此即使在大样本或总体水平上,偏差也会持续存在。脚注1尽管如此,错误的分类偏差可以在特定的建模和结构假设下纠正。例如,当使用潜在类模型时,[13后),(41]和[42],推导出类别特定的平均治疗效果的无偏估计量。
但这样的方法排除了与(潜在)结果相关的任何协变量作为潜在阶层的指标;见[的假设2注16]13].因此,人们必须强加一个结构性假设,即潜在阶级指标是有条件地独立于给定潜在阶级的所有其他观察变量的,例如在图的因果图中。1a和b.潜伏类指标与非潜伏类指标的“外部”观测变量之间的这种条件独立性是基本潜伏类分析的标准假设[43但在实践中经常被违反[44].在实践中,任何指标都可能同时是治疗或结果的原因,如图中红色箭头所示。1C和d,因此无效的偏差调整的方法是基于这种影响的缺席。最近为适应潜在类别指标和外部变量之间的影响而作的修改仅限于“一两个”([45],第361页)外部变量,当有几个协变量直接影响指标,进而直接影响治疗和结果时,这可能是不现实的,如图所示。1d.在如此复杂的设置下,建议假设所有变量都采用参数模型,对(联合)似然进行“一步”估计[45].但这种参数化方法排除了使用基于机器学习的治疗效果估计器的可能性,而这种估计器在因果推理中越来越普遍[46,47,48].此外,现有的偏差修正方法无法深入了解效应估计器对分类不确定性的敏感性如何系统地影响子群效应。
因果图描述了潜在阶层的指标之间不同的因果(或结构)关系\ \ (C ^ *),以及“外部”观察变量,如治疗(Z)和结果(Y).在左列(子图一个而且c),没有协变量是潜在阶级的预测因子,所以\((X_1, \ldots, X_p)\)是指标。在右列(子图b而且d),是协变量的子集\((X_1, \ldots, X_q)\)潜在阶级的(解释性)预测因子及其指标\((X_{q+1}, \ldots, X_p)\).在第一行(子图一个而且b),在给定潜在类别的情况下,指标是有条件地独立于所有外部变量的,表现为指标与任何其他观察变量之间没有箭头连接。在底部一行(子图c而且d),这些指标可以影响或受外部观察变量的影响,如红色箭头所示。矩形节点表示观察变量,圆形节点表示潜在变量
提出了分类不确定性的敏感性分析
鉴于上述缺点,在本文中,我们提出了一种新的灵敏度分析策略,它与现有的仅寻求纠正错误分类偏差的方法不同。在第一部分中,我们利用(预测或后验)子群成员概率来反映个体成员的证据的质量和强度,为每个子群仔细构造不同的(嵌套的)子集。在第二部分,然后计算每个不同子集的子组特定的平均治疗效果估计。分类不确定性对效果估计稳定性的影响可以使用图形显示进行可视化检查,并使用数值摘要进行经验评估。此外,为了承认隶属概率中固有的抽样不确定性,我们采用了参数引导后(49,以进行关于子群效应的推断。
因此,通过直接评估和量化分类不确定性对亚群效应分析的影响,该建议提供了几个有吸引力的特征。首先,在定义潜在亚群时,没有对因果或结构模型施加限制,如指标-治疗和指标-结果关系的缺失。因此,所有观察到的协变量可以同时用作潜在亚群的指标和混杂调整的条件变量。其次,任何治疗效果估计都可以在没有建模假设的情况下使用,例如在参数结果回归模型下被迫包括治疗和潜在亚组之间的统计交互项。因此,治疗和结果可以是连续的或非连续的,非连续变量采用非线性模型。我们将演示使用双鲁棒增广逆倾向加权(DR-AIPW)估计量(50,51,52],它被赋予了具有吸引力的统计特性,并将(参数回归)模型与给定治疗和协变量的结果以及给定协变量的治疗相结合。第三,任何有限混合模型——包括但不限于潜在类别分析——都可以用来定义(并测量)表征治疗效果异质性的潜在亚群。因此,潜在阶级的指标可能是连续的,绝对的,或两者的组合。最后,通过使用偏差校正估计作为比较效应估计器轨迹相对灵敏度的基准,可以很容易地将现有的偏差校正方法结合起来。因此,所提出的敏感性分析策略可以为研究人员在存在分类不确定性的情况下对实质性亚群效应分析的稳定性提供更严格的评估。
本文的其余部分如下所示。节2引入了符号,定义了兴趣的子群体特异性因果效应及其估计量。对潜在亚群的错误分类所引起的并发症进行了描述。节3.,提出了分类不确定性的敏感性分析方法。节4提出的方法是用两种不同的公开数据集说明的。现有方法的讨论和未来的研究方向,将在第一部分中提供5.所有方法均采用开源统计计算环境实现R[53].给出了在两种常用的有限混合建模方法下实现参数自举的步骤在线补充材料.复制插图和模拟研究的脚本可以在网上免费获得脚注2.
亚组特异性平均治疗效果的潜在结果框架
我们首先使用潜在结果框架定义了兴趣的因果效应,并描述了DR-AIPW效应估计器。让\ (Y_{我}(z) \)表示个体的潜在结果我他们是否(可能与事实相反)接受了治疗\ (Z = Z \).让\ (C_{我}^ {*}\)表示个人的实际子组成员我,其中星号表示本文中的真实(潜在或未知)值。让\ (\ mathcal C {} \)的可能值的集合\ (C_{我}^ {*}\);例如,\(\mathcal {C} = \{1,2\}\)当只有两个子群的时候。因此,个体可以被划分为\ (| \ mathcal {C} | \)子组的值\ (C_{我}^ {*}\).表示所有个体的真实子群成员向量\ (\ varvec {C} ^ {*} = (C_ {1} ^ {*}, \ ldots C_ {n} ^ {*}) \).与常见的逐步潜类方法一样,我们将假设子群的数量\ (| \ mathcal {C} | \)是已知的。当对潜在类的数量没有先验假设时,一般建议采用逐步方法[54,55].首先对观测数据拟合潜伏类及其指标的多个(测量)模型,每个模型具有不同数量的潜伏类。然后使用比较模型简约性准则(如赤池信息准则(AIC))来选择类的数量[56],贝叶斯信息准则(BIC) [57或模型熵;以及其他实质性标准;看到如(58,以获取实际的建议。我们还将在后面的插图中应用选定的标准。当引入其他(外部)观察变量时,如可能影响潜在类别的协变量(即“解释变量”)和可能受潜在类别影响的治疗和结果(即“远端结果”),选择的类别数量就固定了。在本文中,我们只关注可能的错误分类造成的不确定性,而不关注模型选择和识别造成的不确定性。因此,我们采用相同的普遍做法,包括假设潜伏亚群是治疗和结果的因果前因,这在使用已建立的逐步潜伏类方法时是常见的[43].
定义属于同一子群体的个体之间的子群体特异性(平均因果)效应\(c \in \mathcal {c}\)作为\ \(τ_ {c} = \ mathrm {E} \ {Y (1) - Y (0) | c ^ {*} = c \} \),其中期望是对实际属于一个子群体的个体的子群体的期望c.当治疗是随机分配的,亚组特异性的效果可以通过两个治疗组的平均观察结果的差异,在每个亚组的个体之间,无偏估计。但当治疗是非随机分配的,基线的共同原因的治疗和结果,今后称为混杂因素,诱发了治疗与结果之间的虚假相关性。因此,必须调整包括任何潜在混杂因素的预处理或基线协变量,以消除因观察到的混杂因素而产生的偏差[59].在本文中,我们将假设对观察到的协变量进行调整足以消除由于混杂因素导致的治疗和结果之间的所有关联。换句话说,观察到的处理之间没有未测量的混杂Z和潜在的结果\ (\ {Y (1), Y (0) \} \)在由观察到的协变量的独特水平定义的地层内。这样的假设通常被用来确定兴趣的因果效应,我们将在小节中讨论5放松这个假设会带来并发症。在上述无不可测混杂的假设下,亚组特异性效应的无偏估计量\ \(τ_ {c} \)可以通过条件作用观察到的协变量在每个真正潜在亚群。我们将在下一节中描述这样的估计器。
DR-AIPW估计量
在本节中,我们描述了亚群体特异性效应的双鲁棒增宽逆倾向加权(DR-AIPW)估计量\ \(τ_ {c} \).让\ (Z_{我}\)而且\(\varvec{X}_{i} = (X_{1i}, \ldots, X_{pi})\)表示观察到的处理和向量p分别为个体的基线协变量我.对于二元处理,倾向评分[60个人的我在子群c定义为在观察到的协变量条件下接受治疗的条件概率;也就是说,\ \公关(Z_{我}= 1 | \ varvec {X} _ {}, C_{我}^ {*}= c) \).为简便起见,我们今后将个人(亚群体特定)倾向得分表示为\ (p (\ varvec {X} _ {}, C_{我}^ {*}= c) = \公关(Z_{我}= 1 | \ varvec {X} _ {}, C_{我}^ {*}= c) \).让\ (\ mathrm{我}(A) \)当事件发生时,指示函数的值为1一个发生,否则为0。定义逆倾向(分数)权重[61,62)个人我(在小组c):
让\ (m (Z_{我}\ varvec {X} _ {}, C_{我}^ {*}= c) = \ mathrm {E} (Y_{我}| Z_{我}\ varvec {X} _ {}, C_{我}^ {*}= c) \)在(真)亚组内,表示给定治疗和协变量的假设结果回归模型\ (C_{我}^ {*}= c \).让\ (m_ {c} ^{*} = \ \和限制_ {i = 1} ^ {n} \ mathrm{我}(C_{我}^ {*}= c) \)表示(true)子群中的个体数量\ (C_{我}^ {*}= c \).后(51的DR-AIPW估计量\ \(τ_ {c} \)是:
当倾向评分(PS)和结果模型都被正确指定时,估计量的方差被一致估计为:
一个瓦尔德\(100(1 -α)\ \ % \)通过对点估计值的加减可以构造置信区间(CI)\ (\ widehat{\τ}_ {c} (\ varvec {c} ^ {*}) \)乘以\(α/ 2 \ \)标准正态分布的分位数\ \√{\ widehat {\ mathrm {V}} _ {c} (\ varvec {c} ^ {*})} \).
DR-AIPW估计量具有吸引力,因为当倾向评分模型和结果模型都正确指定且一致(如果只有一个模型被正确指定)时,DR-AIPW估计量是渐近无偏的[50,63].此外,它允许减少对常规参数回归模型的依赖,这些模型要求(正确地)指定协变量与治疗或结果或两者之间的确切关系。倾向评分可用于同时调整所有观察到的混杂因素,且不依赖任何其他协变量(观察到的或其他的),以确保观察到的混杂因素在治疗组和未治疗组中分布相似(即“平衡”)[64].因此,基于上述原因,我们将采用DR-AIPW估计器来开发所提出的灵敏度分析。
在本文中,我们利用协变量平衡倾向得分(cbp) [65]以估计亚组特异性倾向评分模型的治疗给定协变量。模型系数的CBPS估计可最大化协变量平衡以消除混杂偏差,而传统的极大似然估计可优化预测精度[66,可能会导致重量不稳定。脚注3.在后面用于说明所提方法的应用实例中,我们将采用协变量具有主效应的逻辑回归模型作为倾向得分模型。此外,对于亚组特异性结果模型,我们将考虑一个饱和逻辑回归模型,其中包括治疗和协变量之间所有可能的相互作用。为了避免在结果模型中过度拟合,我们使用弹性网正规化或惩罚[69来估计系数。弹性净惩罚是脊回归的混合体[70惩罚和最小绝对收缩选择算子(LASSO) [71)处罚。脊回归惩罚部分删除了所有的变量,通过缩小系数估计,但不完全为零。相比之下,LASSO惩罚通过将系数估计精确设置为零来选择变量,从而完全删除该变量。弹性网继承了这两种惩罚的好处,当存在许多相关变量时尤其有用[72].在当前的背景下,协变量可以是潜在亚群的指标,因此高度相关,因为它们有共同的依赖性(对潜在亚群)。
错误分类的含义
通常在实践中,潜在的子群体成员\ (\ varvec {C} ^ {*} \)都是未知的,必须加以推断。让\ (C_{我}\)表示个体的赋值子群我,其中依赖于统计模型来获取\ (C_{我}\)为便于标记,隐式和省略。将归属子群成员的结果向量表示为\ (\ varvec {C} = (C_ {1}, \ ldots C_ {n}) \).子群特异性估计给出了一个归属子群成员向量\ (\ varvec C {} \)是通过代入得到的\ (\ varvec C {} \)为\ (\ varvec {C} ^ {*} \)在(2).给定所归属的子群成员\ (\ varvec C {} \),让帽子\ (\ p {} (\ varvec {X} _ {}, C_{我}= c) \)而且\(\帽子{m} (Z_ {}, \ varvec {X} _ {}, C_{我}= c) \)的分区中,分别表示估计的个体倾向得分和预测结果\ (C_{我}= c \),让\ (\ widehat{\τ}_ {c} (\ varvec {c}) \)表示结果效果估计量。但当个体被错误分类时,\ (\ varvec C {} \ ne \ varvec {C} ^ {*} \),使归责亚群受到来自不同潜在亚群个体的污染,不同亚群的(真)倾向评分和结果模型不同,则估计倾向评分模型帽子\ (\ p {} (\ varvec {X} _ {}, C_{我}= c) \)以及估计结果模型\(\帽子{m} (Z_ {}, \ varvec {X} _ {}, C_{我}= c) \)与真实模型不一致\ (p (\ varvec {X} _ {}, C_{我}^ {*}= c) \)而且\ (m (Z_{我}\ varvec {X} _ {}, C_{我}^ {*}= c) \),分别。因此,在错误分类下,亚群体特有(平均因果)效应未被识别[13],即使在治疗和结果之间没有不可测量的混淆。
分类不确定度的敏感性分析
当用有限混合模型得到的归属子群成员时,每个个体都有(通常是非零)属于每个不同子群的估计预测或后验概率。表示个体的估计概率我属于每一个可能的子组的\ (\ widehat{\λ}_ {ic} \通用电气0 c \ \ mathcal c {} \),在那里\ \(和\长成具_ {c} \ widehat{\λ}_ {ic} = 1 \).类似于\ (C_{我}\),依赖统计模型进行估计\ (\ widehat{\λ}_ {ic} \)为便于标记,隐式和省略。在模态分配下,个体的归属(潜)子群由他们所属的可能性最大的子群决定(概率最大);也就是说,\ (C_{我}= {arg} \ \文本,文本\{马克斯}_ {c \ \ mathcal {c}} \ widehat{\λ}_ {ic} \).在随后估计子群特定效应时,将假定的子群隶属关系固定,忽略了概率隶属关系所传递的信息。例如,假设那个人我是否有子组成员概率\ (\ widehat{\λ}_ {i1} = 0.51 \),而另一个人j的概率\ (\ widehat{\λ}_ {j - 1} = 0.98 \).虽然两个个体在估计子群体特异性因果效应时具有相同的归责子群体,但在两个个体之间,个体我更有可能被错误分类。因此,如果是个体,评估亚组特异性效应估计的变化是明智的我不属于第1个子组,在个人之前j.在此基础上,我们开发了一种评估亚群特异性效应对分类不确定性推理敏感性的策略。
亚组特异性治疗效果的轨迹
我们建议通过系统地考虑属于该子组的个体的不同分区,来评估可能的错误分类对子组特异性效应的影响。特别地,我们利用概率子组成员关系,根据个体的(估计)值对其排序\ (\ widehat{\λ}_ {ic} \)对于一个特定的子群c.让\ (\ widehat {\ mathcal{年代}}_ {c} (m) \)表示对米属于亚群的个体c;“帽子”符号表示依赖\ ((\ widehat{\λ}_ {ic},我= 1,\ ldots n c \ \ mathcal {c}) \).从空集合开始\(\ widdehat {\mathcal {S}}_{c}(0) = \emptyset\),重复以下步骤\(j = 1,\ldots,n\)反过来:
- 1
让\ (^ {*} \)在所有个体中,索引具有最大子群体成员概率的个体:(i)目前未加入的个体\ (\ widehat {\ mathcal{年代}}_ {c} \) (j - 1),和(ii)谁的归责子群c;也就是说,
$ $ \{对齐}我开始^{*}={\暗流{我}{\文本{arg} \ \文字{马克斯}}}\ widehat{\λ}_ {ic} \ * \ mathrm{我}\{我\ \中\ widehat {\ mathcal{年代}}_c (j - 1) \} \ * \ mathrm{我}(c = \暗流{c ^{\ '} \中\ mathcal {c}}{\文本{arg} \ \文字{马克斯}}\,\ widehat{\λ}_ {ic ^{\ '}})。\{对齐}$ $(6)如果\ (\ widehat {\ mathcal{年代}}_ {c} \) (j - 1)已经包括所有的个体,其归属子群将是c,这样剩下的候选个体就不会被归到子组中c在模态分配下,则确定\ (^ {*} \)简而言之,作为子群体成员概率最大的个体的(指数);也就是说,
$ $ \{对齐}我开始^{*}={\暗流{我}{\文本{arg} \ \文字{马克斯}}}\ widehat{\λ}_ {ic} \ * \ mathrm{我}\{我\ \中\ widehat {\ mathcal{年代}}_ {c} (j - 1) \}。\{对齐}$ $(7) - 2
添加个人\ (^ {*} \)来\ (\ widehat {\ mathcal{年代}}_ {c} \) (j - 1)确定下一个分区;也就是说,\ (\ widehat {\ mathcal{年代}}_ {c} (j) =我^ {*}\ bigcup \ widehat {\ mathcal{年代}}_ {c} \) (j - 1).
- 3.
计算个体间亚组特异性(平均治疗)效果估计\ (\ widehat {\ mathcal{年代}}_ {c} (j) \).
最大的分区就是观察到的样本\(\ widdehat {\mathcal {S}}_{c}(n) = (1,\ldots,n)\).个体嵌套分区的顺序\ (\ {\ widehat {\ mathcal{年代}}_ {c} (j): j = 1, \ ldots n \} \)因此,根据属于该子组的个体数量(一次一个)的增加,引出了一系列子组特定的影响估计c.当存在分区时\ (\ widehat {\ mathcal{年代}}_ {c} (j ^ {*}) \)对于某个值\(j^{*} \in \{1,\ldots,n\}\)这只包括实际属于一个子群体的个体c(因此排除了不属于该子组的所有个人c),那么使用这一分区(只由正确分类的个体组成)的亚组特定效应估计将与其总体值一致。在下一节中,我们将使用插图中选定的例子演示子群体成员概率的图形摘要,以及可以通过视觉检查来评估子群体特异性效应的相对稳定性或(在)敏感性的构建的效应估计序列。
我们已经决定增加一些本应归入子组的个人c排在其他被归为不同子组的人前面。当有两个以上的子群体时,一个个体我用一个赋值子群\ (C_{我}= c \)不过可以有子群体成员的概率吗\ (\ widehat{\λ}_ {ic} \)比其他个体小j用不同的赋值子群\ (C_ {j} \ c ne \).考虑下面包含三个子组的简单示例。两个个体的(后验)子群成员概率我而且j分别为:\ ((\ widehat{\λ}_ {i1}, \ widehat{\λ}_ {i2}, \ widehat{\λ}_ {i3}) = (0.4, 0.3, 0.3) \)而且\ ((\ widehat{\λ}_ {j - 1}, \ widehat{\λ}_ {j2}, \ widehat{\λ}_:{j3}) = (0.45, 0.55, 0) \).因为我们的重点是基于归责子组成员(在模型分配下)的效应估计的敏感性,我们将添加子组1个体我(在所有子组中,谁有更强的证据属于子组1)优于个人j(与亚组2相比,前者的证据较弱)。由此可见,效应估计\ (\ widehat{\τ}_ {c} (\ varvec {c}) \),其中,计算的子组成员向量\ (\ varvec C {} \)在模型分配使用下确定\ ((\ widehat{\λ}_ {ic},我= 1,\ ldots n c \ \ mathcal {c}) \),对应于基于的效果估计\ (\ widehat {\ mathcal{年代}}_ {c} (m_ {c}) \),在那里\ (m_ {c} = \ \长成具和_ {i = 1} ^ {n} \ mathrm{我}(C_{我}= c) \)表示归为子群的个体数c.
只有当子组内的权重定义良好时,才能计算特定于子组的效果估计量。特别是,理论或确定性的“正性”假设指出,对于协变量空间中的所有值,所有真实(但未知)倾向得分必须严格介于0到1之间[67,73].但在有限的样本中,正性假设仍然可能被实际或随机地违反。例如,在同一个子组中,可能只有接受治疗或未接受治疗的个体,而不是两者都有,或者在手头的数据中只观察到特定的协变量值,以便在一个子组中拟合的倾向评分模型中存在“完全分离”。那么就无法估计出每个子组的倾向得分,也就无法计算出效应估计。此外,当一个子组中只有少数几个个体时,估计的倾向得分可能非常接近于零或一,而得到的权重可能具有非常大的值,导致高度不稳定的权重和效应估计,随着个体被添加到(或从)子组中,这些权重和影响估计会急剧波动。只需将重点放在分区上,就可以避免这种潜在的无信息的波动\ (\ widehat {\ mathcal{年代}}_ {c} (j) \)的特定值索引j.例如,假设兴趣只存在于成员概率介于0.99和0.01之间的个体中。然后让\ (m_ {c} ^{*} = \ \长成具和_ {i = 1} ^ {n} \ mathrm{我}(\ widehat{\λ}_ {ic} \通用电气0.99)\)是属于子群的概率的个体数c至少和0.99一样大,并且让\ (m_ {c }^{**} = \ 总和\长成具_ {i = 1} ^ {n} \ mathrm{我}(\ widehat{\λ}_ {ic} \通用电气0.01)\)是属于子群的概率的个体数c至少大于0.01。然后,只根据分区计算出特定子组的效应估计序列\ (\ {\ widehat {\ mathcal{年代}}_ {c} (j): j = m_ {c} ^ {*}, \ ldots m_ {c} \ ldots m_ {c }^{**}\}\).用户指定的阈值可以根据是否可以从添加成员概率超出合理阈值的个体(一次一个)中获得见解来决定。因为我们关注的是分类不确定性的影响,所以我们选择基于个体的预测或后验概率或属于特定子群体的可能性来施加阈值,而不是(任意的)绝对子群体比例或规模。
对分类不确定性敏感性的图形评估
在本节中,我们将描述如何从上一节中直观地检查亚群特异性效应估计的构建轨迹的相对稳定性或(在)灵敏度。我们为每个子组使用两个图形摘要。
成员概率图
在每个子群的第一个图形总结中,我们绘制了属于该子群的个体的成员概率,如图中顶部的那些。2(针对三个来自不同数据集的不同例子)。在每个面板中,曲线表示其子群体成员概率的个体的累积比例(水平轴)\ (\ widehat{\λ}_ {ic} \)对于该子组,大于或等于指定的值(在垂直轴上)。因此,对于任意两个隶属概率值,曲线是单调递减的l而且\ (l ^ {\ '} \)在哪里\(l < l^{\prime}\),至少有同样多的个体的成员概率大于或等于l因为有\ (l ^ {\ '} \).每条曲线图形化地描述了样本中成员概率的分布。梯度较陡的曲线(因此更接近阶跃函数),如图左上角的例1。2,表示一个更独特的个体划分,这些个体要么属于(成员概率接近于1),要么不属于(成员概率接近于0),该子组。相反,具有较弱梯度的曲线,如图中顶部和右侧面板中的例2和例3。2,表明存在“试探性”个体,他们属于该子群体的概率可能接近0.5。(许多)试探性个体的存在表明个体不明确地分为潜在亚群体的成员和非成员。我们重申,我们的兴趣不仅在于概率的值,而且在于每个潜在子群中可能成员和非成员的分离程度。最后,一条垂直折线划分了归属于一个子群的个体的比例。
治疗效果轨迹图
在每个子组的第二个图形总结中,我们绘制了上一节中描述的子组特定的平均治疗效果估计的轨迹。轨迹由(嵌套的)个体分区序列索引,每次添加一个到该子组,如图的底部面板所示。2.为了便于视觉清晰,我们将简单地(在横轴上)绘制属于每个子组的个人的累积比例,与上面相应面板中的成员概率相同。效应点估计值画在纵轴上。(图中的纵轴。2不同是因为这些例子来自不同的数据集。)我们建议为单个数据集使用跨类显示的相同规模和范围的值,正如我们将在下一节中使用应用示例演示的那样。每个面板上的空圈标记了基于归属子群成员的子群特定效应估计。它在水平轴上的值与上面相应面板上的垂直折线的值相同。在这些例子中,我们为成员概率设置了0.99和0.01的阈值,以便将注意力集中在轨迹的稳定性上,因为可以合理地认为个体可能属于该子群体。
然后,我们可以衡量子组特异性效应估计的相对稳定性,即假设属于该子组的个体或多或少(暂定的)与被归为该子组的个体相比。估计中的不确定性可以(部分)通过评估其相对于基于推定子组成员的95% CI的稳定性来解释,这些CI被简单地绘制为垂直误差条。例1和例2(图中左下和中间两个面板)。2),亚组特异性效应估计值相对稳定,即使该亚组中尝试性个体较少(或较多),点估计值仍保持在95% CI内。相比之下,在例3中(图的右下面板)。2),亚组特异性效应估计值显示出较大波动。特别是,当子组包含更多的个体(具有较小的成员概率)时,估计超出了基于推定成员的CI的下界。这种不稳定性表明,在95% CI所捕捉到的采样不确定性之外,对潜在错误分类的敏感性很高,95% CI仅假设所归属的子组是固定的。在下一节中,我们将描述如何构造考虑分类模型和效应估计模型中抽样不确定性的摄动ci。一个不稳定的轨迹,其值要么在CI之外,要么在不同的个体子集(显著)不同,这表明有可能被其他子群体的成员污染。拟合局部平滑器或计算移动平均线可用于进一步数值检验轨迹的稳定性;我们把探索这种方法推迟到以后的工作中去。因此,在解释子群体特异性效应时应谨慎,研究人员应重新审视潜在子群体的定义和估计成员概率的模型。
摄动的置信区间
因为每个个体都有属于不同类别的非零概率,所以可以对所推定的类成员进行多个伪类绘制,例如,假设具有给定概率的二项式或多项式分布,可以对个体进行随机分类[74].但这种方法只解释了从粗化概率类成员到确定性分区的不精确性,并不比单模态分配好[43].尽管估算的子群隶属度是潜在子群隶属度的(预测)易出错度量,但基于拟合观察样本的隶属度模型估计的子群隶属度概率受抽样不确定性的影响。继续上面的例子,假设个体的子群体成员概率\ ((\ widehat{\λ}_ {j - 1}, \ widehat{\λ}_ {j2}, \ widehat{\λ}_:{j3}) = (0.45, 0.55, 0) \)实际上属于子组1,但估计值\ (\ widehat{\λ}_ {j - 1} < \ widehat{\λ}_ {j2} \)是由于有限混合模型估计参数的抽样变异性。我们的兴趣不只是把这个人归到子组1或子组2中,在重复随机分类中45%或55%的时间,而是承认概率本身的抽样不确定性。
在进行子群效应推断时,为了更诚实地反映估计子群成员概率的不确定性,我们提出微扰概率如下:
- 1
从它们的联合抽样分布中随机抽取一个子组成员模型参数估计值,我们将其表示为\ ({G} (\ cdot) \ \帽子).为每个单独的\ (i = 1 \ ldots n \),计算扰动子群成员概率,我们用\((\tilde{\lambda}_{ic}, c \in \mathcal {c})\),使用\ \ (sim \)符号后,在子组成员模型中插入随机抽取的参数值。关于如何在两种常用的有限混合建模方法中执行这一步的详细信息,包括使用免费提供的示例R软件包,在网上提供补充材料.
- 2
给定扰动子群成员概率\((\波浪号{\λ}_ {ic},我= 1,\ ldots n c \ \ mathcal {c}) \),用模态赋值确定每个个体的(摄动)赋值子群\(\波浪号{C} _{我}= {arg} \ \文本,文本\{马克斯}_ {C \ \ mathcal {C}} \波浪号{\λ}_ {ic} \).计算每个子群特定的效应与由此产生的扰动子群成员\ \(波浪号{\ varvec {C}} =(\波浪号{C} _ {1}, \ ldots \波浪号{C} _ {n}) \).对于每个摄动,构造\(100(1 -α)\ \ % \)(摄动)归责子群隶属度下的CI\ \(波浪号{\ varvec {C}} \).
- 3.
重复以上两个步骤,例如,1000次。通过将低(或上)端点设为所有单个CI的低(或上)端点中的2.5(或97.5)百分位,将所有单个CI的低(或上)端点结合起来,以确定“扰动”CI。
为了减少实际中标签切换的风险,可以对每个扰动中的子群进行重新标记,以最大限度地提高基于扰动概率的模态分配与估计的类成员之间的相似性。我们选择从单个扰动中消除CI的极端端点,以提高结果(组合)扰动CI对极值的不敏感性。原则上,摄动CI可以用联合方法构造,其中下(上)端点是CI的所有独立下(上)端点中的最小(最大值)。然而,这样的区间容易受到单一扰动的影响,从而产生极端的ci,并且可能由于覆盖水平超过其名义水平而过于保守[75].
在网上补充材料,我们用模拟的例子来实证地证明,仅仅保持假定的子群成员关系固定,就可以导致包含真实子群效应(远低于名义覆盖率水平)的ci。相比之下,受干扰的ci更频繁地包含了真正的子群体效应,尽管可能低于名义覆盖水平,因为偏见仍然没有纠正。此外,我们通过蒙特卡洛模拟经验地评估了子群体特定效应估计的构建轨迹的能力——仅使用估计的子群体成员概率——恢复真实效应。我们考虑定义为潜在类模型中的潜在类或高斯混合模型中的混合组分的子群。
一般来说,每个子群特定效应轨迹的点态置信带可以使用摄动概率类似地构造;我们把细节交给在线补充材料.这种参数自举方法已被用于其他情况,如项目反应理论得分估计[76,77].最后,虽然参数模型中系数估计的标准误差可以解释估计类成员的不确定性[78],这种参数化方法仅限于将治疗效果作为回归系数参数化的结果模型。将这些方法扩展到本文所使用的DR-AIPW估计器是未来工作的一个方向。
使用实际数据的应用示例
经皮冠状动脉介入
“林德纳”数据集来自一项关于增强经皮冠状动脉介入治疗(PCI)对6个月生存率有效性的观察研究。该数据集作为PSAgraphics[79),鼻音[80)包R其中包含了1997年辛辛那提市俄亥俄州心脏健康林德纳中心996名患者的信息。我们利用了可用的数据集版本作为鼻音包中。治疗方法是患者是否单独接受常规PCI治疗(\ (Z = 0 \))或有意用级联阻阻剂阿昔单抗(\ (Z = 1 \));698例患者接受了阿昔单抗治疗。结果是患者是否存活到6个月(\ (Y = 1 \))或否(\ (Y = 0 \));970例患者存活到6个月。记录以下协变量:患者是否在过去7天内发生过近期急性心肌梗死;左心室射血分数(0 - 90之间的百分比);初始PCI程序中涉及的血管数量(0到5之间的整数);是否使用冠状动脉支架;患者是否已被诊断为糖尿病;患者身高(单位:厘米);以及病人是男是女。
仅为说明的目的,我们考虑了一个潜在阶层模型,其中五个协变量测量患者的病史和健康史,作为潜在阶层的显性指标。在显性指标中,只有心室射血分数变量是连续的;其余的变量都是绝对的。因此,仅为了将潜在类模型拟合到这个举例说明的观察到的协变量上,连续变量通过分组到样本五分位数中进行离散化,以获得一个(粗略离散的)类别变量。我们拟合了不同的候选测量模型的潜在类别及其指标,每个潜在类别的固定数量在2到10之间(因此共有9个候选模型),使用poLCA包(81在R.我们选择有两个潜在类别的模型,因为它最小化了BIC, AIC仅略大于三个类别模型的最小值。我们在表中按潜在等级报告了五个显化指标的平均值1.这些值表示该类患者表现出该特征的概率(如果指标为二元)或平均五分位数(如果指标为离散化)。
由于治疗是非随机分配的(接受Abciximab的患者往往病情更严重,因此更有可能遭受6个月的死亡),PS和结果模型与所有可用(离散化)协变量拟合在每个归入类中,以计算DR-AIPW效果估计量。这两个模型都包含了潜在阶级模型中排除的两个人口统计学变量(身高和性别)。我们假设在调整了所有测量的协变量后,每个类内没有不可测的混杂。基于计算的类成员关系的特定于类的影响估计(括号中显示的95% CI的端点按递增顺序列出)显示在表的第二行中2.结果显示增强PCI只有大约一半的患者有积极效果。这些患者在过去7天内更有可能发生近期急性心肌梗死,但在初始PCI手术中涉及的血管数量较少。尽管如此,没有足够的证据表明估计类别之间的治疗效果异质性(由于ci重叠)。相比之下,整个样本的DR-AIPW估计量为0.06,95% CI为(0.02,0.10),表明对所有个体的平均效应是有益的。
属于每个潜在类别的个体的后验成员概率的图形总结,以及每次向每个类别添加一个个体时的特定类别效应估计的轨迹,绘制在图的顶部和底部面板中。3.分别。这两个潜在的阶层都没有完全分开,正如上面面板上曲线的梯度所示,每个阶层中都有尝试性的个体。面板底部一排显示的轨迹表明,相对于基于推断的阶层成员关系的95% CI,这两个阶层的特定影响估计值似乎是稳定的。只有当更多的个体(可能来自第一类)加入第二类时,第二类的积极治疗效果才逐渐趋于零。扰动95% ci的端点显示在Table的第三行2并在图的下一行以水平虚线表示。3..类1的摄动置信区间略宽于基于归属隶属度的摄动置信区间,而类2的摄动置信区间要宽得多。但在2类患者(约占样本的一半)中,增强PCI对6个月生存率的平均影响仍然具有统计学意义(5%水平),即使考虑了估计成员概率的抽样变异性,95%的扰动CI为(0.02,0.30)。
右心导管术
“RHC”数据集来自一项关于右心导管在危重患者初始护理中的有效性的观察研究[11].它是作为Hmisc包中R.该数据集包含了美国5个医疗中心的住院成年患者的信息,他们参与了“了解预后、结果偏好和治疗风险研究”(SUPPORT)。治疗是患者是否在入院24小时内接受RHC (\ (Z = 1 \))或否(\ (Z = 0 \));2184例患者接受了RHC。结果是患者是否在入院后180天内死亡(\ (Y = 1 \))或否(\ (Y = 0 \));3722例患者在考虑的时间范围内死亡。共有5735名参与者,共73个协变量。
为说明的唯一目的,我们考虑了一个潜在阶层模型,其中60个协变量测量患者的医疗和健康史作为潜在阶层的显性指标。显性指标中,连续指标20个;每一个都被分成样本五分位数进行离散化,以获得(粗略离散的)分类变量。我们拟合了六种可能的(测量)模型,仅用于潜在类别及其指标,每个模型都有不同数量的潜在类别(介于2到7个之间)脚注4),使用poLCA包(81在R.我们选择了具有四个潜在类的模型,因为它最小化了AIC和BIC,并且可以计算出给定的类隶属度下的亚群特异性DR-AIPW估计量。虽然较大的模型(5至7类模型)具有较低的AIC和BIC值,但对于某些只包含治疗或不治疗或只有幸存或死亡个体的归属类,无法计算出亚组特异性效应估计量。由于篇幅限制,我们在联机中报告每个清单指标的平均值补充材料.
由于治疗是非随机分配的(接受RHC的患者往往有现有的健康或医疗状况,因此更有可能遭受6个月的死亡),PS和结果模型与所有可用(离散化)协变量拟合在每个归入类中,以计算DR-AIPW效果估计量。这两个模型都包括了潜在阶级模型排除在外的13个人口和社会经济地位变量(年龄、性别、种族、受教育年限、收入和医疗保险)。我们假设在调整了所有测量的协变量后,每个类内没有不可测的混杂。基于计算的类成员关系的特定于类的影响估计(括号中显示的95% CI的端点按递增顺序列出)显示在表的第二行中3..结果显示,RHC只在约40%的患者中有不良影响。这些患者更有可能患有多器官系统衰竭(MOSF),包括败血症、肝硬化、胃肠道诊断、慢性肾脏疾病或血液透析或上消化道出血,而不太可能患癌症。尽管如此,没有足够的证据表明估计类别之间的治疗效果异质性(由于ci重叠)。相比之下,整个样本的DR-AIPW估计量为0.06,95% CI为(0.04,0.09),表明在所有个体中存在统计学上显著的平均有害影响。
属于每个潜在类别的个体的后验成员概率的图形总结,以及每次向每个类别中添加一个个体时的特定类别效应估计的轨迹,绘制在图的顶部和底部的面板中。4分别。四个潜在的类别中没有一个是完全分开的,从顶部面板的曲线渐变可以看出,每个类别中都有尝试性的个体。面板底部一排显示的轨迹表明,针对特定类别的效应估计对于类别1、2和4是相对稳定的,约占样本的92%。然而,第3类中其余8%的患者的估计轨迹随着更多的个体加入该类而波动,超出了在归属类成员下的抽样变异性。扰动95% ci的端点显示在Table的第三行3.并在图的下一行以水平虚线表示。4.虽然类1、类2和类4的摄动CI略宽于基于推断隶属度的CI,但类3的摄动CI要宽得多。在占样本约40%的第4类个体中,RHC对6个月死亡率的平均影响仍然具有统计学意义(在5%的水平),即使在考虑估计成员概率的抽样变异性后,扰动95% CI为(0.03,0.14)。
讨论
与使用潜在类模型的现有工作进行比较
当使用潜在类模型来推断个体子群的成员关系时,可以考虑特定的现有偏差修正程序。布雷等人[12]建议采用“包容性潜在类别分析”,其中属于每个潜在类别的个体后验概率,以及估计的平均潜在结果,都以同一组协变量为条件。在潜在类模型(在第一个“分类”步骤中)中,所有在类特定效应估计器(在第二个“分析”步骤中)中被约束的观察到的基线协变量因此应该被包括作为独立的“伴随”预测因子或解释变量。然而,如应用实例所示,假设这种“伴随变量”潜在类模型[82]可能需要区分观察到的协变量,这些协变量要么是潜在类别的显性(“辅助”反应)指标,要么是伴随(独立)预测因素[83].加德纳(13后),(41]和[42],推导出真正潜在阶层特定的平均潜在结果的无偏估计量,该结果纠正了推定潜在阶层成员的潜在错误。然而,在给定潜在类别的前提下,估计量的有效性是建立在假设潜在类别指标与外部观察变量之间的条件独立性之上的。最近修改的偏差调整方法允许违反这一假设,仅限于设置有“一个或两个”([45],第361页)外部变量,当有几个协变量(即解释变量)直接影响指标,进而直接影响治疗和结果(即“远端”结果)时,这可能是不现实的。此外,不清楚是否允许非连续的外部变量,以及这些方法是否在特定软件之外的R中实现[84,85].
在这篇论文中,我们关注的是,在使用观察协变量定义的不同潜在类别的个体之间,观察治疗对观察结果的影响是如何不同的。兰扎等人。[86和Clouth等人。[87考虑观察到的治疗影响未观察到的结果的设置,其水平采取潜在类别的形式,同时调整观察到的协变量,作为潜在类别的解释变量。相比之下,Bray等人。12,布雷等人。[88和舒勒[89],考虑一个未观察到的治疗,其水平采取潜在类别的形式,影响观察到的结果,同时调整观察到的协变量,作为潜在类别的解释变量。我们关注的设置是,在潜在类别分析的背景下,观察到的治疗和结果都是受潜在(解释)类别影响的“远端结果”(反应)变量。原则上,当测量模型与结构回归模型相结合时,用于估计潜在(解释)类与观察(响应)变量之间关联的潜在类方法[42,90,可用于评估特定类别的治疗效果。但这些方法将需要额外严格的假设:(i)潜在类别变量如何调节治疗对结果的影响,(ii)调整(正确指定的线性)结果模型中治疗和结果的观察混杂因素;见,例如,(91]和[92].梅耶尔等人[92通过假设协变量-治疗(统计)相互作用术语来评估(观察到的)协变量的所有独特组合的(条件)治疗效果,考虑效果的异质性。此外,结果回归模型需要指定可能的调节因子与治疗之间复杂的相互作用,如(潜在的)类治疗、协变量-治疗和类协变量-治疗术语,当协变量多于少数时,结果回归模型可能变得笨拙、不稳定和不可解释。相反,我们建议使用这样一种估计量:(i)通过适应非线性模型,允许连续或非连续结果,(ii)不依赖于根据潜在类别、治疗和协变量的(可能复杂的)函数对结果进行正确建模。
局限性和未来方向
有几个未来的研究途径,以扩展在这篇论文中发展的想法。当实质性的兴趣在于评估协变量(潜在的复杂函数)调节的治疗效果时[92,有限混合回归模型[37]因为结果可以被认为是对个体进行分类的一种更简洁的参数选择。在每个类中拟合估计模型的更简洁的方法具有借鉴跨类混杂机制的信息和更容易的模型解释的好处。但这样的方法需要扩展DR-AIPW估计器,以允许这样的结果模型;此外,扰动类成员概率将需要考虑结果模型和倾向评分模型中参数的(联合)抽样变异性。此外,在实践中很少知道混淆机制在不同类别之间的相似或不同程度。因此,一种灵活的方法允许研究人员在每个类中使用任何合适的估计方法。在未来的工作中,我们将探索使用基于数据自适应非参数机器学习的算法的效果估计,该算法利用样本分割、交叉拟合和平均来降低过拟合的风险[93],并将其与参数化方法进行比较。参数化方法允许修正分类错误,但可能容易出现结构模型的错误规范。
仅仅为了说明,我们在应用示例中做了三个简化假设。首先,由于常见的潜类方法被限制为(无序的)分类变量的显性指标,我们对潜类指标的连续变量进行离散化。一般来说,指标可以由分类变量和连续变量组成。因此,在这种设置下,潜在类分析的另一种选择是实现基于模型的二元数据和高斯数据的组合聚类,例如FLXMCmvcombi在flexmix包(94].其次,与其他潜在类方法一样,我们假设潜在类的数量是先验已知的,并使用广泛采用的AIC和BIC模型选择标准来确定类的数量。因此,与其他潜在类方法一样,一个特定的子组或类成员模型只能在足够大的样本量和相对较少的潜在类数量下拟合观察数据。对于试图测试特定阶层治疗效果的研究人员来说,一个更复杂的问题是,他们必须进一步考虑拟合完全特定阶层的结构模型的可行性。第三,我们假设缺失的数据是完全随机缺失的,因此一个完整的案例分析是合适的[95].在实践中,研究人员应该考虑在估计伴随变量的潜在类模型或多级潜在类模型时允许缺失数据的其他方法,如MultiLCIRT[96].例如,[97]提出了一个使用动态倾向评分方法估计权重的因果潜在类别模型,以发现使用MultiLCIRT包估计潜在类别模型的潜在亚组患者。
在本文中,我们单独使用基线协变量定义了子组。或者,可以将这些类定义为倾向评分模型的一部分,该模型同时对具有未知分区的观察数据进行多个回归拟合。例如,[25]采用有限混合逻辑回归模型作为倾向评分模型(在多级设置下),将治疗选择过程划分为不同的潜在类别。但对二元因变量进行有限混合逻辑回归(有多个成分)一般来说是不可行的,因为当且仅当只有一个成分时,伯努利混合模型(只有一个试验)是可识别的[98,99].因此,将提出的敏感性分析扩展到倾向评分的多水平混合逻辑回归模型需要不同的方法,以在向每个子组添加个体时保持聚类结构。通过使用广义倾向评分进行治疗,所提出的方法可以很容易地适用于定量或连续治疗[One hundred.].例如,线性回归模型的离散混合[94]可用于估计亚组特异性广义倾向评分模型。将所提出的敏感性分析扩展到纵向数据,例如当治疗直接影响第一次处于某一潜在类别的概率以及随着时间从某一潜在类别转移到另一潜在类别的概率时[101),是复杂的。因为潜在的类成员概率会随着时间变化,构造的分区——以及随后的类特定效应估计轨迹——可能会随着时间发生类似的变化,这可能会使稳定性评估具有挑战性。
允许由于分类错误而产生的不可测混杂(例如,当不可测混杂仅限于一个特定的子组时[102,而来自该子群体的个体被错误分类)引入了另一个偏见来源。相反,当同时是潜在亚组指标和治疗和结果的共同原因的变量未被测量时,错误分类可能潜在地由未测量的混杂造成。为了简单起见,我们将重点放在敏感性分析程序的概念开发上,假设所有混杂因素都得到了测量,并将处理具有潜在不同偏差来源的更复杂场景的工作推迟到未来的工作。最后,我们只考虑了有限混合模型的两个不同类别,其中协变量专门用来测量潜在类别,仅仅是为了激发所提出的敏感性分析程序。原则上,非参数软聚类方法,如“可能性模糊c均值”[103]可纳入建议的策略内。这种方法将个体划分为不同的类,而不为观察到的数据分布假设一个潜在(参数)模型,允许每个个体同时属于多个类。用来衡量每个个体属于每个给定类别的程度的成员等级可以推导出整个类别的总和为1,但不必表示根据个体的(减少的)错误分类可能性对其进行排序的概率度量。在评估特定类别影响估计的轨迹时,还需要进一步的工作来量化个体成员等级中的不确定性,以干扰类别成员概率。
数据和材料的可用性
所有R插图中使用的脚本和模拟研究可以在GitHub上免费获得https://github.com/wwloh/heterogeneous-effects-under-misclassification.支持本文结论的数据集可作为鼻音(https://CRAN.R-project.org/package=twang),Hmisc(https://CRAN.R-project.org/package=Hmisc)包在综合R档案网络。
笔记
-
我们承认,原则上,当每个个体属于特定子群的预测或后验概率为100%时,根据最大后验概率分配规则,可以从本质上排除错误分类。在这种理想但实际上不常见的情况下,本文提出的方法将是不必要的。
-
八类模型的算法无法收敛。
参考文献
Ferreira JP, Duarte K, McMurray JJV, Pitt B, van Veldhuisen DJ, Vincent J, Ahmad T, Tromp J, Rossignol P, Zannad F.数据驱动的方法识别射血分数降低的心力衰竭患者的不同预后和醛固酮拮抗剂反应模式。中国心脏衰竭杂志。2018;11(7):004926。https://doi.org/10.1161/CIRCHEARTFAILURE.118.004926.
金浩杰,吕斌,Nehus EJ,金茂茂。估计观察性研究中潜在亚组的异质治疗效果。统计地中海。2019;38(3):339 - 53。
Nielsen AM, Hestbaek L, Vach W, Kent P, Kongsted A.潜在分类分析得出的下腰痛患者亚组——他们有预后能力吗?中华医学杂志。2017;18(1):345。https://doi.org/10.1186/s12891-017-1708-9.
Nielsen AM, Kent P, Hestbaek L, Vach W, Kongsted a .使用潜在分类分析识别患者亚组:我们应该使用单阶段还是两阶段方法?采用一组腰痛患者的方法学研究。BMC骨骼肌紊乱。2017;18(1):57。https://doi.org/10.1186/s12891-017-1411-x.
de Ruigh EL, Bouwmeester S, Popma A, Vermeiren RRJM, van Domburgh L, Jansen LMC。利用生物-心理-社会模型来识别在实践中具有不同再犯罪风险的被拘留青少年的亚群体:潜在阶层回归分析方法。儿童青少年精神病学治疗健康。2021;15(1):33。https://doi.org/10.1186/s13034-021-00379-1.
治疗效果异质性的潜在等级混合模型。贝叶斯肛门。2017;12(3):831 - 54。https://doi.org/10.1214/16-BA1022.
Spilt JL, kot JM, Lier PA。它对谁有效?以学校为基础的普遍预防计划的效果的亚组差异。Prev Sci。2013;14:479 - 88。https://doi.org/10.1007/s11121-012-0329-7.
Willke RJ,郑铮,Subedi P, Althin R, Mullins CD.从治疗效果异质性的概念、理论和证据到方法途径:入门。中华医学杂志。2012;12(1):185。https://doi.org/10.1186/1471-2288-12-185.
Woo JMP, Simanek A, O 'Brien KM, Parks C, Gaston S, Auer PL, Konkel RH, Jackson CL, Meier HCS, Sandler DP。早期生活创伤和乳腺癌的潜在分类模型。流行病学接受发表。https://doi.org/10.1097/EDE.0000000000001507.
张卓,Abarda A,承包商AA,王杰,Dayton CM。用潜在分类分析探讨临床试验的异质性。Ann Transl Med. 2018;6(7)。https://doi.org/10.21037/atm.2018.01.24.
Connors AF, Speroff T, Dawson NV, Thomas C, Harrell FE, Wagner D, Desbiens N, Goldman L, Wu AW, Califf RM,等。右心导管在危重期患者初期护理中的效果。中华医学会杂志1996;276(11):889-97。
Bray BC, Lanza ST, Tan X.消除潜在类别分析分类分析方法中的偏见。结构方程模型。2015;22(1):1 - 11。https://doi.org/10.1080/10705511.2014.935265.
在未观察到的地层中,当处理状态可忽略时的平均因果效应的识别和估计。经济学启2020;39(10):1014 - 41。https://doi.org/10.1080/07474938.2020.1735748.
哈维兰AM,纳金DS。基于群体轨迹模型的因果推论。心理测量学。2005;70(3):557 - 8。
Haviland A, Nagin DS, Rosenbaum PR, Tremblay RE.结合基于群体的轨迹建模和倾向评分匹配在非实验纵向数据中的因果推论。Dev Psychol。2008;44(2):422。
Kent P, Jensen RK, Kongsted A.在mri, sms或临床数据中寻找亚群的三种聚类方法的比较:Spss两步聚类分析,潜在黄金和snob。中华医学杂志。2014;14(1):113。https://doi.org/10.1186/1471-2288-14-113.
潜在类别分析:预防和治疗中亚群分析的另一种视角。Prev Sci。2013;14(2):157 - 68。https://doi.org/10.1007/s11121-011-0201-1.
兰扎ST,谭X,布雷BC。具有远端结果的潜在类分析:一种灵活的基于模型的方法。结构方程建模:多学科学报。2013;20(1):1 - 26。https://doi.org/10.1080/10705511.2013.742377.
Suk Y, Kim J-S, Kang H.混合机器学习方法和有限混合模型估计潜在类异质处理效果。中国科学(d辑:自然科学版);
Anandkumar A, Ge R, Hsu D, Kakade SM, Telgarsky M.学习潜变量模型的张量分解。J Mach Learn Res. 2014; 15:2773-832。
李晓燕,李晓燕,李晓燕。基于深度潜变量模型的因果效应推理。Red Hook: Curran Associates Inc.;2017.6446 - 56页。
库尔兹,洛杉矶哈特菲尔德。用计数混合回归模型识别和解释卫生保健利用数据中的亚群。统计地中海。2019;38(22):4423 - 35。https://doi.org/10.1002/sim.8307.
Bartolucci F, Grilli L, Pieroni L.估计动态因果影响与未观察混杂:逆概率加权估计的潜在类版本。技术报告。德国:慕尼黑大学图书馆;2012.
Bartolucci F, Grilli L, Pieroni L.估计顺序治疗的因果影响的逆概率加权:处理未观察到的混杂的潜在类别扩展。意大利统计学会第46届科学会议。罗马;2012.ISBN 978-88-6129-882-8。https://www.sis-statistica.it/index.php?p=3985.
Kim J-S, Steiner PM, Lim W-C。多层数据因果推理的混合建模方法。入选:Harring JR, Stapleton LM, Beretvas SN,编辑。教育研究多层次建模的进展:解决现实应用中发现的实际问题。夏洛特:信息时代出版公司;2016.335 - 59页。
Hoeppner BB, Goodwin MS, Velicer WF, Mooney ME, Hatsukami DK。检测大幅减少香烟后每日吸烟的纵向模式。成瘾行为。2008;33(5):623 - 39。https://doi.org/10.1016/j.addbeh.2007.11.005.
纵向数据的贝叶斯非参数潜类模型。统计方法Med Res. 2020;29(11): 3381-95。https://doi.org/10.1177/0962280220928384.
Lin H, McCulloch CE, Turnbull BW, Slate EH, Clark LC。一个潜在类混合模型,用于分析生物标志物轨迹与不定期的观测。统计地中海。2000;19(10):1303 - 18。
麦卡洛克CE,林H,石板EH,特恩布尔BW。用潜类混合模型发现亚种群结构。统计医学。2002;21(3):417 - 29。https://doi.org/10.1002/sim.1027.
古德曼。当某些变量不可观察时,对定性变量系统的分析。第一部分改进的潜结构方法。1974;79(5):1179-259。
古德曼。把个人分配给潜在的阶级。Sociol Methodol。2007;37(1):22页。https://doi.org/10.1111/j.1467-9531.2007.00184.x.
Hagenaars JA, McCutcheon AL.应用潜在类分析。剑桥大学出版社;2002.https://doi.org/10.1017/CBO9780511499531.
美国公众对不符合行为容忍度的潜在阶级分析。中华人民共和国司法论文集1985;49(4):474-88。https://doi.org/10.1086/268945.
潜在阶级分析,第64卷。圣人》1987。https://doi.org/10.4135/9781412984713.
Vermunt JK, Magidson J. In: Van der Ark LA, Croon MA, Sijtsma K编辑。带有分类指标的因子分析:传统方法与潜在类别方法的比较。Mahwah: Lawrence Erlbaum Associates Publishers;2005.41 - 62页。
弗莱利C,拉斐尔AE。基于模型的聚类、判别分析和密度估计。中华统计杂志,2002;32(4):369 - 369。https://doi.org/10.1198/016214502760047131.
McLachlan GJ, Peel D.有限混合模型。纽约:威利;2004.
有限混合模型的医学应用。柏林,海德堡:施普林格;2009.https://doi.org/10.1007/978-3-540-68651-4.
Bakk Z, Tekle FB, Vermunt JK。使用偏差调整三步法估计潜在类成员和外部变量之间的关联。中华统计杂志,2013;43(1):272-311。https://doi.org/10.1177/0081175012470644.
Dias J, Vermunt JK。用于基于模型的集群的基于引导的聚合分类器。第一版Stat。2008;23(4):643 - 59。https://doi.org/10.1007/s00180-007-0103-7.
引用本文:Bolck A, Croon M, Hagenaars J.用分类变量估计潜在结构模型:一步与三步估计。政治肛门。2004;12(1):3-27。https://doi.org/10.1093/pan/mph001.
Vermunt JK。带有协变量的潜在类建模:两种改进的三步方法。政治肛门。2010;18(4):450 - 69。https://doi.org/10.1093/pan/mpq025.
潜在类成员与外部变量的关系:综述。中国数学与心理学报,2017;38(2):369 - 369。https://doi.org/10.1111/bmsp.12227.
Masyn客。分级多指标多原因建模潜在类分析中的测量不变性和差异项功能。结构方程模型。2017;24(2):180-97。https://doi.org/10.1080/10705511.2016.1254049.
Vermunt JK, Magidson J.如何在存在测量不变性或差异项目功能的情况下执行三步潜在类分析。结构方程模型,多磁盘,2021;28(3):356-64。https://doi.org/10.1080/10705511.2020.1818084.
Carvalho C, Feller A, Murray J, Woody S, Yeager D.观察性研究中治疗效果变化的评估:来自数据挑战的结果。观察钉。2019;5(1):21-35。
Dorie V, Hill J, Shalit U, Scott M, cerone D.因果推理的自动和自己动手的方法:从数据分析比赛中学到的教训。统计科学。2019年,34(1):43 - 68。https://doi.org/10.1214/18-STS667.
数据科学时代的统计建模。观察钉。2021;7(1):217 - 28。
Dias JG, Vermunt JK。潜在类分析中测量分类不确定度的Bootstrap方法。正确的做法:里兹A,维奇M,编辑。Compstat 2006 -计算统计学论文集。海德堡:Physica-Verlag高清;2006.31-41页。https://doi.org/10.1007/978-3-7908-1709-6_3.
Bang H, Robins JM。缺失数据和因果推理模型的双鲁棒估计。生物识别技术,2005,61(4):962 - 73。https://doi.org/10.1111/j.1541-0420.2005.00377.x.
格林安,奎因KM。增广逆倾向加权估计量的介绍。政治肛门。2010;18(1):36-56。https://doi.org/10.1093/pan/mpp036.
Robins JM, Rotnitzky A, Zhao LP。当某些回归量不总是被观察到时的回归系数估计。中华统计杂志1994;89(427):846-66。
R核心团队。R:统计计算语言和环境。维也纳:R统计计算基金会;2020.https://www.R-project.org/.
Nylund-Gibson K, Masyn KE。协变量和混合建模:模拟研究的结果,探索错误指定的效果对类枚举的影响。结构方程模型。2016;23(6):782-97。https://doi.org/10.1080/10705511.2016.1221313.
Nylund-Gibson K, Grimm RP, Masyn KE。从潜在类别的预测:在混合模型中包括远端结果的不同方法的演示。J. 2019;26(6): 967-85。https://doi.org/10.1080/10705511.2019.1590146.
统计模型辨识的新视角。见:赤池裕久论文选集。施普林格;1974.215 - 22页。https://doi.org/10.1007/978-1-4612-1694-0_16.
估算模型的尺寸。安Stat。1978;6(2):461 - 4。https://doi.org/10.1214/aos/1176344136.
韦勒BE, Bowen NK,福伯特SJ。潜在类分析:最佳实践指南。中华精神病学杂志,2020;46(4):287-311。https://doi.org/10.1177/0095798420930932.
鲁宾DB。设计与因果效应观察研究分析的对比:与随机试验设计的相似之处。统计地中海。2007;(1):26日20-36。https://doi.org/10.1002/sim.2739.
罗森鲍姆公关,鲁宾DB。倾向评分在因果效应观察研究中的中心作用。生物统计学。1983;70(1):41-55。https://doi.org/10.1093/biomet/70.1.41.
通过倾向评分来估计因果治疗效果的分层和加权:一项比较研究。统计医学。2004;23(19):2937 - 60。https://doi.org/10.1002/sim.1903.
基于模型的直接调整。中华统计杂志1987;32(3):387-94。
康JD,谢弗JL。去神秘化双稳健性:从不完全数据估计总体均值的替代策略的比较。统计科学。2007;22(4):523 - 39。
奥斯丁的电脑。介绍在观察性研究中减少混杂影响的倾向评分方法。多元行为研究。2011;46(3):399-24。https://doi.org/10.1080/00273171.2011.568786.
Imai K, Ratkovic M.协变量平衡倾向评分。J R统计系统B(统计方法)。2014, 76(1): 243 - 63。https://doi.org/10.1111/rssb.12027.
抗孕药适用于一些常用的医学应用逻辑模型。生物识别技术。1982;485 - 98。DOIurlhttps: / / doi.org/10.2307/2530463。
Petersen ML, Porter KE, Gruber S, Wang Y, Van Der Laan MJ。诊断并应对积极假设中的违规行为。统计方法医学杂志2012;21(1):31-54。
Stürmer T,韦伯斯特-克拉克M, Lund JL, Wyss R,埃利斯AR, Lunt M,罗斯曼KJ,格林RJ。减少治疗效果估计方差和偏差的倾向评分加权和校正策略:模拟研究。中华流行病学杂志2021;190(8):1659-70。https://doi.org/10.1093/aje/kwab041.
邹海峰,王晓燕。基于弹性网的正则化和变量选择。J R统计系统B(统计方法)。2005年,67(2):301 - 20。
Hoerl AE, Kennard RW。岭回归:非正交问题的有偏估计。技术计量学。1970;12(1):55 - 67。https://doi.org/10.1080/00401706.1970.10488634.
通过LASSO回归收缩和选择:一个回顾。J R统计系统B(统计方法)。2011, 73(3): 273 - 82。https://doi.org/10.1111/j.1467-9868.2011.00771.x.
王晓东,王晓东,王晓东。广义线性模型坐标下降的正则化路径。统计软件,2010;33(1):1 - 22。
邀请评论:实践中的积极。美国流行病学杂志,2010;171(6):674-7。https://doi.org/10.1093/aje/kwp436.
班丁-罗氏K, Miglioretti DL, Zeger SL, Rathouz PJ。多个离散结果的潜在变量回归。中华统计杂志,1997;32(4):369 - 369。
Vansteelandt S, Goetghebeur E, Kenward MG, Molenberghs G.无知和不确定区域在灵敏度分析中的推理工具。Stat罪。2006;953 - 79。
刘勇,杨建军。项目反应理论中潜在变量分数的区间估计。教育与行为统计。2018;43(3):259-85。
杨建军,Hansen M,蔡磊。项目反应理论量表得分的不确定来源特征。中国心理学报。2012;32(2):369 - 369。
Bakk Z, Oberski DL, Vermunt JK。将潜在的类成员关系与连续的远端结果相关:改进ltb方法和修改的三步实现。结构方程模型。2016;23(2):278-89。https://doi.org/10.1080/10705511.2015.1049698.
Helmreich JE, Pruzek RM。PSAgraphics:支持倾向评分分析的R包。统计软件。2009;29(6):1-23。
Cefalu M, Ridgeway G, McCaffrey D, Morral A, Griffin BA, burgtte L. Twang:非等价群的加权和分析工具。R包版本2.0。2021.https://CRAN.R-project.org/package=twang.
Linzer D.A, Lewis JB, et al. poLCA:一个用于多变量潜在类分析的R包。统计软件杂志。2011年,42(10):1至29。https://doi.org/10.18637/jss.v042.i10.
代顿CM,麦克雷迪GB。相伴变量潜在类别模型。中华统计杂志1988;83(401):173-8。https://doi.org/10.1080/01621459.1988.10478584.
测量的传统智慧:结构方程的视角。Psychol公牛。1991;110(2):305。
Vermunt JK, Magidson J.潜金5.0技术指南:基本、高级和语法。统计创新公司:贝尔蒙特;2013.
Vermunt J, Magidson J. Latent GOLD 6.0升级手册。统计创新公司;2020.
李晓明,李晓明,徐松。潜在类别分析中的因果推理。中华医学杂志。2013;20(3):361-83。https://doi.org/10.1080/10705511.2013.797816.
云思FJ,波维斯S,莫尔斯F,佛蒙特JK。倾向逆加权与潜在类分析的三步新方法。Adv数据分析分类。2021。https://doi.org/10.1007/s11634-021-00456-5.
Bray BC, Dziak JJ, Patrick ME, Lanza ST.具有潜在类别暴露的反倾向评分加权:估计报告的酒精使用原因对16年后问题酒精使用的因果影响。Prev Sci。2019;20(3):394 - 406。https://doi.org/10.1007/s11121-018-0883-8.
Schuler MS, Leoutsakos JS, Stuart EA.在估计潜在分级对远端结果的影响时解决混杂问题。卫生服务结果研究方法。2014;14:232-54。https://doi.org/10.1007/s10742-014-0122-0.
巴克Z,佛蒙特JK。具有连续远端结果的逐步潜在分类建模的稳健性。结构方程模型。2016;23(1):20-31。https://doi.org/10.1080/10705511.2014.955104.
Asparouhov T, Muthén B.混合建模中的辅助变量:使用Mplus的三步方法。结构方程模型。2014;21(3):329-41。https://doi.org/10.1080/10705511.2014.915181.
Mayer A, Zimmermann J, Hoyer J, Salzer S, Wiltink J, Leibing E, Leichsenring F.基于潜在变量结构方程模型的治疗效果的个体间差异:一个effectl教程。结构方程模型multidisc J. 2019;1-19。https://doi.org/10.1080/10705511.2019.1671196.
机器学习估计异质处理效果的交叉拟合和平均。arXiv预印本arXiv: 2007.02852.2020.
Grün B, Leisch F. FlexMix版本2:带有伴随变量和变参数和常参数的有限混合。统计软件。2008;28(4):1-35。https://doi.org/10.18637/jss.v028.i04.
Jakobsen JC, glud C, Wetterslev J, Winkel P.在随机临床试验中,何时以及如何使用多重归入法处理缺失数据-一个带有流程图的实用指南。中华医学杂志。2017;17(1):162。https://doi.org/10.1186/s12874-017-0442-1.
Bartolucci F, Bacci S, Gnaldi M. MultiLCIRT:多维潜在类项响应模型的R包。计算统计数据分析。2014;71:971-85。https://doi.org/10.1016/j.csda.2013.05.018.
Gemma M, Pennoni F, Braga M.研究结直肠手术术后增强恢复(eras®)的核心项目:一个具有潜在变量的因果模型。世界医学杂志,2021;45(4):928-39。https://doi.org/10.1007/s00268-020-05940-1.
McLachlan GJ, Lee SX, Rathnayake SI。有限混合模型。Ann Rev Stat app 2019;6(1): 355-78。https://doi.org/10.1146/annurev-statistics-031017-100325.
H老师等。关于分布的混合。数学学报,1960;31(1):55-73。https://doi.org/10.1214/aoms/1177705987.
奥斯丁的电脑。评估广义倾向评分在估计定量或连续暴露对二元结果的影响方面的表现。统计地中海。2018;37(11):1874 - 94。https://doi.org/10.1002/sim.7615.
Bartolucci F, Pennoni F, Vittadini G.观察性纵向研究中多重治疗比较的因果潜马尔可夫模型。中国教育与行为杂志2016;41(2):146-79。https://doi.org/10.3102/1076998615622234.
Joffe MM, Yang WP, Feldman HI。因果推理中的选择性可忽略性假设。国际生物化学杂志,2010;6(2)。
Pal N.R, Pal K, Keller JM, Bezdek JC。一种可能的模糊c均值聚类算法。电子学报。2005;13(4):517-30。https://doi.org/10.1109/TFUZZ.2004.840099.
确认
我们感谢编辑和两位匿名审稿人为提高稿件质量提出的详细和有益的建议。
资金
陆文威获德国根特大学博士后奖学金BOF. pdo .2020.0045.01专项研究基金资助。
作者信息
作者和联系
贡献
两位作者对这份手稿贡献相同。
相应的作者
道德声明
伦理批准和同意参与
不适用。
同意出版
不适用。
相互竞争的利益
作者声明他们没有竞争利益。
额外的信息
出版商的注意
188博金宝app网施普林格自然对出版的地图和机构附属的管辖权要求保持中立。
补充信息
额外的文件1:
补充材料。
权利和权限
开放获取本文遵循创作共用署名4.0国际许可协议(Creative Commons Attribution 4.0 International License),该协议允许在任何媒体或格式中使用、分享、改编、分发和复制,只要您给予原作者和来源适当的署名,提供创作共用许可协议的链接,并说明是否有更改。本文中的图片或其他第三方材料包含在文章的创作共用许可中,除非在材料的信用额度中另有说明。如果材料不包含在文章的创作共用许可中,并且您的预期用途不被法律法规允许或超出了允许的用途,您将需要直接从版权所有者那里获得许可。欲查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献放弃书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信用额度中另有说明。
关于这篇文章
引用这篇文章
Loh, w.w., Kim, JS。评估潜在亚群效应分析中分类不确定性的敏感性。BMC医学治疗方法22247(2022)。https://doi.org/10.1186/s12874-022-01720-8
收到了:
接受:
发表:
DOI:https://doi.org/10.1186/s12874-022-01720-8
关键字
- 因果推论
- 有限混合模型
- 潜在类别分析
- 参数引导
- 摄动置信区间
- 敏感性分析
- 亚组平均治疗效果(ATE)
AMS主题分类
- 62年d20开头
- 62年h30
- 62年p25