跳到主要内容gydF4y2Ba

两阶段匹配调整间接比较gydF4y2Ba

摘要gydF4y2Ba

背景gydF4y2Ba

锚定协变量调整的间接比较可以在相关治疗之间没有正面试验、研究有共同的比较器臂以及患者水平的数据限制的情况下为报销决策提供依据。基于倾向评分加权的匹配调整间接比较(MAIC)是卫生技术评价中应用最广泛的协变量调整间接比较方法。MAIC的精度较差,当加权后有效样本量较小时效率较低。gydF4y2Ba

方法gydF4y2Ba

提出了对MAIC的模块化扩展,称为两阶段匹配调整间接比较(2SMAIC)。这使用了两个参数模型。一种是利用个体患者数据(IPD)估计研究中的治疗分配机制,另一种是估计试验分配机制。第一个模型产生的逆概率权重与第二个模型产生的概率权重相结合。由此得出的权重旨在平衡各治疗组之间和各研究之间的协变量。一项模拟研究在两个随机试验中进行的间接比较中提供了原理证明。然而,2SMAIC可以应用于IPD试验是观察性的情况,通过在治疗分配模型中包括潜在的混杂因素。仿真研究还首次探讨了权值截断与MAIC相结合的应用。gydF4y2Ba

结果gydF4y2Ba

尽管在IPD试验中实施了随机化并了解了真正的治疗分配机制,但2SMAIC在所有情况下都比MAIC提高了精度和效率,同时保持了相似的低偏倚水平。当IPD试验的样本量较低时,两阶段方法是有效的,因为它控制了各研究组之间预后基线协变量的机会不平衡。当试验目标人群之间的重叠较低且权重的极值较高时,这种方法就不那么有效。在这些情况下,截断会导致大量的精度和效率的提高,但会引起相当大的偏差。两阶段方法与截断相结合产生了最高的精度和效率改进。gydF4y2Ba

结论gydF4y2Ba

通过调整IPD试验中预后协变量的经验不平衡,MAIC的两阶段方法相对于标准方法可以提高精度和效率。进一步的模块可以被合并,以减少额外的方差或解释IPD试验中的缺失和不符合。gydF4y2Ba

同行评审报告gydF4y2Ba

背景gydF4y2Ba

在许多国家,卫生技术评估(HTA)涉及新疗法是否应由公共卫生保健系统报销[gydF4y2Ba1gydF4y2Ba].这通常需要估计在面对面试验中尚未直接比较的干预措施的相对效果[gydF4y2Ba2gydF4y2Ba].假设有两种有效的治疗方法gydF4y2Ba一个gydF4y2Ba而且gydF4y2BaBgydF4y2Ba,在同一项研究中没有评估,但已与比较器进行了对比gydF4y2BaCgydF4y2Ba在不同的研究中。在这种情况下,需要对相关治疗效果估计进行间接比较。分析是这样说的gydF4y2Ba锚定gydF4y2Ba通过共同比较器gydF4y2BaCgydF4y2Ba.gydF4y2Ba

HTA的典型情况是,制药公司从自己的研究比较中获得个人患者数据(IPD)gydF4y2Ba一个gydF4y2Ba与gydF4y2BaCgydF4y2Ba,我们称其为gydF4y2Ba指数gydF4y2Ba试验,但只公布了另一项比较研究的总水平数据(ALD)gydF4y2BaBgydF4y2Ba与gydF4y2BaCgydF4y2Ba,我们称之为gydF4y2Ba竞争对手gydF4y2Ba审判。在这个两项研究的场景中,效果测量修饰词(简称效果修饰词)的交叉试验不平衡,进行了标准的间接治疗比较[gydF4y2Ba3.gydF4y2Ba]易受偏见影响的[gydF4y2Ba4gydF4y2Ba].新的协变量调整间接比较方法已被引入,以解释这些不平衡,并为比较提供平衡[gydF4y2Ba5gydF4y2Ba,gydF4y2Ba6gydF4y2Ba,gydF4y2Ba7gydF4y2Ba,gydF4y2Ba8gydF4y2Ba,gydF4y2Ba9gydF4y2Ba].gydF4y2Ba

最流行的方法[gydF4y2Ba10gydF4y2Ba]在同行评审的出版物和提交的报销申请中采用匹配调整间接比较(MAIC) [gydF4y2Ba11gydF4y2Ba,gydF4y2Ba12gydF4y2Ba,gydF4y2Ba13gydF4y2Ba].MAIC对指标试验中的受试者进行加权,以创建一个相对于竞争对手试验具有平衡矩的“伪样本”。Signorovitch等提出的MAIC标准公式[gydF4y2Ba11gydF4y2Ba]使用矩的方法来估计逻辑回归,它对试验分配机制建模。权重来自拟合模型,表示IPD中受试者分配到竞争对手试验的几率,条件是选择基线协变量。gydF4y2Ba

在没有假设失败的情况下,MAIC在模拟研究中得出了无偏倚的处理效果估计[gydF4y2Ba7gydF4y2Ba,gydF4y2Ba14gydF4y2Ba,gydF4y2Ba15gydF4y2Ba,gydF4y2Ba16gydF4y2Ba,gydF4y2Ba17gydF4y2Ba,gydF4y2Ba18gydF4y2Ba,gydF4y2Ba19gydF4y2Ba,gydF4y2Ba20.gydF4y2Ba].然而,人们对其低效率和不稳定性存在一些担忧,特别是在协变量重叠较差且加权后有效样本量(ESSs)较小的情况下[gydF4y2Ba21gydF4y2Ba].这些情况在卫生技术评估中普遍存在[gydF4y2Ba10gydF4y2Ba].在这种情况下,加权方法容易受到少数具有极端权重的受试者的过度影响,而且容易受到精度差的影响。一个相关的问题是,在没有共同协变量支持的情况下,可能不存在可行的数值解[gydF4y2Ba21gydF4y2Ba,gydF4y2Ba22gydF4y2Ba].在重叠较弱的情况下,基于结果期望建模的方法比MAIC具有更高的精度和效率[gydF4y2Ba21gydF4y2Ba,gydF4y2Ba23gydF4y2Ba,gydF4y2Ba24gydF4y2Ba,gydF4y2Ba25gydF4y2Ba],但易于外推,这可能导致在模型错定的情况下产生严重的偏差[gydF4y2Ba26gydF4y2Ba,gydF4y2Ba27gydF4y2Ba].gydF4y2Ba

因此,MAIC的修改,寻求最大的精度已经提出。另一种实现使用熵平衡估计权重[gydF4y2Ba17gydF4y2Ba,gydF4y2Ba28gydF4y2Ba].该建议类似于矩的标准方法,附加的约束是权重尽可能接近单位权重,这可能会惩罚极端权重方案。虽然这种方法具有吸引人的计算特性,Phillippo等人已经证明了它在数学上等同于矩的标准方法[gydF4y2Ba29gydF4y2Ba].gydF4y2Ba

最近,Jackson等人开发了一种独特的权重估计程序,该程序满足传统的矩量方法,同时明确最大化ESS [gydF4y2Ba22gydF4y2Ba].这转化为最小化权重的分散,更稳定的权重以诱导偏差为代价提高精度。gydF4y2Ba

限制极端权重的不适当影响的其他方法包括截断或限制权重。这些在调查抽样中很常见[gydF4y2Ba30.gydF4y2Ba]以及在许多倾向评分设置中[gydF4y2Ba31gydF4y2Ba,gydF4y2Ba32gydF4y2Ba但尚未与MAIC一起具体调查。同样,从偏差-方差的角度来看,需要进行明确的权衡。更低的方差是以牺牲平衡和接受偏见为代价的[gydF4y2Ba33gydF4y2Ba,gydF4y2Ba34gydF4y2Ba].权重截断的局限性在于它改变了目标群体或估计和定义,并且它需要对截断阈值进行任意的临时决定。gydF4y2Ba

为了提高效率,我提出了一个模块化的扩展MAIC使用两个参数模型。一个估计指标研究中的治疗分配机制,另一个估计试验分配机制。第一个模型产生处理权重的逆概率,该概率与第二个模型产生的权重相结合。我称之为这种方法gydF4y2Ba两阶段匹配调整间接比较gydF4y2Ba(2 smaic)。gydF4y2Ba

在锚定的情况下,MAIC的常规版本依赖于指数试验中的随机化。在这种情况下,治疗分配机制(受试者之间治疗的真实条件概率)通常是已知的。此外,随机化确保了在期望上没有混淆。因此,在本研究中对治疗分配机制进行建模似乎是违反直觉的。然而,这一额外步骤有利于控制预后基线协变量的有限样本失衡。这些不平衡往往是由于偶然性而产生的,对它们的纠正会导致效率的提高。gydF4y2Ba

2SMAIC的一个优点是,由于纳入了治疗分配模型,它也适用于观察性指标研究。在这种情况下,不利用研究内随机化,必须通过在治疗分配模型中包括治疗-结果关联的潜在混杂因素来解决对内部有效性的担忧。试验分配权重的估计程序不一定需要采用Signorovitch等人的方法。[gydF4y2Ba11gydF4y2Ba],并可采用其他方法[gydF4y2Ba16gydF4y2Ba,gydF4y2Ba22gydF4y2Ba].可以加入更多的模块以弥补缺失[gydF4y2Ba35gydF4y2Ba]及不遵守[gydF4y2Ba36gydF4y2Ba],例如在指标试验中退出或治疗切换。gydF4y2Ba

我进行了一个概念证明模拟研究,以检验2SMAIC相对于标准MAIC的有限样本性能,当指标研究是随机对照研究时。两阶段方法在不引入偏差的情况下提高了MAIC的精度和效率。结果与前人对倾向评分估计器效率的研究一致[gydF4y2Ba37gydF4y2Ba,gydF4y2Ba38gydF4y2Ba].最后,首次探讨了权值截断与MAIC相结合的应用。实现方法的示例代码gydF4y2BaRgydF4y2Ba是否在附加文件中提供gydF4y2Ba1gydF4y2Ba.gydF4y2Ba

方法gydF4y2Ba

上下文和数据结构gydF4y2Ba

我们关注以下设置,这在提交给HTA机构时很常见。让gydF4y2Ba年代gydF4y2Ba而且gydF4y2BaTgydF4y2Ba分别标明指定研究和指定治疗的指标。有两项独立的研究,招募了不同的参与者,现在已经完成。指数研究(gydF4y2Ba年代gydF4y2Ba=1)比较积极治疗gydF4y2Ba一个gydF4y2Ba(gydF4y2BaTgydF4y2Ba= 1)与gydF4y2BaCgydF4y2Ba(gydF4y2BaTgydF4y2Ba=0),例如护理标准或安慰剂。竞争对手研究(gydF4y2Ba年代gydF4y2Ba=2)评价积极治疗gydF4y2BaBgydF4y2Ba(gydF4y2BaTgydF4y2Ba= 2)与gydF4y2BaCgydF4y2Ba(gydF4y2BaTgydF4y2Ba= 0)。协变量调整的间接比较,如MAIC进行治疗比较gydF4y2Ba年代gydF4y2Ba=2样本,隐含地假定具有政策利益。我们问自己一个问题:治疗的边际效果是什么gydF4y2Ba一个gydF4y2Ba与gydF4y2BaBgydF4y2Ba在进行的随机对照试验中是否比较过这些治疗方法gydF4y2Ba年代gydF4y2Ba= 2 ?gydF4y2Ba

边际处理效果为gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaBgydF4y2Ba在线性预测器(例如,均值差、对数比值比或对数风险比)尺度上的估计为:gydF4y2Ba

$ $ \帽子{\三角洲}_{12}^{(2)}={\三角洲}_{10}\帽子^{(2)}-{\三角洲}_{20}\帽子^ {(2)},$ $gydF4y2Ba
(1)gydF4y2Ba

在哪里gydF4y2Ba\(\hat {\Delta}_{10}^{(2)}\)gydF4y2Ba是对假设的边际治疗效果的估计吗gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba在竞争对手的研究样本中,和gydF4y2Ba\(\hat {\Delta}_{20}^{(2)}\)gydF4y2Ba边际治疗效果的估计是多少gydF4y2BaBgydF4y2Bavs。gydF4y2BaCgydF4y2Ba在竞争对手研究样本中。MAIC使用加权来传输边缘的推论gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba治疗效果gydF4y2Ba年代gydF4y2Ba= 1,gydF4y2Ba年代gydF4y2Ba= 2。估计gydF4y2Ba\(\hat {\Delta}_{10}^{(2)}\)gydF4y2Ba,然后输入到Eq中。gydF4y2Ba1gydF4y2Ba.由于试验内相对效应估计假定是统计上独立的,因此对其方差求和以估计的边际治疗效果的方差gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaBgydF4y2Ba.gydF4y2Ba

提交报销证据的制造商可以访问个人级别的数据gydF4y2Ba\ (\ mathcal {D} _ {AC} = ({\ boldsymbol {x} \ boldsymbol {t} \ boldsymbol {y}}) \)gydF4y2Ba关于其试验参与者的协变量、治疗和结果。在这里,gydF4y2BaxgydF4y2Ba治疗前基线协变量(如共病、年龄、性别)的矩阵是否大小gydF4y2BangydF4y2Ba×gydF4y2BakgydF4y2Ba,在那里gydF4y2BangydF4y2Ba研究样本和受试者的总数是多少gydF4y2BakgydF4y2Ba是协变量的个数。行向量gydF4y2BaxgydF4y2Ba我gydF4y2Ba=(gydF4y2BaxgydF4y2Ba我gydF4y2Ba,1gydF4y2Ba,gydF4y2BaxgydF4y2Ba我gydF4y2Ba, 2gydF4y2Ba、……gydF4y2BaxgydF4y2Ba1,gydF4y2BakgydF4y2Ba)gydF4y2BakgydF4y2Ba为每个参与者记录协变量gydF4y2Ba我gydF4y2Ba= 1,……gydF4y2BangydF4y2Ba.我们让gydF4y2BaygydF4y2Ba=(gydF4y2BaygydF4y2Ba1gydF4y2Ba,gydF4y2BaygydF4y2Ba2gydF4y2Ba、……gydF4y2BaygydF4y2BangydF4y2Ba)表示感兴趣的临床结果的向量和gydF4y2BatgydF4y2Ba=(gydF4y2BatgydF4y2Ba1gydF4y2Ba,gydF4y2BatgydF4y2Ba2gydF4y2Ba、……gydF4y2BatgydF4y2BangydF4y2Ba)表示二进制处理指示向量。我们假定随访无损失或协变量、治疗和结果数据缺失gydF4y2Ba\ (\ mathcal {D} _ {AC} \)gydF4y2Ba.gydF4y2Ba

我们认为所有基线协变量都是临床结果的预后,并从中选择一个子集,gydF4y2BazgydF4y2Ba⊆gydF4y2BaxgydF4y2Ba,作为边际效应修饰语gydF4y2Ba一个gydF4y2Ba关于gydF4y2BaCgydF4y2Ba在线性预测量表上,用一个行向量gydF4y2BazgydF4y2Ba我gydF4y2Ba为每个病人记录gydF4y2Ba我gydF4y2Ba.在没有随机化的情况下,变量gydF4y2BaxgydF4y2Ba会在指数研究中引起治疗组之间的混淆(内部效度偏倚)。另一方面,交叉试验中的变量不平衡gydF4y2BazgydF4y2Ba对竞争对手研究样本诱导外部效度偏差。gydF4y2Ba

无论是提交证据的制造商还是评估证据的HTA机构都不能访问竞争对手试验的IPD。我们让gydF4y2Ba公元前\ (\ mathcal {D} _ {} = [\ boldsymbol{\θ}_ {\ boldsymbol {x}},{\三角洲}_{20}\帽子^ {(2)},{V} \帽子帽子(\{\三角洲}_ {20}^ {(2)}))\)gydF4y2Ba代表本研究中可用的已发表ALD。没有患者水平的协变量、治疗或结果可用。在这里,gydF4y2BaθgydF4y2BaxgydF4y2Ba表示协变量的均值或比例向量;尽管高阶矩,如方差,也可能可用。一个假设是,竞争对手研究已经测量了足够丰富的基线协变量集。也就是对子集的总结gydF4y2BaθgydF4y2BazgydF4y2Ba⊆gydF4y2BaθgydF4y2BaxgydF4y2Ba在研究出版物的基线特征表中描述了边际效应的协变量。gydF4y2Ba

还有一个内部有效的估计gydF4y2Ba\(\hat {\Delta}_{20}^{(2)}\)gydF4y2Ba的边际处理效果gydF4y2BaBgydF4y2Bavs。gydF4y2BaCgydF4y2Ba在竞争对手的研究样本,并估计gydF4y2Ba\(\hat {V}(\hat {\Delta}_{20}^{(2)})\)gydF4y2Ba它的方差。这些结果要么直接在出版物中报道,要么假设竞争研究是一个良好的随机对照试验,从文献中粗略的汇总结果中得出。gydF4y2Ba

匹配调整的间接比较gydF4y2Ba

在MAIC中,对指标研究中的IPD进行加权,以使所选协变量的矩与竞争对手研究中发表的矩相平衡。重量gydF4y2BawgydF4y2Ba我gydF4y2Ba每位参与者gydF4y2Ba我gydF4y2Ba在指标试验中,使用逻辑回归估计:gydF4y2Ba

$ $ \ ln (w_{我})= \ ln (w (\ boldsymbol {z} _{我}))=左\ ln \[\压裂{公关(S = 2 \ \ boldsymbol中期{z} _{我})}{1 -公关(S = 2 \ \ boldsymbol中期{z} _{我})}\右]= \ alpha_ {0} + \ boldsymbol {z} _{我}\ boldsymbol{\α}_ {\ boldsymbol {1}}, $ $gydF4y2Ba
(2)gydF4y2Ba

在哪里gydF4y2BaαgydF4y2Ba0gydF4y2Ba模型是否截距和gydF4y2BaαgydF4y2Ba1gydF4y2Ba是模型系数的向量。而权重的大多数应用,例如在观察性研究中控制混杂,构造“逆概率”权重gydF4y2Ba治疗gydF4y2Ba分配时,MAIC采用“概率加权”[gydF4y2Ba39gydF4y2Ba,gydF4y2Ba40gydF4y2Ba建立模型gydF4y2Ba试验gydF4y2Ba任务。重量gydF4y2BawgydF4y2Ba我gydF4y2Ba表示个体的条件概率gydF4y2Ba我gydF4y2Ba与协变量gydF4y2BazgydF4y2Ba我gydF4y2Ba,被选为边际效应修饰剂,被纳入竞争对手研究。或者,权重代表个体参与指数研究的逆条件概率。gydF4y2Ba

式中的逻辑回归参数。gydF4y2Ba2gydF4y2Ba由于无法获得竞争对手试验的IPD,无法使用最大似然估计等传统方法得出。Signorovitch等人建议使用矩的方法来加强研究之间的协变量平衡[gydF4y2Ba11gydF4y2Ba].在平衡之前,IPD协变量以竞争对手试验公布的均值或比例为中心。主题的居中协变量gydF4y2Ba我gydF4y2Ba在IPD中的定义为gydF4y2Baz \ (\ boldsymbol {} ^ {\ boldsymbol{*}} _{我}= \ boldsymbol {z} _{我}- \ boldsymbol{\θ}_ {\ boldsymbol {z}} \)gydF4y2Ba.gydF4y2Ba

权重估计涉及最小化目标函数:gydF4y2Ba

$ $ Q (\ boldsymbol{\α}_ {\ boldsymbol {1}}) = \ \ limits_总和{i = 1} ^ {n} \ exp \离开(\ boldsymbol {z} ^ {\ boldsymbol{*}} _{我}\ boldsymbol{\α}_ {\ boldsymbol{1}} \右),$ $gydF4y2Ba
(3)gydF4y2Ba

这个函数gydF4y2Ba问gydF4y2Ba(gydF4y2BaαgydF4y2Ba1gydF4y2Ba)是凸的[gydF4y2Ba11gydF4y2Ba],并且可以使用标准凸优化算法最小化[gydF4y2Ba41gydF4y2Ba].如果有足够的重叠,最小化得到唯一的有限解:gydF4y2Ba{\ \(\帽子boldsymbol{\α}}_ {\ boldsymbol {1}} = {argmin} \文本(Q (\ boldsymbol{\α}_ {\ boldsymbol {1}})) \)gydF4y2Ba.可行的解决方案不存在,如果所有的值观察到的协变量gydF4y2BazgydF4y2Ba是大于还是小于对应的元素gydF4y2BaθgydF4y2BazgydF4y2Ba[gydF4y2Ba22gydF4y2Ba].gydF4y2Ba

将Eq中的目标函数最小化后。gydF4y2Ba3.gydF4y2Ba,估计的重量为gydF4y2Ba我gydF4y2Ba- IPD的第th参与者为:gydF4y2Ba

$ $ \帽子{w} _{我}= \ exp (\ boldsymbol {z} ^ {\ boldsymbol{*}} _{我}\帽子{\ boldsymbol{\α}}_ {\ boldsymbol {1}}), $ $gydF4y2Ba
(4)gydF4y2Ba

估计的权重是相对的,也就是说任何成比例的权重都是同样有效的[gydF4y2Ba22gydF4y2Ba].加权降低了指标试验的ESS。加权后的近似ESS通常估计为gydF4y2Ba左(\ \(\总和_{我}^ {n} \帽子{w} _{我}\右)^{2}/ \总和_{我}^ {n} \帽子{w} _{我}^ {2}\)gydF4y2Ba[gydF4y2Ba5gydF4y2Ba,gydF4y2Ba42gydF4y2Ba].ESS的低值表明,少数权重不成比例的有影响力的参与者主导了重新加权的样本。gydF4y2Ba

因此,治疗的边际平均结果gydF4y2Ba一个gydF4y2Ba而且gydF4y2BaCgydF4y2Ba在竞争对手研究样本中(gydF4y2Ba年代gydF4y2Ba=2)为加权平均值:gydF4y2Ba

$ $ \帽子{\μ}^ {(2)}_ {t} = \压裂{\ sum_ {i = 1} ^ {n_ {t}} y_{我t} \帽子{w} _{我t}} {\ sum_ {i = 1} ^ {n_ {t}} \帽子{w} _{我t}}, $ $gydF4y2Ba
(5)gydF4y2Ba

在哪里gydF4y2BangydF4y2BatgydF4y2Ba表示分配到治疗的参与者数量gydF4y2BatgydF4y2Ba∈gydF4y2Ba{0,1},gydF4y2BaygydF4y2Ba我,不gydF4y2Ba代表受试者观察到的临床结果gydF4y2Ba我gydF4y2Ba在手臂上gydF4y2BatgydF4y2Ba,gydF4y2Ba\(\帽子{w} _{我t} \)gydF4y2Ba体重是否分配给患者gydF4y2Ba我gydF4y2Ba接受治疗gydF4y2BatgydF4y2Ba.对于二元结果,gydF4y2Ba\(\hat {\mu}_{t}\)gydF4y2Ba能否估计治疗下的预期边际结局概率gydF4y2BatgydF4y2Ba.作为卫生经济模型的投入,绝对结果估计可能是可取的[gydF4y2Ba25gydF4y2Ba]或在没有共同对照组的情况下进行的无锚比较中。gydF4y2Ba

在锚定比较中,目标是估计的相对影响gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba,而不是绝对的结果。间接治疗比较通常在线性预测量表上进行[gydF4y2Ba3.gydF4y2Ba,gydF4y2Ba4gydF4y2Ba,gydF4y2Ba6gydF4y2Ba].因此,该量表也用于定义效应修正,这是特定于量表的[gydF4y2Ba5gydF4y2Ba].gydF4y2Ba

人们可以转换由Eq产生的平均绝对结果预测。gydF4y2Ba5gydF4y2Ba从自然尺度到线性预测尺度,并计算边际处理效果为gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba在gydF4y2Ba年代gydF4y2Ba=2作为平均线性预测的差值:gydF4y2Ba

$ $ \帽子{\三角洲}_ {10}^ {(2)}= g \离开(\帽子{\μ}_{1}^{(2)}\右)- g \离开(\帽子{\μ}_{0}^{(2)}\右),$ $gydF4y2Ba
(6)gydF4y2Ba

在这里,gydF4y2BaggydF4y2Ba(·)是一个合适的链接函数,例如,恒等链接对连续值的结果产生平均差,而gydF4y2Ba\({分对数}\ \文本左(\帽子{\μ}^ {(2)}_ {t} \右)= \ ln \离开[\帽子{\μ}^ {(2)}_ {t} / \离开(1 - \帽子{\μ}^ {(2)}_ {t} \) \右]\)gydF4y2Ba为二元结果生成对数比值比。不同的,潜在的更可解释的选择,如相对风险和风险差异是可能的边际对比。我们可以通过操作来映射到这些比例gydF4y2Ba\(\hat {\mu}_{1}^{(2)}\)gydF4y2Ba而且gydF4y2Ba\(\hat {\mu}_{0}^{(2)}\)gydF4y2Ba不同。gydF4y2Ba

或者,由Eq。gydF4y2Ba4gydF4y2Ba可用于拟合治疗结果与IPD的简单回归[gydF4y2Ba43gydF4y2Ba].该模型可以使用最大似然估计来拟合,加权每个个体的贡献gydF4y2Ba我gydF4y2Ba到可能性gydF4y2Ba\(\帽子{w} _{我}\)gydF4y2Ba.在该方法中,拟合加权模型的处理系数为估计的边际处理效果gydF4y2Ba\(\hat {\Delta}_{10}^{(2)}\)gydF4y2Ba为gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba在gydF4y2Ba年代gydF4y2Ba= 2。gydF4y2Ba

MAIC的原始方法使用了一个鲁棒的三明治型方差估计器[gydF4y2Ba44gydF4y2Ba的标准误差gydF4y2Ba\(\hat {\Delta}_{10}^{(2)}\)gydF4y2Ba.这依赖于大样本特性,并且在之前调查MAIC的模拟研究中,对于小ESSs的可变性进行了低估[gydF4y2Ba7gydF4y2Ba]和其他设置[gydF4y2Ba45gydF4y2Ba,gydF4y2Ba46gydF4y2Ba,gydF4y2Ba47gydF4y2Ba,gydF4y2Ba48gydF4y2Ba].此外,三明治估计器的大多数实现,例如拟合加权回归[gydF4y2Ba49gydF4y2Ba],忽略试验分配模型的估计,假设权重为固定量。虽然可以推导出包含权重估计的解析表达式,但一种实用的替代方法是通过普通的非参数自举方法[gydF4y2Ba23gydF4y2Ba,gydF4y2Ba50gydF4y2Ba,gydF4y2Ba51gydF4y2Ba],重新估计的权值和边际处理效果gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba在每次自举迭代中。点估计,标准误差和区间估计可以直接从自举复制计算。gydF4y2Ba

我们简要描述MAIC所需的假设及其含义:gydF4y2Ba

  1. 1gydF4y2Ba

    内部效度gydF4y2Ba从指数和竞争对手的研究中得出的效果估计。如果研究是随机对照试验,这当然是可行的,因为随机化确保了预期治疗分配的互换性。虽然内部效度在随机对照试验中可能成立,但对于观察性研究来说,这是一个更严格的条件。假定没有测量误差、数据缺失、不遵守等。gydF4y2Ba

  2. 2gydF4y2Ba

    平行研究的一致性gydF4y2Ba[gydF4y2Ba52gydF4y2Ba].每种治疗方法只有一个明确定义的版本[gydF4y2Ba53gydF4y2Ba]或任何治疗版本的变化都无关紧要[gydF4y2Ba54gydF4y2Ba,gydF4y2Ba55gydF4y2Ba].这适用于共同比较国gydF4y2BaCgydF4y2Ba在特定的。gydF4y2Ba

  3. 3.gydF4y2Ba

    有条件的可移植性gydF4y2Ba(互换性)的边际处理效果为gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba从指数到竞争对手研究[gydF4y2Ba39gydF4y2Ba].即,试验分配不影响该措施,有条件的gydF4y2BazgydF4y2Ba.先前的研究将这种假设称为gydF4y2Ba相对效应的条件恒常性gydF4y2Ba[gydF4y2Ba5gydF4y2Ba,gydF4y2Ba6gydF4y2Ba,gydF4y2Ba9gydF4y2Ba].这是合理的gydF4y2BazgydF4y2Ba包括所有被认为是修改的边际治疗效果的协变量gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba(即,不存在不可测量的效果修饰词)[gydF4y2Ba56gydF4y2Ba,gydF4y2Ba57gydF4y2Ba,gydF4y2Ba58gydF4y2Ba]gydF4y2Ba脚注gydF4y2Ba1gydF4y2Ba.gydF4y2Ba

  4. 4gydF4y2Ba

    足够的重叠gydF4y2Ba.中所选协变量的范围gydF4y2Ba年代gydF4y2Ba=1应涵盖各自的时刻gydF4y2Ba年代gydF4y2Ba= 2。重叠冲突可以是确定的,也可以是随机的。前者在结构上出现,由于试验目标人群不重叠(资格标准)。后者由于偶然性而在经验上产生,特别是在样本量很小的情况下[gydF4y2Ba60gydF4y2Ba].因此,可以根据绝对样本量来评估重叠。ESS是一种方便的单一数字诊断。gydF4y2Ba

  5. 5gydF4y2Ba

    正确的规格gydF4y2Ba年代gydF4y2Ba=2协变量分布gydF4y2Ba.由于IPD无法用于竞争对手的研究,分析师只能近似计算联合分布。协变量相关性很少被发表gydF4y2Ba年代gydF4y2Ba=2,因此不能被MAIC平衡。在这种情况下,假设它们与IPD加权形成的伪样本中的值相等。gydF4y2Ba5gydF4y2Ba].gydF4y2Ba

在Eq中,我对参数化试验分配模型的规范做了简要的评述。gydF4y2Ba2gydF4y2Ba.这并不一定是正确的,只要它平衡了所有的协变量,以及这些协变量的潜在变换,例如多项式变换和乘积项,修改的边际处理效果gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba[gydF4y2Ba9gydF4y2Ba,gydF4y2Ba23gydF4y2Ba].平方项通常被包括在连续协变量中以平衡方差[gydF4y2Ba11gydF4y2Ba]但最初的模拟研究并没有报告性能方面的好处[gydF4y2Ba14gydF4y2Ba,gydF4y2Ba17gydF4y2Ba].这可能是由于ESS和精度的大幅降低[gydF4y2Ba25gydF4y2Ba].gydF4y2Ba

效果修饰剂的鉴定可能需要事先的背景知识和实质性领域专业知识。偏差与方差的权衡也很重要。未包含有影响的效果修饰符gydF4y2BazgydF4y2Ba,无论在不平衡,都会导致偏向gydF4y2Ba年代gydF4y2Ba= 2 (gydF4y2Ba5gydF4y2Ba,gydF4y2Ba40gydF4y2Ba,gydF4y2Ba61gydF4y2Ba].另一方面,包含非效应修饰符的协变量减少了重叠,从而增加了极端权重的机会。这降低了精度,但没有改善减少偏差的潜力[gydF4y2Ba6gydF4y2Ba,gydF4y2Ba62gydF4y2Ba],即使各研究的协变量严重不平衡。也就是说,即使它们预测或与试验分配相关。gydF4y2Ba

简单地说,就像其他基于权重的方法一样[gydF4y2Ba63gydF4y2Ba,gydF4y2Ba64gydF4y2Ba],如果试验分配机制或结果生成机制中有一个是已知的,MAIC可能是无偏的,后者由于方差减少和效率提高而导致更好的性能。gydF4y2Ba

两阶段匹配调整间接比较gydF4y2Ba

标准MAIC为试验分配机制建模,两阶段MAIC (2SMAIC)为指标试验中的治疗分配机制建模。处理分配模型估计产生处理权重的逆概率。然后,这些与标准MAIC生成的概率权重相结合。由此得出的权重试图平衡研究和指标试验治疗组之间的协变量矩。gydF4y2Ba

对于治疗分配机制,治疗在协变量上的倾向评分逻辑回归拟合到IPD:gydF4y2Ba

$ ${分对数}\文本(e_{我}={分对数}\文本(e (\ boldsymbol {x} _{我}))={分对数}\文本(公关(T = 1 \ \中期boldsymbol {x} _{我}))= \ beta_ {0} + \ boldsymbol {x} _{我}\ boldsymbol{\β}_ {\ boldsymbol {1}}, $ $gydF4y2Ba
(7)gydF4y2Ba

在哪里gydF4y2BaβgydF4y2Ba0gydF4y2Ba而且gydF4y2BaβgydF4y2Ba1gydF4y2Ba参数化逻辑回归。倾向得分gydF4y2BaegydF4y2Ba我gydF4y2Ba定义为参与者gydF4y2Ba我gydF4y2Ba被分配治疗gydF4y2Ba一个gydF4y2Ba与治疗gydF4y2BaCgydF4y2Ba给定测量的协变量gydF4y2BaxgydF4y2Ba我gydF4y2Ba[gydF4y2Ba65gydF4y2Ba].gydF4y2Ba

拟合了Eq中的模型。gydF4y2Ba7gydF4y2Ba,例如,使用最大似然估计,使用以下方法预测指数试验中受试者的倾向得分:gydF4y2Ba

$ $ \帽子{e} _{我}= {expit} \文本(\帽子{\β}_ {0}+ \ boldsymbol {x} _{我}\帽子{\ boldsymbol{\β}}_ {\ boldsymbol {1}}), $ $gydF4y2Ba
(8)gydF4y2Ba

在哪里gydF4y2Ba\(文本{expit} (\ cdot) = \ \ exp (\ cdot) / (1 + \ exp (\ cdot)],帽子\{\β}_ {0}\)gydF4y2Ba而且gydF4y2Ba\(\hat {\boldsymbol {\beta}}_{\boldsymbol {1}}\)gydF4y2Ba逻辑回归参数的点估计,和gydF4y2Ba\(\帽子{e} _{我}\)gydF4y2Ba是对gydF4y2BaegydF4y2Ba我gydF4y2Ba.处理权重的逆概率是通过取指数研究中分配的处理的估计条件概率的倒数来构造的[gydF4y2Ba37gydF4y2Ba].那就是gydF4y2Ba\(1 / \帽子{e} _{我}\)gydF4y2Ba正在治疗的单位gydF4y2Ba一个gydF4y2Ba而且gydF4y2Ba\(1 /(1 - \帽子{e} _{我})\)gydF4y2Ba正在治疗的单位gydF4y2BaCgydF4y2Ba.gydF4y2Ba

因此,由标准MAIC (Eq。gydF4y2Ba4gydF4y2Ba)根据估计的处理权重的逆概率重新缩放。每个学科的贡献gydF4y2Ba我gydF4y2Ba的权重为:gydF4y2Ba

$ $ \帽子{\ω}_{我}= \压裂{t_{我}\识别帽子{w} _{我}}{\帽子{e} _{我}}+ \压裂{(1-t_{我})\帽子{w} _{我}}{(1 - \帽子{e} _{我})}。$ $gydF4y2Ba
(9)gydF4y2Ba

权重gydF4y2Ba\(\{\hat {w}_{i}, i=1,\dots,n \}\)gydF4y2Ba由标准MAIC估计的概率为正。这些平衡的指标和竞争对手研究研究方面的选择效应修正矩。估计倾向得分gydF4y2Ba\(\{\hat {e}_{i},\, i=1,\dots,n \}\)gydF4y2Ba概率在0和1之间。因此,权重gydF4y2Ba\(\{\hat {\omega}_{i},\, i=1,\dots,n \}\)gydF4y2Ba由2SMAIC在Eq中生成。gydF4y2Ba9gydF4y2Ba都被限制为正。这些权重在各研究之间实现了效应修正矩的平衡,但也寻求在指数试验的治疗组之间平衡协变量矩。gydF4y2Ba

治疗的边际平均结果gydF4y2Ba一个gydF4y2Ba而且gydF4y2BaCgydF4y2Ba在竞争对手研究样本中,估计为观察结果的加权平均值:gydF4y2Ba

$ $ \帽子{\μ}^ {(2)}_ {t} = \压裂{\ sum_ {i = 1} ^ {n_ {t}} y_{我t} \帽子{\ω}_{我t}} {\ sum_ {i = 1} ^ {n_ {t}} \帽子{\ω}_{我t}}, $ $gydF4y2Ba
(10)gydF4y2Ba

在哪里gydF4y2Ba\(\hat {\omega}_{i,t}\)gydF4y2Ba体重是否分配给患者gydF4y2Ba我gydF4y2Ba接受治疗gydF4y2BatgydF4y2Ba.可以转换由Eq生成的平均绝对结果预测。gydF4y2Ba10gydF4y2Ba到线性预测量表,并计算边际治疗效果为gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba在gydF4y2Ba年代gydF4y2Ba=2作为平均线性预测之间的差异,如Eq。gydF4y2Ba6gydF4y2Ba.或者,单独治疗的结果的加权回归可以拟合到IPD,在这种情况下,拟合模型的治疗系数代表估计的边际治疗效果gydF4y2Ba\(\hat {\Delta}_{10}^{(2)}\)gydF4y2Ba为gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba在gydF4y2Ba年代gydF4y2Ba= 2。gydF4y2Ba

推理可以基于稳健的三明治型方差估计器或重采样方法,如非参数自举。如前所述,当加权后ESS较小时,三明治方差估计器会向下偏置,导致精度过高。在实践中,非参数引导是首选的选择,在每次迭代中重新估计试验分配模型和治疗分配模型。这种方法明确地解释了权重的估计,并期望在ESS较小的情况下表现更好。gydF4y2Ba

当指标试验是随机对照试验时,估计治疗分配机制似乎违反直觉。随机化设计意味着真实倾向得分{gydF4y2BaegydF4y2Ba我gydF4y2Ba,gydF4y2Ba我gydF4y2Ba= 1,…,gydF4y2BangydF4y2Ba}是固定的和已知的。例如,考虑一个1:1治疗分配比例的边缘随机两组试验。试验研究人员事先确定,与对照组相比,被分配到积极治疗组的概率是gydF4y2BaegydF4y2Ba我gydF4y2Ba=0.5gydF4y2Ba我gydF4y2Ba.gydF4y2Ba

估计倾向得分的基本原理如下。随机化保证在期望上没有混淆[gydF4y2Ba66gydF4y2Ba].然而,协变量平衡是一个大样本属性,由于偶然性,人们仍然可以观察到治疗组之间残留的协变量不平衡,特别是当试验样本量较小时[gydF4y2Ba67gydF4y2Ba].由Senn [gydF4y2Ba66gydF4y2Ba],“在所有随机化中,各组是平衡的;对于特定的随机化,它们是不平衡的。”估计倾向评分的使用允许校正预后基线协变量的随机有限样本失衡。在RCT文献中,逆概率治疗加权是协变量调整的既定方法[gydF4y2Ba68gydF4y2Ba],并且在估计边际处理效果时,与未经调整的分析相比,提高了精度、效率和威力[gydF4y2Ba48gydF4y2Ba,gydF4y2Ba69gydF4y2Ba].gydF4y2Ba

到目前为止,锚定MAIC的使用仅限于指标试验为随机对照试验的情况。2SMAIC可用于观察性指标研究,前提是基线协变量为gydF4y2BaxgydF4y2Ba为混淆提供足够的控制。在非随机研究中,指数研究中每个参与者的真实倾向评分是未知的,需要附加条件来产生内部有效的边际治疗效果估计gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba.它们是:(1)治疗分配的条件互换性[gydF4y2Ba70gydF4y2Ba];(2)治疗分配的积极性[gydF4y2Ba60gydF4y2Ba].随机试验往往通过设计来满足这些假设。这些假设与之前为MAIC描述的条件可移植性和重叠条件在概念上有相似之处。gydF4y2Ba

第一个假设表明,每个治疗组中受试者的潜在结果与所选协变量条件作用后分配的治疗无关。它依赖于测量和解释治疗对结果影响的所有混杂因素[gydF4y2Ba71gydF4y2Ba].第二个假设表明,对于指数研究中的每个参与者,被分配到任何一种治疗的概率都是正的,条件是选择协变量以确保互换性[gydF4y2Ba60gydF4y2Ba].这需要在治疗对象的联合协变量分布之间有重叠gydF4y2Ba一个gydF4y2Ba正在接受治疗gydF4y2BaCgydF4y2Ba.如果在某些协变量亚组/阶层中来自两个治疗组的个体很少或没有,则这一假设将受到威胁。gydF4y2Ba

模拟研究gydF4y2Ba

目标gydF4y2Ba

模拟研究的目的是为2SMAIC提供原理证明,并将其统计性能与MAIC在锚定环境中的指标研究为随机对照试验(RCT)进行比较。我们还研究了权值截断是否可以通过减少极端权值引起的方差来提高MAIC和2SMAIC的性能。gydF4y2Ba

每种方法都使用以下频率论特征进行评估[gydF4y2Ba72gydF4y2Ba:(1)不偏不倚;(2)精度;(3)效率(准确性);(4)随机效度(有效置信区间估计)。所选的性能指标专门评估这些标准。admp(目标、数据生成机制、估计、方法、绩效衡量)框架[gydF4y2Ba72gydF4y2Ba]用于描述模拟研究设计。例子gydF4y2BaRgydF4y2Ba实现方法的代码在附加文件中提供gydF4y2Ba1gydF4y2Ba.所有的模拟和分析都在gydF4y2BaRgydF4y2Ba软件版本4.1.1 [gydF4y2Ba73gydF4y2Ba]gydF4y2Ba脚注gydF4y2Ba2gydF4y2Ba.gydF4y2Ba

数据生成机制gydF4y2Ba

我们使用平均差作为效果的度量来考虑连续结果。对于指数和竞争对手研究,结果gydF4y2BaygydF4y2Ba我gydF4y2Ba为参与者gydF4y2Ba我gydF4y2Ba生成为:gydF4y2Ba

$ $ y_{我}= \ beta_ {0} + \ boldsymbol {x} _{我}\ boldsymbol{\β}_ {\ boldsymbol{1}} + \离开(\ beta_ {t} + \ boldsymbol {x} _{我}\ boldsymbol{\β}_ {\ boldsymbol {2}} \) \ mathbb {1} (t_{我}= 1)识别+ \ epsilon_ {}, $ $gydF4y2Ba

使用索引研究数据的符号。每一个gydF4y2BaxgydF4y2Ba我gydF4y2Ba包含三个相关的连续协变量的值,这些值是用预先指定的均值和协方差矩阵从多元正态分布模拟出来的。三个协变量之间存在一定的正相关关系,皮尔逊相关水平设置为0.2。协变量具有主要影响,是独立于治疗的个体水平结果的预后。它们还具有一阶协变量处理积项,从而修改了两者的条件(和边际)效应gydF4y2Ba一个gydF4y2Ba而且gydF4y2BaBgydF4y2Ba与gydF4y2BaCgydF4y2Ba在平均差异尺度上,即gydF4y2BazgydF4y2Ba等于gydF4y2BaxgydF4y2Ba.这个词gydF4y2BaεgydF4y2Ba我gydF4y2Ba错误术语是主语吗gydF4y2Ba我gydF4y2Ba由标准(零均值,单位方差)正态分布生成。gydF4y2Ba

主要“预后”系数gydF4y2BaβgydF4y2Ba1,gydF4y2BakgydF4y2Ba每个协变量=2gydF4y2BakgydF4y2Ba.这被认为是一个强的协变量-结果相关性。相互作用系数gydF4y2BaβgydF4y2Ba2,gydF4y2BakgydF4y2Ba每个协变量=1gydF4y2BakgydF4y2Ba,表明显著的效果修正。我们设定了截距gydF4y2BaβgydF4y2Ba0gydF4y2Ba= 5。积极治疗gydF4y2Ba一个gydF4y2Ba而且gydF4y2BaBgydF4y2Ba假设相对于共同比较器具有相同的效果修饰符集,并且每个效果修饰符具有相同的交互系数。因此,共享(条件)效果修饰符假设成立[gydF4y2Ba5gydF4y2Ba].主要处理系数gydF4y2BaβgydF4y2BatgydF4y2Ba=−2被认为是与基线对照(当协变量值为零时)相比的强条件处理效应。gydF4y2Ba

连续结果可能是指示疾病严重程度的生物标志物。协变量是与生物标志物较高值相关的共病,与积极治疗相互作用,阻碍其与对照的效果。gydF4y2Ba

假定指标研究和竞争研究是简单的、边际随机的随机对照试验。竞争对手RCT的参与者人数为300人,积极治疗与对照组的分配比例为1:1。在本研究中,个体水平的协变量被总结为均值。分析人员可以在研究出版物的基线特征表中获得这些数据。个体水平的结果通过拟合治疗结果的简单线性回归来聚合,以产生未调整的边际平均差的估计gydF4y2BaBgydF4y2Bavs。gydF4y2BaCgydF4y2Ba,其对应的标称标准误差。这些信息也将在已发表的研究中提供。gydF4y2Ba

我们采用阶乘排列,使用两个指标试验样本量乘以三个重叠设置。这将导致总共6个模拟场景。以下参数值不同:gydF4y2Ba

  • 样本量gydF4y2BangydF4y2Ba∈gydF4y2Ba{140,200}被考虑用于指数试验,干预的分配比例为1:1gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba.样本量虽小,但在HTA提交的申请中,MAIC的应用并不罕见[gydF4y2Ba10gydF4y2Ba].预计较小的试验比较大的试验更容易出现协变量不平衡[gydF4y2Ba74gydF4y2Ba].gydF4y2Ba

  • (确定性的)协变量重叠的程度。两项研究的协变量均遵循正态边际分布。对于竞争对手试验,边际分布均值固定在0.6。对于指数试验,是均值gydF4y2BaμgydF4y2BakgydF4y2Ba∈gydF4y2Ba{0.5,0.4,0.3}用于每个协变量gydF4y2BakgydF4y2Ba.这些设置分别产生强烈、中等和较差的重叠。两项研究的标准差都固定在0.4,即每个协变量的标准差增加一个,结果增加0.8个单位。研究间更大的协变量不平衡导致试验目标人群之间的重叠较差,这转化为更多的变量权重和更低的ESS。除非另有说明,在描述模拟研究的结果时,“协变量重叠”涉及试验目标人群之间的确定性重叠,而不是由于样本量小而引起的随机违规。gydF4y2Ba

EstimandsgydF4y2Ba

目标估计值为的边际平均差值gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaBgydF4y2Ba在gydF4y2Ba年代gydF4y2Ba= 2。处理系数gydF4y2BaβgydF4y2BatgydF4y2Ba=−2对两者都是相同的gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba而且gydF4y2BaBgydF4y2Bavs。gydF4y2BaCgydF4y2Ba,共享(条件)效果修饰符假设成立。因此,真有条件的处理效果为gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba而且gydF4y2BaBgydF4y2Bavs。gydF4y2BaCgydF4y2Ba在gydF4y2Ba年代gydF4y2Ba=2是一样的(−2+3×(0.6×1)=−0.2)。由于均值差值是可折叠的,故真边际处理效果为gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba而且gydF4y2BaBgydF4y2Bavs。gydF4y2BaCgydF4y2Ba与相应的条件估计相吻合。的真实边际效应gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaBgydF4y2Ba在gydF4y2Ba年代gydF4y2Ba=2是for的合数gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba而且gydF4y2BaBgydF4y2Bavs。gydF4y2BaCgydF4y2Ba,两者约掉了。因此,的真实边际平均差gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaBgydF4y2Ba在gydF4y2Ba年代gydF4y2Ba=2 = 0。gydF4y2Ba

注意,所有进行比较的方法都进行了相同的未经调整的分析,以估计的边际处理效果gydF4y2BaBgydF4y2Bavs。gydF4y2BaCgydF4y2Ba.由于竞争对手研究是随机试验,因此该估计值相对于相应的边际估计值应是无偏的gydF4y2Ba年代gydF4y2Ba= 2。因此,不同方法之间的性能差异会因比较而产生gydF4y2Ba一个gydF4y2Ba而且gydF4y2BaCgydF4y2Ba,其中边际估计和条件估计为非空。gydF4y2Ba

方法gydF4y2Ba

使用以下方法分析每个模拟数据集:gydF4y2Ba

  • 匹配调整间接比较(MAIC)。式中的试分配模型。gydF4y2Ba2gydF4y2Ba包含所有三个效果修饰符的主要效果项-只有协变量均值是平衡的。方程中的目标函数。gydF4y2Ba3.gydF4y2Ba使用BFGS最小化[gydF4y2Ba41gydF4y2Ba].由式估计的权重。gydF4y2Ba4gydF4y2Ba用于将治疗结果的加权简单线性回归拟合到指标试验IPD。gydF4y2Ba

  • 两阶段匹配调整间接比较(2SMAIC)。我们遵循与标准MAIC相同的步骤。此外,Eq.中的处理分配模型。gydF4y2Ba7gydF4y2Ba拟合到指数研究IPD,包括所有三个基线协变量的主要效应项。倾向得分估计值由Eq。gydF4y2Ba8gydF4y2Ba并与Eq生成的权重相结合。gydF4y2Ba4gydF4y2Ba根据式。gydF4y2Ba9gydF4y2Ba.所得到的权重用于将治疗结果的加权简单线性回归拟合到指标试验IPD。gydF4y2Ba

  • 截断匹配调整间接比较(T-MAIC)。该方法与MAIC相同,但最高的估计权重(式。gydF4y2Ba4gydF4y2Ba)使用第95百分位切点截断,遵循Susukida等人。[gydF4y2Ba75gydF4y2Ba,gydF4y2Ba76gydF4y2Ba],韦伯斯特-克拉克等。[gydF4y2Ba77gydF4y2Ba],以及Lee等人。[gydF4y2Ba31gydF4y2Ba].具体来说,所有超过第95百分位的权重都被第95百分位的值所取代。gydF4y2Ba

  • 截断的两阶段匹配调整间接比较(T-2SMAIC)。该方法与2SMAIC相同,但所有的估计权重(式。gydF4y2Ba9gydF4y2Ba)大于第95个百分位的都被设定为等于第95个百分位。gydF4y2Ba

所有方法都使用普通的非参数自举法估计模型的方差gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba边际治疗效果。对每个模拟数据集绘制2,000个重采样,并进行替换[gydF4y2Ba50gydF4y2Ba,gydF4y2Ba78gydF4y2Ba].由于竞争对手研究的患者水平数据限制,在实施自举法时,仅对指标试验的IPD进行重新采样。的平均边际平均差gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba在gydF4y2Ba年代gydF4y2Ba=2作为自举重采样的平均值。它的标准误差是这些重采样的标准差。对于“一阶段”MAIC方法,每次自举迭代重新估计试验分配模型。对于“两阶段”MAIC方法,试验分配和治疗分配模型在每次迭代中都要重新估计。gydF4y2Ba

所有方法都在最后阶段进行间接治疗比较,在该阶段,将研究特定分析的结果结合起来。的边际平均差gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaBgydF4y2Ba是通过直接替换点估计值得到的吗gydF4y2Ba\(\hat {\Delta}_{10}^{(2)}\)gydF4y2Ba而且gydF4y2Ba\(\hat {\Delta}_{20}^{(2)}\)gydF4y2Ba在情商。gydF4y2Ba1gydF4y2Ba.其方差通过添加研究内治疗效果估计方差的点估计值来估计。瓦尔德型95%置信区间估计使用正态分布构造。gydF4y2Ba

性能的措施gydF4y2Ba

我们为每个模拟场景生成5000个模拟数据集。对于每种场景和分析方法,在5000个重复中计算以下性能指标:(1)估计处理效果的偏差;(2)经验标准误差(ESE);(3)均方误差;(4) 95%置信区间估计的经验覆盖率。这些指标在之前的工作中明确定义[gydF4y2Ba7gydF4y2Ba,gydF4y2Ba72gydF4y2Ba].gydF4y2Ba

偏差评价了模拟研究的目标1。它等于整个模拟的平均治疗效果估计值,因为真实估计值为零(gydF4y2Ba\ \(δ_ {12}^ {(2)}= 0 \)gydF4y2Ba).ESE的目标是2,是超过5000次的处理效果估计的标准偏差。MSE表示模拟重复的平均偏倚平方加上方差。它衡量总体效率(目标3),考虑偏差(目标1)和精度(目标2)。覆盖率评估目标4,并计算包含估计值真实值的估计95%置信区间的百分比。gydF4y2Ba

基于分析方法和具有最大长期可变性的情景(标准MAIC与gydF4y2BangydF4y2Ba=140,重叠差)。假设gydF4y2Ba{SD} \(\文本(\帽子{\三角洲}_ {12}^ {(2)})\ leq 0.53 \)gydF4y2Ba时,偏差的蒙特卡罗标准误差(MCSE)最大gydF4y2Ba\ \√{{Var} \文本(\帽子{\三角洲}_ {12}^ {(2)})/ N_ {sim}} = \ sqrt {0.28/5000} = 0.007 \)gydF4y2Ba在每种情景5000次以下,基于95%的经验覆盖率,覆盖率的MCSE为gydF4y2Ba\(左\ \√{(95 \ * 5)/ 5000}\)\ % = 0.31 \ % \)gydF4y2Ba,最坏情况为0.71gydF4y2Ba%gydF4y2Ba50%以下的保险。这些被认为是足够的模拟不确定性水平。gydF4y2Ba

结果gydF4y2Ba

图中报告了所有方法和仿真场景的性能度量。gydF4y2Ba1gydF4y2Ba.顶部为强重叠设置(按指标试验样本量升序排列),其次为中等重叠设置,底部为差重叠设置。对于每一个数据生成机制,都有一个山脊线图来可视化边缘点估计的扩散gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaBgydF4y2Ba5000次模拟重复的处理效果。在每个图的下面,显示了一个总结每种方法的性能指标的表。用于量化模拟不确定性的每个度量的mcse已经计算出来,并在括号中显示在每个性能度量的平均值旁边。这些被认为是可以忽略不计的,因为每个场景都有大量的模拟数据集。在无花果。gydF4y2Ba1gydF4y2Ba, Cov表示95%置信区间估计的经验覆盖率。gydF4y2Ba

图1gydF4y2Ba
图1gydF4y2Ba

模拟研究结果。对所有方法和模拟场景的处理效果和性能指标进行点估计gydF4y2Ba

在最极端的情况下(gydF4y2BangydF4y2Ba=140且协变量重叠较差),无法对5000个模拟数据集中的1个估计权重。这是由于完全分离:根据经验,在一个基线协变量的指标试验中观察到的所有值都低于竞争对手研究的平均值。因此,在Eq中不存在最小化目标函数的可行解。gydF4y2Ba3.gydF4y2Ba.丢弃了受影响的复制,并在相应的场景中分析了4999个模拟数据集。关于治疗分配模型,由于指标试验的随机性,治疗组之间的经验重叠总是很好的。gydF4y2Ba

偏见gydF4y2Ba

即使在小指数试验样本量的情况下,在所有模拟场景中,MAIC和2SMAIC的偏差同样很低,没有截断。随着加权后ESS的减小,偏差略有增加,最大偏差发生在gydF4y2BangydF4y2Ba=140,且MAIC(-0.041)和2SMAIC(-0.031)的协变量重叠较差(加权后ESS最低的情况)。从绝对值上看,2SMAIC在所有模拟场景下的偏差都小于MAIC。对于2SMAIC,除了前面提到的最极端的设置,在所有情况下,它都在蒙特卡罗误差为零的范围内gydF4y2BangydF4y2Ba=200和适度重叠(-0.008)。在所有方法中,2SMAIC在每个模拟场景中产生的偏差最小。gydF4y2Ba

权值截断在所有情况下都会增加绝对偏差。T-MAIC和T-2SMAIC始终比MAIC和2SMAIC表现出更大的偏倚。当重叠很强时,截断只会引起非常轻微的偏差。随着重叠的减少,截断引起的偏置更加明显,特别是在gydF4y2BangydF4y2Ba= 140设置。例如,在重叠较差的情况下,T-MAIC和T-2SMAIC的偏差是巨大的(对于gydF4y2BangydF4y2Ba=140:分别为0.157和0.160;为gydF4y2BangydF4y2Ba=200, 0.149和0.153)。对于截断的方法,偏差的幅度也似乎随着加权后ESS的减小而增加。gydF4y2Ba

精度gydF4y2Ba

正如预期的那样,随着指标试验的受试者数量和协变量重叠的减少,所有方法都有精度损失。尽管在指标试验中强制随机化,但2SMAIC在每个模拟场景中都比MAIC提高了精度(由ESE测量)。ESE的减少在gydF4y2BangydF4y2Ba=140设置gydF4y2BangydF4y2Ba= 200设置。这是由于样本量较小的经验协变量不平衡的可能性更大。有趣的是,减少协变量重叠似乎使纳入第二阶段(治疗分配)的影响最小化。这可能是由于精度增益被极端权重的存在所抵消,这导致ESS的大幅降低和ESE的膨胀。在整个模拟场景中,T-2SMAIC相对于T-MAIC显示了相同的趋势。在所有场景中,“两级”版本都比“一级”版本减少了se。gydF4y2Ba

权重截断降低了一级和两级MAIC的所有模拟场景的ESE。这是意料之中的,因为外围权重的影响降低了。当重叠很强时,截断只能在精度上提供很小的改进。与MAIC中包含的第二阶段相比,这几乎没有影响。例如,在强重叠和gydF4y2BangydF4y2Ba=140时,MAIC和2SMAIC的ESE分别为0.516和0.386;而相应截断版本的ESEs为0.489和0.371。gydF4y2Ba

随着重叠减弱和权值极值增加,权值截断的精度增益变得更加可观。当重叠较差时,截断比在MAIC中加入第二阶段更能显著降低ESE。例如,在重叠差的情况下gydF4y2BangydF4y2Ba=140时,MAIC和2SMAIC的ESE分别为0.767和0.703,截断后的ESE分别为0.563和0.519。不出所料,合并第二阶段和截断权重的组合在方差减少方面是最有效的。作为gydF4y2BangydF4y2Ba单阶段方法比两阶段方法,未截断方法比截断方法,精度似乎更明显地降低。gydF4y2Ba

在协变量重叠较强的地方,T-2SMAIC的精度最高,其次是2SMAIC、T-MAIC和MAIC。在共变量重叠程度中等或较差的情况下,T-2SMAIC的精度最高,其次是T-MAIC、2SMAIC和MAIC。gydF4y2Ba

效率gydF4y2Ba

根据ESE,所有方法的MSE值随着指标试验样本量和协变量重叠的增加而降低。与精度的趋势一致,MAIC的两阶段版本在所有情况下都比相应的单阶段方法提高了效率,特别是在gydF4y2BangydF4y2Ba= 140设置。当协变量重叠较强时,两阶段方法的效率增益较强,并且由于极端权重,当协变量重叠减弱时,效率增益变得不那么明显。例如,具有强重叠和gydF4y2BangydF4y2Ba=200, MAIC和2SMAIC的mse分别为0.205和0.127。重叠较差gydF4y2BangydF4y2Ba=200时,分别为0.459和0.393。gydF4y2Ba

不同方法之间MSE的差异更多地是由相对精度而不是偏差引起的。这在强重叠情况下是预期的,其中所有方法的偏差都可以忽略不计,但也发生在差重叠情况下。当权值变异性较大时,截断精度的增加可以抵消偏差的增加。随着重叠的减少,截断方法与未截断方法的相对效率显著提高。例如,重叠差和gydF4y2BangydF4y2Ba=200时,T-MAIC和T-2SMAIC的MSE分别为0.263和0.233(而MAIC和2SMAIC的MSE分别为0.459和0.393)。gydF4y2Ba

在MSE方面,T-2SMAIC是所有模拟场景中最有效的方法,MAIC是最低效的方法。在协变量重叠较强的地方,T-2SMAIC的效率最高,其次是2SMAIC、T-MAIC和MAIC。在重叠较差的区域,T-2SMAIC效率最高,其次是T-MAIC、2SMAIC和MAIC。重叠适度时,2SMAIC和T-MAIC具有相当的效率。gydF4y2Ba

报道gydF4y2Ba

从频率论的角度来看,95%置信区间估计应该包括真实的估计和95%的时间。也就是说,经验覆盖率应该等于名义覆盖率,以确保测试“无影响”零假设的适当的I型错误率。从理论上讲,由于我们在每个场景中使用了5000次蒙特卡罗模拟,如果经验覆盖率低于0.944或高于0.956,则在统计上与理想的0.95有显著差异。gydF4y2Ba

MAIC的经验覆盖率在统计上显著不同于名义覆盖率,只有一种情况例外:具有强烈重叠和gydF4y2BangydF4y2Ba= 200。在协变量重叠强或中等的情况下,所有其他方法都表现出非常接近宣传的名义值的经验覆盖率(所有差异都没有显著差异,除了T-MAIC在强重叠的情况下和gydF4y2BangydF4y2Ba= 140)。gydF4y2Ba

当重叠较差时,所有方法都有明显的覆盖不足。对于没有截断的方法尤其如此。例如,对于最小样本量(gydF4y2BangydF4y2Ba=140),重叠较差,MAIC的经验覆盖率为0.900,2SMAIC的经验覆盖率为0.917。当加权后ESS较小时,使用基于正态分布的置信区间可能会产生这些反保守推论。虽然大样本正态近似产生渐近有效的推论,但在小ESS情况下,一个合理的替代方法可能是使用t分布。一个悬而未决的问题是如何选择t分布的自由度。gydF4y2Ba

有趣的是,随着重叠减弱,未截断方法的覆盖率下降要比截断方法大。这是令人惊讶的,因为截断的方法在较差的重叠设置中会引起相当大的偏差,并且人们本可以预期覆盖率会因这种偏差而进一步降低。在另一项不同背景下的模拟研究中,权重截断提高了覆盖率[gydF4y2Ba31gydF4y2Ba].这值得进一步调查。对于任何一种方法来说,过度覆盖都不是问题,因为经验覆盖率从未超过0.956。gydF4y2Ba

讨论gydF4y2Ba

模拟研究的局限性gydF4y2Ba

在所有仿真场景中,两级方法相对于单级方法提供了更高的精度和效率。这些增益可能与治疗分配模型中包括的基线协变量的预后强度有关。我们已经假设,在实践中是典型的情况下,基线协变量是预后的结果。当协变量-结果相关性较低时,预期精度和效率的提高不太显著。gydF4y2Ba

所有方法都依赖于试验中条件可移植性的关键假设。考虑到在我们的背景下,在不同的研究中进行选择的过程有些武断和不明确(实际上,没有正式的分配过程来确定受试者是否在研究样本中gydF4y2Ba年代gydF4y2Ba= 1或gydF4y2Ba年代gydF4y2Ba=2),我没有在模拟研究中指定一个真正的试验分配机制。然而,真正的结果产生机制在协变量-结果关联和协变量治疗-相互作用中强加了线性和可加性假设。条件可移植性成立,因为试验分配模型平衡了修改的边际处理效果的所有协变量的均值gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba.gydF4y2Ba

在现实生活中,在产生结果的过程中,完全有可能存在更复杂的关系。这可能需要平衡高阶矩,协变量与协变量的相互作用和协变量的非线性转换。在实践中,需要进行灵敏度分析,以探讨不同模型规格所产生的结果是否存在差异。gydF4y2Ba

本文评估的方法侧重于纠正基线协变量的不平衡,即PICO(人口、干预、比较器、结果)框架中的“P”[gydF4y2Ba79gydF4y2Ba].然而,还有其他类型的差异可能会导致间接治疗比较的偏倚,例如在比较器或终点定义方面。本文中评估的方法不能针对这些类型的差异进行调整。gydF4y2Ba

根据最近的模拟研究做出的贡献gydF4y2Ba

先前在锚定间接治疗比较背景下的模拟研究得出结论,当条件结果产生机制已知时,结果回归比加权更精确和有效[gydF4y2Ba23gydF4y2Ba,gydF4y2Ba24gydF4y2Ba].尽管2SMAIC的性能有所提高,并且相对于MAIC采用了截断的方法,但这种情况可能仍然存在。gydF4y2Ba

然而,有一个警告。在这些研究中,(一阶段)MAIC试验分配模型只考虑作为边际效应修正因子的协变量。其原因是,包括预后协变量,而不是影响修饰因素,会恶化准确性,而不会改善减少偏倚的潜力。相反,结果回归方法将所有预后协变量纳入结果模型,利用这些预后信息提高精度和效率。因此,以往加权与结果回归比较的均衡性或公平性是有争议的。gydF4y2Ba

有了2SMAIC,加权方法现在可以通过在治疗分配模型中包括相关协变量来利用这种预后信息。未来比较加权和结果回归的模拟研究应涉及2SMAIC,而不是其单阶段对应,特别是在这些“完全信息”场景中。gydF4y2Ba

扩展到观察性研究gydF4y2Ba

锚定MAIC几乎无一例外地应用于指标试验随机化的情况。在这种情况下,包含处理分配模型可以通过提高精度来提高效率。由于指数试验的内部有效性,任何偏倚的减少最多都是适度的。然而,在指标研究是观察性的情况下,治疗分配模型可用于减少由于混杂造成的内部效度偏倚。gydF4y2Ba

将非随机研究的结果从gydF4y2Ba年代gydF4y2Ba= 1,gydF4y2Ba年代gydF4y2Ba=2需要进一步的不可检验的假设。其他障碍包括:(1)易受未测量的混杂因素影响;(2)积极性问题。由于随机化,rct中各治疗组之间通常有极好的重叠。然而,在观察性研究设计中,理论(确定性)的正性违反可能发生[gydF4y2Ba34gydF4y2Ba,gydF4y2Ba60gydF4y2Ba,gydF4y2Ba80gydF4y2Ba],例如,具有某些协变量值的受试者可能对接受其中一种治疗有禁忌,从而导致治疗分配的零概率。gydF4y2Ba

除了这些概念问题外,在随机和非随机研究中,由于抽样变异性,小样本量或高维数据可能会出现“偶然”违反正性的情况。这些在模拟研究中没有被观察到。处理臂之间的正性接近违规可能导致处理权重的极端逆概率[gydF4y2Ba81gydF4y2Ba],进一步扩大了2SMAIC中的方差。gydF4y2Ba

最后,值得注意的是,观察性研究设计传统上比随机对照试验更容易受到内部效度偏倚的其他原因的影响,例如缺少结果数据、测量误差或方案偏差[gydF4y2Ba82gydF4y2Ba].gydF4y2Ba

减少方差的方法gydF4y2Ba

权重截断是一种相对非正式但易于实现的方法,通过限制极端权重的贡献来提高精度。第95百分位数的选择是基于先前的文献,有些武断,但在这个模拟研究中效果很好。可以考虑其他阈值。gydF4y2Ba

较低的阈值将以引入更多偏差和进一步改变目标人群或估计和定义为代价进一步减少方差[gydF4y2Ba32gydF4y2Ba,gydF4y2Ba83gydF4y2Ba].理想的截断级别将视具体情况而定,可根据实际情况进行设置,例如逐步截断权重[gydF4y2Ba32gydF4y2Ba,gydF4y2Ba84gydF4y2Ba].密度图可能有助于评估权重的分散和确定最佳截断点。在有足够的重叠且权重表现良好的情况下,权重截断可能没有什么用处。随着样本量的增大,效率增益预计会减少,因为诱导偏差可能会抵消方差的减少。gydF4y2Ba

我们只探索了两种提高效率的策略:(1)对试验分配机制进行建模;(2)截断高于某一水平的权重。然而,在实际应用程序中也可以使用其他方法,可以单独使用,也可以与本文探讨的过程结合使用。减重[gydF4y2Ba85gydF4y2Ba]与权值截断密切相关。它包括排除具有外围权重的受试者,从而共享截断的许多局限性:设置任意截断点,并进一步改变目标人群。修剪没有吸引力,因为它直接丢弃了信息,丢弃了一些个人的数据,并且可能在截断方面失去精度。gydF4y2Ba

通常建议使用稳定权重以获得精度和效率[gydF4y2Ba32gydF4y2Ba,gydF4y2Ba86gydF4y2Ba],尤其是当权重变化很大时。在本文的MAIC实现中,拟合的加权结果模型被认为是“饱和的”(即不能错误指定),因为它是固定时间二元处理下的结果边际模型[gydF4y2Ba87gydF4y2Ba].对于饱和模型,稳定权重和不稳定权重给出相同的结果[gydF4y2Ba87gydF4y2Ba].然而,当加权结果模型不饱和时,例如动态(时变)或连续值治疗方案时,鼓励权重稳定[gydF4y2Ba44gydF4y2Ba,gydF4y2Ba88gydF4y2Ba].gydF4y2Ba

另一种提高效率的方法是重叠加权[gydF4y2Ba89gydF4y2Ba,gydF4y2Ba90gydF4y2Ba].它还改变了目标估计值,在重叠良好的子样本中估计处理效果。虽然该方法值得考虑,但在我们的环境中实现它具有挑战性,因为IPD无法用于竞争对手的研究。gydF4y2Ba

在gydF4y2Ba背景gydF4y2Ba节中,我参考了Jackson等人的权重估计程序。[gydF4y2Ba22gydF4y2Ba],在使ESS最大化的同时满足矩量法,从而减小了权值的分散。2SMAIC是一个模块化的框架,这种方法可以用来代替矩的标准方法来估计试验分配的概率权重。可纳入不同的权重模块,以解释缺失的结果[gydF4y2Ba35gydF4y2Ba],治疗切换[gydF4y2Ba91gydF4y2Ba,gydF4y2Ba92gydF4y2Ba]和其他不遵守议定书的形式[gydF4y2Ba36gydF4y2Ba]在指数试验中。gydF4y2Ba

结论gydF4y2Ba

我介绍了2SMAIC,它是MAIC的扩展,将指标试验中的治疗分配机制模型与试验分配机制模型结合起来。第一个模型解释了治疗组之间的协变量差异,产生了逆概率权重,可以平衡指数研究的治疗组。第二个模型解释了研究之间的效应修正量差异,生成了在试验中实现平衡的几率权重,并允许我们传输的边际效应gydF4y2Ba一个gydF4y2Bavs。gydF4y2BaCgydF4y2Ba从gydF4y2Ba年代gydF4y2Ba= 1,gydF4y2Ba年代gydF4y2Ba= 2。在2SMAIC中,将两个权重组合在一起,以达到指标试验治疗组和整个研究之间的平衡。gydF4y2Ba

在指数研究为随机对照试验的情况下,研究了2SMAIC的统计性能。我们发现,与标准的一级MAIC相比,第二阶段(处理分配)的添加提高了精度和效率。这样做不会引起偏见,也不容易出现覆盖不足的情况。当指标试验的样本量较小时,效率和精度的提高是显著的,在这种情况下,它受到预后基线协变量的经验不平衡的影响。两阶段MAIC通过处理分配模型解释了这些机会不平衡,减轻了样本量减少带来的精度损失。由于估计权重过高,当研究的目标人群之间存在较差的重叠时,精度和效率收益就会减弱。gydF4y2Ba

在MAIC的背景下,首次评估了权重截断方法的包含。在截断应用前,一阶段和两阶段方法产生的偏差很小。在协变量重叠较强且权重可变性可容忍的情况下,截断只略微提高了精度和效率,同时还会引起偏差。截断的好处在重叠减弱的情况下变得更加明显,在这种情况下,它减少了极端权重的影响,相对于未截断的方法,极大地提高了精度甚至覆盖率。gydF4y2Ba

由于偏差与方差的权衡,精度的提高总是以偏差为代价的。在这个模拟研究中,权衡有利于方差减少而不是诱导偏差,截断提高了所有情况下的效率。然而,当权重表现良好且加权后ESS相当大时,截断可能是不必要的。在所有仿真场景中,第二阶段和权重截断的组合在提高精度和效率方面是最有效的。gydF4y2Ba

当协变量重叠较差时,覆盖不足是所有方法的一个问题,特别是对于未截断的方法。基于结果回归的新技术[gydF4y2Ba21gydF4y2Ba,gydF4y2Ba23gydF4y2Ba,gydF4y2Ba24gydF4y2Ba,gydF4y2Ba25gydF4y2Ba,gydF4y2Ba93gydF4y2Ba在这些情况下可能更可取。将结果建模与试验分配权重模型相结合的双稳健方法的开发也很有吸引力,因为这将为研究人员提供两次正确的模型规范机会。gydF4y2Ba

在没有共同比较组的情况下,未锚定比较在研究之间比较单一治疗组的结果。由于其中一个阶段依赖于评估指标研究中的治疗分配机制,两阶段方法不适用于未锚定的情况。这是一个限制,因为许多协变量调整间接比较的应用都是在这种情况下[gydF4y2Ba10gydF4y2Ba],无论是在已发表的研究中还是在卫生技术评估中。gydF4y2Ba

最后,我要指出一个最近在文献中出现的误解[gydF4y2Ba25gydF4y2Ba,gydF4y2Ba94gydF4y2Ba].人们认为MAIC复制了将在假设的“理想随机对照研究”中进行的未经调整的分析,因为它的目标是边际估计,而且MAIC不能利用预后协变量的信息。虽然MAIC的所有方法都以边际估计为目标,但这些方法产生了边际效应的协变量调整估计。MAIC的标准单阶段方法解释了各研究之间的协变量差异。本文中引入的两阶段方法产生协变量调整估计,也解释了指标试验中各治疗组之间的不平衡,就像rct的协变量调整分析一样。gydF4y2Ba

数据和材料的可用性gydF4y2Ba

生成数据、运行模拟和重现结果所需的文件可在gydF4y2Bahttp://github.com/remiroazocar/Maic2stagegydF4y2Ba.gydF4y2Ba

笔记gydF4y2Ba

  1. 这一假设是强有力的,无法验证的。然而,它比非锚定比较所要求的要弱。无锚比较比较绝对结果均值,而不是相对效果估计。因此,这些依赖于积极治疗下绝对结果平均值的条件互换性(绝对效应的条件恒常性)[gydF4y2Ba5gydF4y2Ba,gydF4y2Ba6gydF4y2Ba,gydF4y2Ba40gydF4y2Ba,gydF4y2Ba59gydF4y2Ba].这需要捕捉所有的因素,预后的结果给予积极的治疗。gydF4y2Ba

  2. 运行模拟所需的文件可在gydF4y2Bahttp://github.com/remiroazocar/Maic2stagegydF4y2Ba.gydF4y2Ba

缩写gydF4y2Ba

2 smaic:gydF4y2Ba

两阶段匹配调整间接比较gydF4y2Ba

“肾上腺脑白质退化症”:gydF4y2Ba

总体数据gydF4y2Ba

ESE:gydF4y2Ba

经验标准误差gydF4y2Ba

ESS:gydF4y2Ba

有效样本量gydF4y2Ba

IPD:gydF4y2Ba

患者个人资料gydF4y2Ba

水平:gydF4y2Ba

卫生技术评估gydF4y2Ba

MAIC:gydF4y2Ba

匹配调整的间接比较gydF4y2Ba

MCSE:gydF4y2Ba

蒙特卡罗标准误差gydF4y2Ba

均方误差:gydF4y2Ba

均方误差gydF4y2Ba

皮科:gydF4y2Ba

人群,干预,比较,结果gydF4y2Ba

个随机对照试验:gydF4y2Ba

随机对照试验gydF4y2Ba

T-MAIC:gydF4y2Ba

截断匹配调整的间接比较gydF4y2Ba

T-2SMAIC:gydF4y2Ba

截断的两阶段匹配调整间接比较gydF4y2Ba

参考文献gydF4y2Ba

  1. Vreman RA, Naci H, Goettsch WG, Mantel-Teeuwisse AK, Schneeweiss SG, Leufkens HG, Kesselheim AS。不确定性下的决策:比较美国和欧洲药品的监管和卫生技术评估评论。临床药物学杂志2020;108(2): 350 - 7。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  2. Sutton A, Ades A, Cooper N, Abrams K.采用间接和混合处理比较进行技术评估。药物经济学。2008;26日(9):753 - 67。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  3. 布赫HC,盖亚特GH,格里菲斯LE,沃尔特SD。随机对照试验meta分析中直接和间接治疗比较的结果。临床流行病学杂志,1997;(6): 683 - 91。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  4. Dias S, Sutton AJ, Ades A, Welton NJ。决策的证据综合2:随机对照试验的成对和网络元分析的广义线性建模框架。2013年12月制作;33(5): 607 - 17所示。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  5. Phillippo D, Ades T, Dias S, Palmer S, Abrams KR, Welton N. Nice dsu技术支持文件18:提交Nice的人口调整间接比较方法。谢菲尔德:NICE决策支持部门;2016.gydF4y2Ba

  6. Phillippo DM, Ades AE, Dias S, Palmer S, Abrams KR, Welton NJ。卫生技术评价中人口调整的间接比较方法。2018年12月制作;38(2): 200 - 11所示。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  7. Remiro-Azócar A, Heath A, Baio G.有限获取个体患者数据的人口调整方法:综述和模拟研究。Res Synth Methods. 2021;12(6): 750 - 75。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  8. Remiro-Azócar A, Heath A, Baio G.合并边际和条件处理效果:对“评估锚定间接比较的人口调整方法的性能:模拟研究”的评论。统计医学2021年;40(11): 2753 - 8。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  9. Remiro-Azócar A, Heath A, Baio G.锚定间接治疗比较中的效应修正:对“匹配调整间接比较:应用于时间-事件数据”的评论。统计医学2022;41(8): 1541 - 53年。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  10. 菲利普DM, Dias S, Elsada A, Ades A, Welton NJ。间接比较的人口调整方法:国家健康和护理卓越技术评价研究所的审查。国际技术评估卫生保健杂志,2019;35(3):221-8。gydF4y2Ba

  11. Signorovitch JE, Wu EQ, Andrew PY, Gerrits CM, Kantor E, Bao Y, Gupta SR, Mulani PM。没有正面试验的比较效果。药物经济学。2010;28日(10):935 - 45。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  12. Signorovitch J, Erder MH,谢娟,Sikirica V, Lu M, Hodgkins PS,吴eq .运用匹配调整间接比较的比较疗效研究:胍法辛缓释或阿托西汀治疗儿童注意缺陷/多动障碍并共病对立违抗性障碍。药物流行病学杂志,2012;21:130-7。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  13. Signorovitch JE, Sikirica V, Erder MH,谢娟,Lu M, Hodgkins PS, Betts KA, Wu EQ.匹配调整间接比较:及时比较效果研究的新工具。《价值健康》,2012年;15(6): 940 - 7。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  14. 王志刚,王志刚,王志刚。非锚定匹配调整间接比较中模型错定的影响:模拟研究结果。重视健康,2020年;23(6): 751 - 9。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  15. 程东,刘志刚,张志刚。匹配调整间接比较的统计性能:利用外部控制数据估计治疗效果。安应用统计2020年;14(4): 1806 - 33所示。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  16. 王杰。关于匹配调整的间接比较和定标估计。arXiv预印本gydF4y2BaarXiv: 2107.11687gydF4y2Ba.2021.gydF4y2Ba

  17. Petto H, Kadziola Z, Brnabic A, Saure D, Belger M.通过公共比较器进行锚定匹配调整间接比较的替代加权方法。珍视健康,2019;22(1): 85 - 91。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  18. Kühnast S, Schiffner-Rohe J, Rahnenführer J, Leverkus F.效益评价中调整和未调整间接比较方法的评价。方法新医学2017;56(03): 261 - 7。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  19. 韦伯D,詹森K, Kieser M.通过间接比较估计治疗效果的方法的比较:一项模拟研究。2020年12月制作;40(5): 644 - 54。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  20. 蒋毅,倪伟。非锚定匹配调整间接比较(maic)在具有时间-事件结果的单臂试验证据综合中的表现。BMC医学Res Methodol. 2020;20(1): 1 - 9。gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  21. 菲利普DM, Dias S, Ades A, Welton NJ。评估锚定间接比较的总体调整方法的性能:一个模拟研究。统计医学2020;39(30): 4885 - 911。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  22. Jackson D, Rhodes K, Ouwens M.执行匹配调整间接比较时的备选加权方案。Res Synth Methods. 2021;12(3): 333 - 46所示。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  23. Remiro-Azócar A, Heath A, Baio G.兼容间接治疗与有限个体患者数据比较的参数计算。arXiv预印本gydF4y2BaarXiv: 2108.12208gydF4y2Ba.2021.gydF4y2Ba

  24. Remiro-Azócar A, Heath A, Baio G.在有限患者水平数据的间接比较中回归调整治疗效果的边缘化。arXiv预印本gydF4y2BaarXiv: 2008.05951gydF4y2Ba.2020.gydF4y2Ba

  25. 菲利普DM, Dias S, Ades AE, Welton NJ。有效决策的目标估计:对“评估锚定间接比较的人口调整方法的性能:模拟研究”的评论的回应。统计医学2021年;40(11): 2759 - 63。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  26. 何德华,王志强,王志强。基于匹配的非参数前处理方法在参数因果推理中的应用。Polit Anal, 2007;15(3): 199 - 236。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  27. 鲁宾DB。使用倾向评分从大数据集中估计因果效应。安实习医师1997;127(8): 757 - 63。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  28. Belger M, Brnabic A, Kadziola Z, Petto H, Faries D.在匹配调整间接比较(maic)中纳入多项研究。《价值健康》,2015;18(3): 33。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  29. 菲利普DM, Dias S, Ades A, Welton NJ。熵平衡的等价性和匹配调整间接比较的矩量法。Res Synth Methods. 2020;11(4): 568 - 72。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  30. 埃利奥特先生,小RJ。减少调查权重的基于模型的替代方案。J Off统计2000;16(3): 191 - 210。gydF4y2Ba

    谷歌学者gydF4y2Ba

  31. 李建平,李建平。加权加权与倾向评分加权。PloS ONE。2011;6(3): 18174。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2Ba谷歌学者gydF4y2Ba

  32. Cole SR, Hernán MA。构造边际结构模型的逆概率权重。美国流行病学杂志,2008;168(6): 656 - 64。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  33. 李志强,李志强,李志强。流行病学研究中强混杂的因果推理。统计医学2012;31日(13):1380 - 404。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  34. Léger M, Chatton A, Le Borgne F, Pirracchio R, Lasocki S, Foucher Y.因果推理在接近违反积极性:方法的比较。Biom J. 2022。在出版社。gydF4y2Ba

  35. 二等水手,我是白兵。回顾处理缺失数据的逆概率加权。2013年医学统计方法;22(3): 278 - 95。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  36. 在随机高活性抗逆转录病毒治疗对意外艾滋病或死亡的影响中,校正时变不依从性的逆概率审查权重。统计医学2009;28日(12):1725 - 38。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  37. 通过倾向评分评估因果治疗效果的分层和加权:一项比较研究。2004年统计医学;23日(19):2937 - 60。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  38. 倾向评分在平均治疗效果有效半参数估计中的作用。费雪。1998;66(2):315 - 31所示。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  39. Westreich D, Edwards JK, Lesko CR, Stuart E, Cole SR.使用抽样权重逆概率试验结果的可移植性。美国流行病学杂志。2017;186(8): 1010 - 4。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  40. Dahabreh IJ, Robertson SE, Steingrimsson JA, Stuart EA, Hernan MA。将随机试验的推论扩展到新的目标人群。统计医学2020;39(14): 1999 - 2014。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  41. 刘志刚,刘志刚。数值优化。纽约:施普林格科学与商业传媒;2006.gydF4y2Ba

  42. 调查抽样。纽约:威利;1965.gydF4y2Ba

  43. 谢福林,康杰。非随机研究的平均因果效应:一个实践指南和模拟例子。《精神方法》,2008;13(4): 279。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  44. 刘志刚,刘志刚,刘志刚。流行病学研究中的边缘结构模型与因果推理。流行病学。2000;11(5): 550 - 60。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  45. Fay MP, Graubard BI。使用夹心估计器的瓦尔型试验的小样本调整。生物识别技术。2001;57(4): 1198 - 206。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  46. 陈智,凯扎尔。关于从试验推广到目标人群的方差估计。arXiv预印本gydF4y2BaarXiv: 1704.07789gydF4y2Ba.2017.gydF4y2Ba

  47. Tipton E, Hallberg K, Hedges LV, Chan W.小样本对泛化的影响:调整和经验法则。Eval Rev. 2017;41(5): 472 - 505。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  48. Raad H, Cornelius V, Chan S, Williamson E, Cro S.在具有连续结果的小人群随机对照试验中,使用倾向评分进行基线协变量调整的逆概率加权评估。BMC医学Res Methodol. 2020;20(1): 1 - 12。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  49. 夹心估计器的面向对象计算。J统计软件,2006;16:1-16。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  50. 艾福龙,李志刚,李志刚。引导的介绍。纽约:CRC出版社;1994.gydF4y2Ba

  51. Sikirica V, Findling RL, Signorovitch J, Erder MH, Dammerman R, Hodgkins P, Lu M,谢娟,吴eq .胍法辛缓释与阿托西汀治疗儿童青少年注意缺陷/多动障碍的疗效比较:应用匹配调整间接比较方法。2013;27日(11):943 - 53年。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  52. 哈特曼E,格里夫R,拉姆萨海R,谢洪j。从样本平均治疗效果到被治疗人群平均治疗效果:将实验研究与观察研究相结合,估计人群治疗效果。J R Stat Soc Ser A (Stat Soc)。2015;178(3): 757 - 78。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  53. 鲁宾DB。实验数据的随机化分析:fisher随机化检验评论。美国统计协会1980年;75(371): 591 - 3。gydF4y2Ba

    谷歌学者gydF4y2Ba

  54. 范德威勒,马爱南。多个治疗版本下的因果推断。《因果推断》2013;1(1): 1 - 20。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  55. VanderWeele TJ。关于因果推理中的一致性假设。流行病学。2009;20(6): 880 - 3。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  56. Hernán MA, VanderWeele TJ。复合治疗和因果推断的可移植性。流行病学(剑桥,马萨诸塞州)2011;22(3): 368。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  57. O 'Muircheartaigh C, Hedges LV。从非代表性实验中推广:分层倾向评分方法。J R Stat Soc Ser C(应用统计)。2014;63(2): 195 - 210。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  58. 张震,聂林,孙刚,胡哲。治疗效果校正新方法及其在非劣效性试验中的应用。生物识别技术。2016;72(1):页。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  59. 鲁道夫·柯,范德兰·MJ。跨站点的鼓励设计干预效果的稳健估计。J R统计Soc Ser B(统计方法)。2017;79(5): 1509 - 25所示。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  60. 特邀评论:实践中的积极。美国流行病学杂志,2010;171(6): 674 - 7。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  61. 因果推理的匹配方法:回顾与展望。统计科学与科学,2010;25(1): 1。gydF4y2Ba

    谷歌学者gydF4y2Ba

  62. 聂龙,张震,鲁宾D,褚娟。基于历史数据进行推理的非劣效性试验中减少潜在偏差的似然加权方法。Ann应用统计2013;7(3): 1796 - 813。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  63. Brookhart MA, Schneeweiss S, Rothman KJ, Glynn RJ, Avorn J, Stürmer t倾向评分模型的变量选择。美国流行病学杂志,2006;163(12): 1149 - 56。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  64. 肖树德,Ertefaie A.结果自适应套索:因果推断的变量选择。生物识别技术。2017;73(4): 1111 - 22所示。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  65. 罗森鲍姆公关,鲁宾DB。倾向评分在因果效应观察性研究中的中心作用。生物统计学。1983;70(1): 41-55。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  66. 临床试验中基线平衡测试。1994年统计医学;13(17): 1715 - 26所示。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  67. 李霞,丁平。再随机化与回归调整。J R统计Soc Ser B(统计方法)。2020;82(1): 241 - 68。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  68. 莫里斯TP,沃克AS,威廉姆森EJ,怀特IR。在个别随机试验中规划协变量调整方法:实用指南。试验。2022;23:328。gydF4y2Ba

  69. 威廉姆森EJ,福布斯A,怀特IR。利用倾向评分的逆概率加权来减少随机试验中的方差。统计医学2014;33(5): 721 - 37。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  70. Hernán MA, Robins JM。根据流行病学数据估计因果影响。《流行病学与社区卫生》杂志,2006;60(7): 578 - 86。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  71. 荷兰PW。统计和因果推断。美国统计协会1986;81(396): 945 - 60。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  72. 莫里斯TP,怀特IR,克劳瑟MJ。利用模拟研究评估统计方法。2019年统计医学;38(11): 2074 - 102。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  73. 团队,R Core等。R:用于统计计算的语言和环境。R统计计算基金会:维也纳;2013.gydF4y2Ba

  74. 汤普森DD,灵斯玛HF,怀特利WN,穆雷GD,斯泰尔伯格EW。协变量调整在小型和大型随机对照试验中也有类似的益处。临床流行病学杂志。2015;68(9): 1068 - 75。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  75. suukida R, Crum RM, Hong H, Stuart EA, Mojtabai R.可卡因依赖的药物治疗比较:meta分析研究中增强泛化性的方法。Int J Methods精神病学杂志2018;27(4): 1609。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  76. Susukida R, Crum RM, Stuart EA, Mojtabai R.基于网络的物质使用障碍干预的随机对照试验结果的可推广性。Am J Addict. 2018;27(3): 231 - 7。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  77. 韦伯斯特-克拉克MA, Sanoff HK, Stürmer T,孔雀欣顿S,隆德JL。外部有效性假设的诊断评估:使用转移性结直肠癌数据的一个例子。流行病学(剑桥,马萨诸塞州)2019;30(1): 103。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  78. Carpenter J, Bithell J. Bootstrap置信区间:何时,哪个,什么?医疗统计人员的实用指南。统计医学2000;19日(9):1141 - 64。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  79. Richardson WS, Wilson MC, Nishikawa J, Hayward RS,等。构建良好的临床问题:基于证据的决策的关键。Acp俱乐部。1995;123(3): 12 - 13。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  80. 王勇,王德兰,王志强,王志强。诊断并应对积极假设中的违规行为。2012年医学统计方法;21(1): 31-54。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  81. 李飞,李飞,李飞。基于重叠权值的极端倾向评分方法。美国流行病杂志。2019;188(1): 250 - 7。gydF4y2Ba

    PubMedgydF4y2Ba谷歌学者gydF4y2Ba

  82. Deeks JJ, Dinnes J, D 'Amico R, Sowden AJ, Sakarovitch C, Song F, Petticrew M, Altman D,等。评价非随机干预研究。卫生技术评估(温彻斯特,英格兰)。2003;7(27): 1 - 173。gydF4y2Ba

    谷歌学者gydF4y2Ba

  83. 肖勇,李志强,李志强。边缘结构cox模型权值截断方法的比较。流行病学方法,2013;2(1): 1 - 20。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  84. 不等圆周率的加权。J Off统计1992;8(2): 183。gydF4y2Ba

    谷歌学者gydF4y2Ba

  85. Crump RK, Hotz VJ, Imbens GW, Mitnik OA。处理平均处理效果估计的有限重叠。生物统计学。2009;96(1): 187 - 99。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  86. Austin PC, Stuart EA.在观察性研究中,使用反概率治疗加权(iptw),使用倾向评分来估计因果治疗效果,朝着最佳实践方向发展。统计医学2015;34(28): 3661 - 79。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  87. 柴巴K,河原T.使用倾向分数因果推断:陷阱和提示。流行病学杂志,2021;31:457 - 63。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  88. 罗宾斯JM, Hernán MA。对时变暴露的因果影响的估计。纵向数据分析,2009;553:599。gydF4y2Ba

    谷歌学者gydF4y2Ba

  89. 曾松,李峰,王蓉,李峰。随机临床试验中协变量调整的倾向评分加权。统计医学2021年;40(4): 842 - 58。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  90. 德赛RJ,富兰克林JM。在观察性研究中使用基于倾向评分加权的混杂调整的替代方法:从业者入门。BMJ。2019; 367: l5657。gydF4y2Ba

  91. Robins JM, Finkelstein DM.用逆概率审查加权(ipcw) log-rank检验纠正艾滋病临床试验中的不遵从性和依赖性审查。生物识别技术。2000;56(3): 779 - 88。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  92. Latimer NR, Abrams K, Lambert P, Crowther M, Wailoo A, Morden J, Akehurst R, Campbell M.随机对照试验中治疗切换的调整——一项模拟研究和简化的两阶段方法。2017年医学统计方法;26(2): 724 - 51。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  93. 菲利普DM,迪亚斯S,阿德斯A,贝尔杰M,布尔纳比奇A,沙赫特A,索雷D,卡德齐奥拉Z,威尔顿NJ。人群调整治疗比较的多水平网络元回归。J R Stat Soc Ser A (Stat Soc)。2020;183(3): 1189 - 210。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  94. Remiro-Azócar A.经人口调整的间接比较的目标估计。《医学统计》,2022年出版。gydF4y2Ba

下载参考gydF4y2Ba

致谢gydF4y2Ba

不适用。gydF4y2Ba

资金gydF4y2Ba

这项研究没有得到财政支持。gydF4y2Ba

作者信息gydF4y2Ba

作者及隶属关系gydF4y2Ba

作者gydF4y2Ba

贡献gydF4y2Ba

ARA构思研究思路,开发方法,进行分析,准备数据,撰写和审阅手稿。作者阅读并批准了最终稿。gydF4y2Ba

相应的作者gydF4y2Ba

对应到gydF4y2Ba安东尼奥Remiro-AzocargydF4y2Ba.gydF4y2Ba

道德声明gydF4y2Ba

伦理批准并同意参与gydF4y2Ba

不适用。gydF4y2Ba

发表同意书gydF4y2Ba

不适用。gydF4y2Ba

相互竞争的利益gydF4y2Ba

ARA受雇于拜耳公司。作者声明他没有竞争利益。gydF4y2Ba

额外的信息gydF4y2Ba

出版商的注意gydF4y2Ba

188博金宝app网施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。gydF4y2Ba

补充信息gydF4y2Ba

附加文件1。gydF4y2Ba

补充材料。gydF4y2Ba

权利和权限gydF4y2Ba

开放获取gydF4y2Ba本文遵循知识共享署名4.0国际许可协议,允许以任何媒介或格式使用、分享、改编、分发和复制,只要您对原作者和来源给予适当的署名,提供知识共享许可协议的链接,并注明是否有更改。本文中的图像或其他第三方材料包含在文章的创作共用许可协议中,除非在材料的信用额度中另有说明。如果材料未包含在文章的创作共用许可协议中,并且您的预期使用不被法定法规所允许或超出了允许的使用范围,您将需要直接获得版权所有者的许可。如欲查看本牌照的副本,请浏览gydF4y2Bahttp://creativecommons.org/licenses/by/4.0/gydF4y2Ba.创作共用公共领域奉献弃权书(gydF4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/gydF4y2Ba)适用于本条所提供的资料,除非在资料的信用额度中另有说明。gydF4y2Ba

转载及权限gydF4y2Ba

关于本文gydF4y2Ba

通过CrossMark验证货币和真实性gydF4y2Ba

引用本文gydF4y2Ba

Remiro-Azócar, A.两阶段匹配调整间接比较。gydF4y2BaBMC医学Res MethodolgydF4y2Ba22gydF4y2Ba, 217(2022)。https://doi.org/10.1186/s12874-022-01692-9gydF4y2Ba

下载引用gydF4y2Ba

  • 收到了gydF4y2Ba:gydF4y2Ba

  • 接受gydF4y2Ba:gydF4y2Ba

  • 发表gydF4y2Ba:gydF4y2Ba

  • DOIgydF4y2Ba:gydF4y2Bahttps://doi.org/10.1186/s12874-022-01692-9gydF4y2Ba

关键字gydF4y2Ba

  • 卫生技术评估gydF4y2Ba
  • 间接处理比较gydF4y2Ba
  • 匹配调整的间接比较gydF4y2Ba
  • 协变量调整gydF4y2Ba
  • 协变量的平衡gydF4y2Ba
  • 处理加权的逆概率gydF4y2Ba
  • 证据合成gydF4y2Ba