- 研究gydF4y2Ba
- 开放获取gydF4y2Ba
- 发表:gydF4y2Ba
基于模型的非并发控制平台试验时间趋势调整gydF4y2Ba
金宝搏网站首页体积gydF4y2Ba22gydF4y2Ba文章编号:gydF4y2Ba228gydF4y2Ba(gydF4y2Ba2022gydF4y2Ba)gydF4y2Ba
摘要gydF4y2Ba
背景gydF4y2Ba
平台试验可以评估几种实验治疗方法与对照的疗效。实验治疗的数量并不是固定的,因为随着试验的进行臂可以增加或减少。平台试验比独立的并行组试验更有效,因为使用了共享控制组。然而,对于一个在较晚时间点进入试验的治疗,对照组被分为并发控制组,包括当该治疗臂在平台上时随机控制的患者和非并发控制组,即之前随机控制的患者。在并行控制的基础上使用非并发控制可以通过增加功率和减少所需的样本量来提高试验的效率,但会由于时间趋势而引入偏差。gydF4y2Ba
方法gydF4y2Ba
我们专注于一个有两个治疗臂和一个普通对照臂的平台试验。假设第二个治疗臂在稍后添加,我们评估最近提出的基于模型的方法的鲁棒性,以适应使用非并发控制时的时间趋势。特别是,我们考虑将时间趋势建模为线性时间或阶跃函数的方法,在治疗进入或离开平台试验的时间点上有步骤。对于连续或二元结果的试验,我们调查了测试新增加的手臂的有效性的第1类错误率和威力,以及在一系列场景下治疗效果估计的偏差和均方根误差。除了各臂间时间趋势相等的场景外,我们还研究了具有不同时间趋势的设置,或者在模型的尺度中没有添加的时间趋势。gydF4y2Ba
结果gydF4y2Ba
根据来自所有处理臂的数据拟合的阶梯函数模型,只要不同处理臂的时间趋势相等,且模型尺度上的相加量相等,就可以在控制第1类误差的同时增加功率。当患者被分组随机分配到手臂时,即使时间趋势的形状偏离了步进函数,这一结论也成立。然而,如果时间趋势在两组之间有所不同,或者在模型的尺度上不能作为治疗效果的附加因素,第1类错误率可能被夸大。gydF4y2Ba
结论gydF4y2Ba
使用阶跃函数模型合并非并发控制所获得的效率可以超过潜在的偏差风险,特别是在小样本量的设置中。如果不满足时间趋势的相等性和可加性的模型假设,就可能产生这种偏差。然而,应该仔细考虑试验的具体情况、不同时间趋势的科学合理性和结果的稳健性。gydF4y2Ba
背景gydF4y2Ba
平台试验是多分支试验,允许新的试验性治疗分支随着时间的推移进入和退出试验[gydF4y2Ba1gydF4y2Ba,gydF4y2Ba2gydF4y2Ba].与单独试验相比,此类试验可以提高统计效率,因为这些试验具有灵活的特点,如因无效或疗效而尽早停止治疗,在试验过程中添加新治疗以进行试验,以及共享对照组[gydF4y2Ba3.gydF4y2Ba].在分析这类试验时,一个争议是在治疗与对照比较中使用非并发对照。对于在较晚时间点进入平台试验的实验治疗,我们将在实验治疗进入平台之前招募的对照患者表示为gydF4y2Ba非并发控制gydF4y2Ba当实验治疗是平台的一部分时,招募到对照组的患者gydF4y2Ba并发控制gydF4y2Ba针对特定的治疗部门。如果对照数据中存在时间趋势,例如由于护理标准的变化、患者人数的变化或其他外部变化(如季节性影响或大流行),则合并同期与非同期对照的未经调整的治疗-对照比较可能存在偏差[gydF4y2Ba4gydF4y2Ba- - - - - -gydF4y2Ba8gydF4y2Ba].gydF4y2Ba
作为两项可以将非并发对照纳入分析的假设试验,考虑抑郁症和非酒精性脂肪性肝炎的平台试验的设置,分别具有连续或二元结果。gydF4y2Ba
重度抑郁症平台试验。gydF4y2Ba重度抑郁障碍(MDD)是一种常见的精神障碍,是全世界因残疾而造成疾病负担和寿命缩短的主要原因[gydF4y2Ba9gydF4y2Ba].虽然有安全有效的抑郁症药物治疗方法,但仅能充分减轻约一半患者的症状[gydF4y2Ba10gydF4y2Ba].重要的是,这一领域的主要药物类别是在几十年前发现和开发的,从那以后很少有人成功地尝试开发新药物。然而,最近在临床前和早期临床研究中评估了一些具有不同假定作用机制的候选药物。因此,允许同时评估多种药物的平台试验有可能大幅加快该领域的药物开发[gydF4y2Ba11gydF4y2Ba].由于MDD试验中使用的结果类型(例如基于面谈的评分和患者报告的结果)、预期偏差和典型的大量安慰剂反应,盲法在该适应症中特别关键。考虑MDD中的一个平台试验,其中试验性治疗组与普通对照进行比较。主要终点是连续临床评分量表的变化,如蒙哥马利-Åsberg抑郁评分量表(MADRS),从基线到随机化后6周。为了减少样本量和分配到对照组的患者数量,可以考虑使用非同期对照。然而,在这种情况下,不能排除安慰剂反应的时间趋势。这种时间趋势的一个具体来源可能是预期偏差,这可能会有所不同,取决于控制的分配概率以及平台中当前处理的数量和类型。特别是,如果控制分配概率较低,且被认为很有希望的治疗方法进入平台,则预期偏差可能增加。因此,对潜在的时间趋势进行调整对于获得稳健的结果至关重要。gydF4y2Ba
非酒精性脂肪性肝炎平台试验gydF4y2Ba非酒精性脂肪性肝炎(NASH)目前是一个医疗需求高度未得到满足的领域,在欧洲和美国没有获得批准的治疗方法[gydF4y2Ba12gydF4y2Ba].为了促进和加速对NASH患者最有效和最有前途的新治疗方案的识别,可以在平台试验中测试多种潜在的新疗法及其组合。例如,考虑一个2b期平台试验,其主要疗效终点是一个二元终点,指示患者在48周时是否对治疗有反应。由于反应的确定需要在基线和研究结束时进行配对活检,患者负担高,限制样本量很重要,特别是从患者的角度来看。因此,在分析中可以考虑使用非同期对照,以减少临床试验所需的患者数量。然而,在这种情况下,也会出现时间趋势,例如,由于患者群体或护理标准的变化,也由于终点评估的可变性[gydF4y2Ba13gydF4y2Ba].gydF4y2Ba
李和沃森[gydF4y2Ba14gydF4y2Ba]研究了线性回归模型,以估计在连续数据试验中的治疗效果,其中包括一个与时间相对应的因素,以调整潜在的时间趋势。他们在一项模拟研究中证明,即使真实的时间趋势是线性的而不是逐步的,使用通过逐步函数调整时间趋势的回归模型也会导致无偏检验。如果线性回归模型拟合被测试的实验治疗组和对照组的数据以及所有其他试验组的数据,这是成立的。然而,只有当模型基于所有试验臂的数据拟合时,与仅使用并发控制的分析相比,包含非并发控制提高了功率。gydF4y2Ba
在本文中,我们推导了基于模型的时间趋势调整控制第1类错误率并增加处理-对照比较的统计能力的条件。特别地,我们考虑了两期平台试验的简单设置,即从单一治疗开始,并在第二期添加另一个治疗组的对照组。gydF4y2Ba
我们考虑回归模型拟合了来自所有部门的数据和建模一个共同的逐步时间趋势。对于这个模型,我们表明治疗效果的估计是无偏的gydF4y2Ba如果所有分支的时间趋势在模型尺度上相等且相加gydF4y2Ba.这是成立的,不管具体的功能形式的时代趋势。对于相关的假设检验,我们表明对于二元端点和逻辑回归模型,它们在上述假设下渐近地控制第1类错误率。对于用标准线性模型分析的连续数据,如果使用块随机,第1类误差控制保持渐近。我们表明,在上述条件下,与仅基于并发控制的分析相比,结合非并发控制的基于模型的分析增加了试验的力量和治疗效果估计的精度。gydF4y2Ba
我们还研究了在不同处理单元的时间趋势不同或在模型尺度上不相加时方法的特性。我们通过模拟表明,跨组的异质时间趋势可能导致第1类错误率和有偏见的治疗效果估计的膨胀。此外,对于二进制数据和逻辑回归模型,其中检验和估计过程的有效性依赖于回归模型的对数比值标度上的等时间趋势假设,我们证明了其他标度上的等时间趋势不能保证第1类误差控制。此外,我们考虑了可选的回归模型,如模型允许不同治疗之间的逐步时间趋势,或回归模型只适合被测试治疗组的数据。然而,它们只是略微增加了假设检验的力量(只是由于线性模型的自由度更大)。gydF4y2Ba
验证性临床试验(主要是三期)和早期试验的目标和要求是不同的。这扩展到早期和后期的平台试验。然而,尽管存在这些差异,我们在本文中所讨论的问题都与处理累积数据中的潜在时间趋势有关。我们选择使用1型误差控制框架来说明它们,但也调查了治疗效果估计的偏差。这些考虑在药物开发的不同阶段具有不同的重要性,但在任何阶段都不应被忽视。gydF4y2Ba
方法gydF4y2Ba
为了掌握使用非并发控件的原理,分析一个简化的模型就足够了。因此,我们考虑一个随机的、平行的组平台试验,最初比较单一的实验治疗(gydF4y2BakgydF4y2Ba=1)到控件(gydF4y2BakgydF4y2Ba=0),如[gydF4y2Ba14gydF4y2Ba].后gydF4y2BaNgydF4y2Ba1gydF4y2Ba新的实验治疗部门(gydF4y2BakgydF4y2Ba=2)添加到试验中,目的是将新添加的臂2与普通对照进行比较。因此审判分为两个阶段(gydF4y2Ba年代gydF4y2Ba=1,2)增加新臂前后。见图。gydF4y2Ba1gydF4y2Ba为设计的说明。此外,让gydF4y2BaNgydF4y2Ba2gydF4y2Ba表示周期2和的总样本量gydF4y2BaNgydF4y2Ba=gydF4y2BaNgydF4y2Ba1gydF4y2Ba+gydF4y2BaNgydF4y2Ba2gydF4y2Ba总体样本量。gydF4y2Ba
我们将重点放在假设检验和治疗效果评估,比较治疗2与对照组。根据不同的调整方法,我们评估了在加入非并发控制时时间趋势对推理有效性的影响。我们基于回归模型(时间趋势模型为阶跃函数)来评估和测试处理2与对照的治疗效果。我们考虑[中研究的回归模型]gydF4y2Ba14gydF4y2Ba]用于连续数据,与来自所有治疗组和对照组的数据相匹配。此外,我们还研究了一个模型,包括治疗和时间段之间的相互作用,以考虑到与其他组相比,治疗组1的时间趋势不同。此外,我们研究了对二进制数据的扩展。让gydF4y2BaYgydF4y2BajgydF4y2Ba表示病人的反应(二进制或连续)gydF4y2BajgydF4y2Ba,在那里gydF4y2BajgydF4y2Ba= 1,…,gydF4y2BaNgydF4y2Ba患者指数是否与患者进入试验的顺序相对应gydF4y2BakgydF4y2BajgydF4y2Ba成为治疗的病人gydF4y2BajgydF4y2Ba收到(gydF4y2BakgydF4y2BajgydF4y2Ba= 0, 1, 2)。gydF4y2Ba
基于模型的时间趋势调整gydF4y2Ba
为了评估治疗2与对照组的治疗效果,我们拟合了一个回归模型,根据来自所有治疗部门的数据,通过阶梯函数调整时间gydF4y2Ba
在哪里gydF4y2BaηgydF4y2Ba0gydF4y2Ba是对照组在第一阶段的反应,gydF4y2BaθgydF4y2BakgydF4y2Ba治疗效果好吗gydF4y2BakgydF4y2Ba与对照组相比gydF4y2BaνgydF4y2Ba表示周期1和2之间的阶梯式时间效应。连续的数据,gydF4y2BaggydF4y2Ba(·)为恒等函数,我们拟合(中指定的标准线性模型gydF4y2Ba1gydF4y2Ba),并执行相应的t检验来检验片面的零假设gydF4y2BaHgydF4y2Ba02gydF4y2Ba:gydF4y2BaθgydF4y2Ba2gydF4y2Ba≤0(假设值越大,结果越好)。对于二进制数据,gydF4y2BaggydF4y2Ba(·)为logit链接函数,gydF4y2BaHgydF4y2Ba02gydF4y2Ba基于逻辑回归进行检验。还要注意,阶梯式函数,gydF4y2Ba我gydF4y2Ba(gydF4y2BajgydF4y2Ba>gydF4y2BaNgydF4y2Ba1gydF4y2Ba),构成了以时间段为层的分层模型,层间具有共同的处理效果。gydF4y2Ba
模型(gydF4y2Ba1gydF4y2Ba)符合所有治疗部门的共同时间趋势。为了放松这一假设,我们考虑了一个附加的模型,该模型包含了相互作用效应,考虑到治疗组1的时间效应与对照组和治疗组2的时间效应不同。得到的模型由gydF4y2Ba
由于在控制和处理2中建模了一个共同的时间趋势,在这个模型中,处理2的治疗效果由gydF4y2BaθgydF4y2Ba2gydF4y2Ba.还要注意,在上述模型中,时间对响应的影响对于连续数据是加性的,对于二进制数据是乘性的。gydF4y2Ba
仅基于并发控件和基于天真的池化控件的测试gydF4y2Ba
为了进行比较,我们还考虑了不考虑时间趋势的集合检验,以及基于并发控制的检验,仅对连续数据使用t检验和对二进制数据使用逻辑回归(带因子处理)将处理2与对照组进行比较。我们使用处理2的数据和合并并发和非并发控制(合并分析)或仅使用并发控制数据(单独分析)应用这些测试。gydF4y2Ba
结果gydF4y2Ba
在本节中,我们将报告基于模型的评估和基于模型(gydF4y2Ba1gydF4y2Ba).在“gydF4y2Ba基于模型的周期调整下的估计gydF4y2Ba部分,我们将线性模型的治疗2的治疗效果估计重写为每组周期均值的加权和。基于这种表示,我们推导出该估计量与仅基于并发控制的估计量相比方差的减少。gydF4y2Ba
在“gydF4y2Ba关于估计量性质和假设检验的分析结果gydF4y2Ba部分,我们进一步讨论了基于模型的估计量和检验的性质,假设时间趋势在模型标度上跨处理组和添加剂是相等的。我们证明了基于模型的治疗效果估计是无偏的,即使时间效应的形状被错误地指定并偏离了阶跃函数。此外,我们给出了随机化或检验过程的条件,以保证控制基于模型的假设检验的第1类错误率。gydF4y2Ba
最后在“gydF4y2Ba通过模拟评估方法gydF4y2Ba”部分,我们说明了模拟研究的程序,并量化了基于模型的假设检验中1型误差的潜在膨胀,如果时间趋势在治疗组之间不相等或在模型尺度上不相加。gydF4y2Ba
基于模型的方法中的测试和估计gydF4y2Ba
基于模型的周期调整下的估计gydF4y2Ba
为了说明模型(gydF4y2Ba1gydF4y2Ba)和(gydF4y2Ba2gydF4y2Ba)在调整潜在的时间趋势时,估计治疗2的治疗效果与对照相比,我们将回归模型估计量写成每组周期估计量的加权和[gydF4y2Ba14gydF4y2Ba,gydF4y2Ba15gydF4y2Ba].让gydF4y2BangydF4y2BakgydF4y2Ba,gydF4y2Ba年代gydF4y2Ba而且gydF4y2Ba酒吧\ (\ {y} _ {k s} \)gydF4y2Ba为每臂和周期的观测的样本量和样本均值(gydF4y2BakgydF4y2Ba= 0, 1, 2,gydF4y2Ba年代gydF4y2Ba= 1, 2)。因此,在我们的设定中,gydF4y2BangydF4y2BakgydF4y2Ba,gydF4y2Ba年代gydF4y2Ba≥1除了gydF4y2BangydF4y2Ba2、1gydF4y2Ba= 0,gydF4y2Ba\ (N_{年代}= \总和_ {k = 0, 1, 2} N_ {k s} \)gydF4y2Ba.的估计gydF4y2BaθgydF4y2Ba2gydF4y2Ba是由gydF4y2Ba
与重量gydF4y2BawgydF4y2BakgydF4y2Ba,gydF4y2Ba年代gydF4y2Ba下面的定义。权重的推导可在补充材料(gydF4y2Ba一个节gydF4y2Ba).gydF4y2Ba
首先注意,对于模型(gydF4y2Ba2gydF4y2Ba)以所有数据为基础,并包括一个交互效应,即矩阵gydF4y2BawgydF4y2BakgydF4y2Ba,gydF4y2Ba年代gydF4y2Ba是由gydF4y2Ba

这gydF4y2Ba帽子\(\ \θ_{2}= \酒吧{y} _{2,} - \酒吧{y} _ {0, 2} \)gydF4y2Ba,因此,非并发控制不有助于治疗效果估计。因此,我们在本节中不再进一步考虑这个模型。gydF4y2Ba
对模型(gydF4y2Ba1gydF4y2Ba),基于所有治疗臂的数据,并通过一个阶跃函数(权重矩阵)调整时间gydF4y2BawgydF4y2BakgydF4y2Ba,gydF4y2Ba年代gydF4y2Ba是由gydF4y2Ba

因此gydF4y2Ba
因此,治疗效果是通过治疗组2的平均值的差异和基于模型的估计对照反应在第2期,由gydF4y2Ba
注意,这个估计值是第2期对照反应的平均值和第1期对照反应的平均值的加权平均值,并根据第1期处理估计的时间趋势进行了调整。非并发控制的权重由gydF4y2BaϱgydF4y2Ba.与仅基于并发控制的估计量相比,该估计量的方差相对减少由gydF4y2Ba
因此,在非同期对照患者数量中,在第1部分的同期患者数量中,在第1部分的非同期患者数量中,方差的减少正在增加。特别是,保持固定的并发控制的数量,并假设gydF4y2BangydF4y2Ba0 1gydF4y2Ba→gydF4y2Ba∞gydF4y2Ba,gydF4y2BangydF4y2Ba1, - 1gydF4y2Ba→gydF4y2Ba∞gydF4y2Ba,gydF4y2BangydF4y2Ba1、2gydF4y2Ba→gydF4y2Ba∞gydF4y2Ba,我们有gydF4y2BaϱgydF4y2Ba→1。另一方面,增加同期对照患者的数量但保持其他样本量不变gydF4y2BaϱgydF4y2Ba→0gydF4y2BangydF4y2Ba0, 2gydF4y2Ba→gydF4y2Ba∞gydF4y2Ba,因此渐近不发生约简。gydF4y2Ba
现在考虑一个具体的例子,在每个时间段中,第0和第1手臂的随机程度相等,也就是说,gydF4y2BangydF4y2Ba0 1gydF4y2Ba=gydF4y2BangydF4y2Ba1, - 1gydF4y2Ba而且gydF4y2BangydF4y2Ba0, 2gydF4y2Ba=gydF4y2BangydF4y2Ba1、2gydF4y2Ba但在第二臂上可能有所不同,所以gydF4y2BangydF4y2Ba2、2gydF4y2Ba≥1是任意的。那么,方差的减少是gydF4y2Ba\ \ varrho = \压裂{1}({2}\ cdot \压裂{n_ {0,1}} {n_ {0,1} + n_ {0, 2}} \)gydF4y2Ba因此与非并发控制的比例占控制总数的比例成正比。特别是,上面的简化用1/2 (asgydF4y2BangydF4y2Ba0 1gydF4y2Ba→gydF4y2Ba∞gydF4y2Ba).例如,在这个例子中gydF4y2BangydF4y2Ba0 1gydF4y2Ba=gydF4y2BangydF4y2Ba0, 2gydF4y2Ba=gydF4y2BangydF4y2Ba1, - 1gydF4y2Ba=gydF4y2BangydF4y2Ba1、2gydF4y2Ba=gydF4y2BangydF4y2Ba2、2gydF4y2Ba/2被认为是[gydF4y2Ba14gydF4y2Ba的权重和治疗效果估计值由gydF4y2Ba

而且gydF4y2Ba
基于模型的第2期控制响应估计有25gydF4y2Ba%gydF4y2Ba与仅基于并发控制的估计量相比,方差更低。举个例子,在相等随机化的情况下权重是如何定义的对于手臂2,也就是,gydF4y2BangydF4y2Ba0, 2gydF4y2Ba=gydF4y2BangydF4y2Ba1、2gydF4y2Ba=gydF4y2BangydF4y2Ba2、2gydF4y2Ba,可在补充材料(B节)中查阅。gydF4y2Ba
所以当我们在(中使用模型时我们实际上在估算什么gydF4y2Ba1gydF4y2Ba)和(gydF4y2Ba2gydF4y2Ba)为第2期治疗组对对照组的治疗效果的加权平均值,以及两期间治疗时间相互作用的加权平均值。gydF4y2Ba
关于估计量性质和假设检验的分析结果gydF4y2Ba
我们推导了线性回归和逻辑回归模型(gydF4y2Ba1gydF4y2Ba),假设各组之间的时间趋势是相等的,并在模型标度上相加,以便根据模型生成数据gydF4y2Ba
在哪里gydF4y2BaYgydF4y2BajgydF4y2Ba,gydF4y2BaggydF4y2Ba(),gydF4y2BaηgydF4y2Ba0gydF4y2Ba而且gydF4y2Ba\ \(θ_ {k_ {j}} \)gydF4y2Ba分别指连续或二进制响应、链接函数(分别为连续或二进制响应的恒等函数和logit函数)、控制响应和处理效果,如(gydF4y2Ba1gydF4y2Ba)和(gydF4y2Ba2gydF4y2Ba).对于连续数据,我们进一步假设响应中的误差项是相同独立的正态分布,均值为零,方差为等。这个词gydF4y2BafgydF4y2Ba(·)表示时间趋势函数,gydF4y2BatgydF4y2BajgydF4y2Ba日历是病人的时候吗gydF4y2BajgydF4y2Ba参加了试验。注意,当gydF4y2BafgydF4y2Ba(·)为阶跃函数,在周期1末尾有阶跃,则建模(gydF4y2Ba1gydF4y2Ba)是正确的。否则,(gydF4y2Ba1gydF4y2Ba)是一个错误指定的模型,因为没有正确地模拟时间趋势的函数形式。gydF4y2Ba
对于连续数据,模型估计gydF4y2Baθ_{2}\帽子(\ \ \)gydF4y2Ba是一个无偏的估计gydF4y2BaθgydF4y2Ba2gydF4y2Ba,即使在错误规范时间趋势模式的情况下,即,如果gydF4y2BafgydF4y2Ba(·)不是阶跃函数(参见gydF4y2Ba部分CgydF4y2Ba在补充材料中作证明)。此外,如“gydF4y2Ba基于模型的周期调整下的估计gydF4y2Ba部分,基于所有数据的基于模型的估计,与单独分析相比,减少了治疗效果估计器的方差,因此导致功率的增加。但是,通过检查(gydF4y2Ba3.gydF4y2Ba),很明显,如果处理1的时间趋势与对照的时间趋势不同,估计将有偏差。gydF4y2Ba
关于测试,对于连续端点和给定的时间趋势模式的函数形式是正确指定的,我们首先注意到权重gydF4y2BaϱgydF4y2Ba在(gydF4y2Ba3.gydF4y2Ba的方差gydF4y2Baθ_{2}\帽子(\ \ \)gydF4y2Ba最小化了。然而,如果错误地指定时间趋势模式,并使用简单的随机化或随机分配,拟合模型的残差(gydF4y2Ba1gydF4y2Ba)将取决于数据生成模型中时间趋势的具体形态(gydF4y2Ba4gydF4y2Ba).特别是,剩余方差可能不是随时间变化的常数,因此两个时期的总体方差可能不同。由于线性模型假定同方差,这可能导致对的标准误差的低估gydF4y2Baθ_{2}\帽子(\ \ \)gydF4y2Ba并因此对一类错误率膨胀的相应测试。看到gydF4y2Ba部分F.1gydF4y2Ba在一个例子的补充材料中,类型1的错误率被夸大了。gydF4y2Ba
为了获得具有连续端点的试验的无偏测试过程,我们提出了两种方法。第一种方法是选择一种随时间变化的随机化方法。我们可以通过在随机化过程中通过块随机化对日历时间进行分层来实现这一点。然后,由于随机分配到同一区块的患者大约在同一日历时间登记,所以渐近地,时间趋势不会在估计中引入额外的变化。分组随机化相当于分层随机化,即对一个重要的危险因素进行分层。在这种情况下,分组随机化与按时间间隔分层随机化相一致。然而,众所周知,分层随机化之后的分析没有对分层因子进行调整,导致方差高估[gydF4y2Ba16gydF4y2Ba].因此,得到的测试将是保守的。如果时间趋势非常强,这可能会导致过于保守的测试。另一种方法是考虑不同时期之间的差异,并分别估计它们。gydF4y2Ba
另一方面,当使用二元端点时,即使在趋势模式的错误规范下,方差估计量也是一致的,gydF4y2BafgydF4y2Ba(·)。所以,在这种情况下,治疗效果估计量是渐进无偏的,假设检验也是。gydF4y2Ba
通过模拟评估方法gydF4y2Ba
我们进行了一项模拟研究,以量化在广泛的场景下所考虑的方法在效率方面的收益和潜在偏差。我们调查了满足模型假设的设置,以及时间趋势没有阶梯式形状或不同治疗组之间的时间趋势不同的错误指定的模型设置。特别是,我们调查了上述分析方法的性能与类型1错误率和统计能力的检验gydF4y2BaHgydF4y2Ba02gydF4y2Ba:gydF4y2BaθgydF4y2Ba2gydF4y2Ba=0,以及处理2的效果估计量的偏差和均方误差,gydF4y2BaθgydF4y2Ba2gydF4y2Ba.gydF4y2Ba
设计gydF4y2Ba
我们模拟了第2节中描述的平台试验的数据,考虑到数据生成模型(gydF4y2Ba4gydF4y2Ba).我们认为患者索引对应于患者登记的顺序,并且在每个单位时间内,有且只有一名患者进入试验,因此,gydF4y2BatgydF4y2BajgydF4y2Ba=gydF4y2BajgydF4y2Ba为gydF4y2BajgydF4y2Ba= 1,…,gydF4y2BaNgydF4y2Ba.我们假设每个手臂的样本量相等,在周期1和2中对手臂的分配分别为1:1和2:1:1。此外,患者在分组随机后被分配到各臂组,如“gydF4y2Ba关于估计量性质和假设检验的分析结果gydF4y2Ba”一节。在第一阶段,我们使用的块大小为4,而在第二阶段,块大小为12。我们考虑时间趋势函数的三种模式:gydF4y2Ba
线性时间趋势gydF4y2Ba\(f(j) = \lambda _{k_{j}}\frac {(j-1)}{(N-1)}\)gydF4y2Ba;gydF4y2Ba
一个循序渐进的时间趋势gydF4y2Ba\(f(j) = \lambda _{k_{j}} I(j> N_{1})\)gydF4y2Ba;gydF4y2Ba
逆u时间趋势:gydF4y2Ba\ (f (j) = \λ_ {k_ {j}} \压裂{(j - 1)} {(n - 1)} \离开(我(j \ leq N_ {p}),我(j > N_ {p}) \) \)gydF4y2Ba;gydF4y2Ba
在哪里gydF4y2Ba\ \(λ_ {k_ {j}} \)gydF4y2Ba量化手臂时间趋势的强度gydF4y2BakgydF4y2BajgydF4y2Ba而且gydF4y2Ba我gydF4y2Ba(·)指标函数。注意,如果gydF4y2Ba\ \(λ_ {k_ {j}} \)gydF4y2Ba根据不同的治疗臂取不同的值,那么我们就会得到不同的时间趋势。对于倒u型时间趋势,gydF4y2BaNgydF4y2BapgydF4y2Ba表示趋势由正转为负的点。对于这一点,我们考虑了三个不同的值,它可以是当第1期一半的患者已经被招募(gydF4y2BaNgydF4y2BapgydF4y2Ba=gydF4y2BaNgydF4y2Ba1gydF4y2Ba/2),在第1期患者入组后和第2期开始前(gydF4y2BaNgydF4y2BapgydF4y2Ba=gydF4y2BaNgydF4y2Ba1gydF4y2Ba),或当第2期患者中有一半已被招募(gydF4y2BaNgydF4y2BapgydF4y2Ba=gydF4y2BaNgydF4y2Ba1gydF4y2Ba+gydF4y2BaNgydF4y2Ba2gydF4y2Ba/ 2)。在主要稿件中,我们展示了场景的结果gydF4y2BaNgydF4y2BapgydF4y2Ba=gydF4y2BaNgydF4y2Ba1gydF4y2Ba+gydF4y2BaNgydF4y2Ba2gydF4y2Ba/ 2。的结果gydF4y2BaNgydF4y2BapgydF4y2Ba=gydF4y2BaNgydF4y2Ba1gydF4y2Ba/ 2,gydF4y2BaNgydF4y2Ba1gydF4y2Ba可以在补充材料中找到。请注意,负gydF4y2Ba\ \(λ_ {k_ {j}} \)gydF4y2Ba对应于u型(而不是反u型)趋势。数字gydF4y2Ba2gydF4y2Ba说明了这些模式下的均值变化。在补充材料中,我们还展示了考虑随机而不是固定的进入时间gydF4y2BatgydF4y2BajgydF4y2Ba不会明显改变结果。gydF4y2Ba
对于处理1和对照组,每组的样本量设置为125。阶段2中处理2的样本量为250(使其样本量与处理1的总体样本量相匹配)。对于连续端点,我们假设正态分布残差方差相等gydF4y2BaσgydF4y2Ba2gydF4y2Ba治疗组为1,对照组为0 (gydF4y2BaηgydF4y2Ba0gydF4y2Ba=0),零假设下的模拟试验,gydF4y2BaθgydF4y2Ba2gydF4y2Ba=0,以及备择假设gydF4y2BaθgydF4y2Ba2gydF4y2Ba= 0.25。在这两种情况下,我们都考虑了gydF4y2BaθgydF4y2Ba1gydF4y2Ba处理1 =0.25。对于这些效应量,合并t检验在2.5%的片面显著性水平上有80%的效力。对于二元终点,我们认为对照响应率为0.7,在零假设下治疗2无效gydF4y2BaθgydF4y2Ba2gydF4y2Ba=0(根据比值比gydF4y2BaOgydF4y2BaRgydF4y2Ba2gydF4y2Ba=1)或在备择假设(gydF4y2BaOgydF4y2BaRgydF4y2Ba2gydF4y2Ba=1.8),以及处理1有积极或消极影响的情况(即,gydF4y2BaθgydF4y2Ba1gydF4y2Ba> 0,gydF4y2BaθgydF4y2Ba1gydF4y2Ba分别为< 0)。通过上述针对这些场景的配置,检测优势比的能力gydF4y2BaOgydF4y2BaRgydF4y2Ba2gydF4y2Ba=1.8是80%假设概率gydF4y2BapgydF4y2Ba0gydF4y2Ba=0.7在2.5%显著性水平上使用合并z检验。最后,我们模拟了前面提到的三种时间趋势模式,假设所有治疗组的时间趋势相等(gydF4y2BaλgydF4y2BakgydF4y2Ba=gydF4y2BaλgydF4y2Ba,因为gydF4y2BakgydF4y2Ba=0,1,2),处理2与对照组和处理1组之间的等时间趋势(gydF4y2BaλgydF4y2Ba0gydF4y2Ba=gydF4y2BaλgydF4y2Ba2gydF4y2Ba≠gydF4y2BaλgydF4y2Ba1gydF4y2Ba).我们为每个场景模拟了10万个重复,以获得处理效果的第1类误差、功率和偏差的估计。gydF4y2Ba
仿真结果gydF4y2Ba
在各治疗组的时间趋势相等的情况下(即gydF4y2BaλgydF4y2BakgydF4y2Ba=gydF4y2BaλgydF4y2Ba为gydF4y2BakgydF4y2Ba=0,1,2),所有拟合时间趋势为阶跃函数的回归模型控制的第1类错误率gydF4y2BaHgydF4y2Ba02gydF4y2Ba并在我们调查的例子中得出无偏效应估计。如果真正的时间趋势是一个阶跃函数,以及如果它是线性的或u倒的,这是成立的。对于无交互项的模型(gydF4y2Ba1gydF4y2Ba),证实了上述部分的理论考虑以及[gydF4y2Ba14gydF4y2Ba].此外,基于(的测试gydF4y2Ba1gydF4y2Ba)导致与仅使用并发控制的单独分析相比,性能有所提高(参见gydF4y2Ba无花果S1。gydF4y2Ba在补充材料中)。类似地,对于二进制数据,我们注意到在各臂的时间趋势相等且由(给出的设置中)gydF4y2Ba4gydF4y2Ba),对应逻辑回归模型的检验和估计量控制错误率,与仅使用并发控制的单独分析相比,我们看到了一个改进的功率。(gydF4y2Ba图S7gydF4y2Ba在补充材料中。)gydF4y2Ba
相反,如果处理1的时间趋势与控制臂的时间趋势不同,则不再保证对第1类误差的控制。例如,假设表中的设置gydF4y2Ba1gydF4y2Ba对照组的平均结果从第一阶段到第二阶段增加了0.1。然后,用类型1的错误率进行测试gydF4y2BaHgydF4y2Ba02gydF4y2Ba取决于治疗1的平均结果的增加。让我们考虑手臂1在周期2中的平均结果的不同值,如图2所示。gydF4y2Ba3.gydF4y2Ba.如果治疗组1从第1期到第2期的平均结局增加低于对照组,则1型错误率可能大幅膨胀,达到1型错误率大于0.05gydF4y2Ba%gydF4y2Ba.如果它大于0.1,该过程将变得严格保守,获得类型1的错误率低于0.01,功率将受到不利影响(见图。gydF4y2Ba3.gydF4y2Ba).事实上,治疗效果的估计会根据治疗1的时间趋势有积极或消极的偏见。此外,如果不是逐步的时间趋势,时间趋势的模式是线性或反u,观察到相同的行为,如图所示。gydF4y2Ba4gydF4y2Ba当改变手臂1的时间趋势强度时,固定对照组和手臂2的时间趋势。gydF4y2Ba
第一类错误率和拒绝功率gydF4y2BaHgydF4y2Ba02gydF4y2Ba对于连续终点,在第二阶段的第1治疗组中,相对于平均值出现阶梯式趋势,根据所使用的模型(见“gydF4y2Ba方法gydF4y2Ba部分)用于“gydF4y2Ba设计gydF4y2Ba,并在表中描述gydF4y2Ba1gydF4y2Ba.alltc -步进是指使用所有治疗数据和控制并通过步进函数调整时间的模型(见gydF4y2Ba1gydF4y2Ba)), ALLTCI模型使用所有治疗数据和控制与时间和治疗臂之间的交互作用,并通过步进函数调整时间(见(gydF4y2Ba2gydF4y2Ba)),以及池法和单独法分别是使用并发和非并发对照数据以及仅使用并发对照数据将处理2与对照进行比较的t检验。注意,用于ALLTCI-Step的行和单独的方法是重叠的gydF4y2Ba
第一类错误率和拒绝功率gydF4y2BaHgydF4y2Ba02gydF4y2Ba对于存在线性、阶梯式和倒u型时间趋势的连续端点gydF4y2BaλgydF4y2Ba0gydF4y2Ba=gydF4y2BaλgydF4y2Ba2gydF4y2Ba=0.1)相对于治疗组1的时间趋势强度(gydF4y2BaλgydF4y2Ba1gydF4y2Ba)根据所使用的模型(见“gydF4y2Ba方法gydF4y2Ba部分)用于“gydF4y2Ba设计gydF4y2Ba”一节。alltc -步进是指使用所有治疗数据和控制并通过步进函数调整时间的模型(见gydF4y2Ba1gydF4y2Ba)), ALLTCI指的是使用所有治疗数据和控制的模型,与时间和治疗臂之间的交互作用,并通过步进函数调整时间(见gydF4y2Ba2gydF4y2Ba)),以及池法和单独法分别是使用并发和非并发对照数据以及仅使用并发对照数据将处理2与对照进行比较的t检验。ALLTCI-Step和单独的方法是重叠的gydF4y2Ba
当考虑控制组从第1期到第2期的响应率的固定增量和改变治疗组1的响应率时,可以在二进制数据中发现类似的结果(见表)gydF4y2Ba2gydF4y2Ba).如果在乘法比值比尺度上,处理1的时间趋势小于控制臂的时间趋势,则第1类错误率可能被夸大。如果时间趋势更大,则检验变得严格保守(并失去效力)(见图中的第二列。gydF4y2Ba5gydF4y2Ba).请注意,这意味着——对于处理1,当对照和处理1在风险比或风险差异尺度上的时间趋势相等时(图中蓝色和绿色的竖线),备选方案成立。gydF4y2Ba5gydF4y2Ba,分别),则不保持处理2试验的第1类误差。gydF4y2Ba
第一类错误率和拒绝功率gydF4y2BaHgydF4y2Ba02gydF4y2Ba对于存在阶梯式趋势的二元端点(对于gydF4y2BaλgydF4y2Ba0gydF4y2Ba=gydF4y2BaλgydF4y2Ba2gydF4y2Ba和不同的gydF4y2BaλgydF4y2Ba1gydF4y2Ba)与第二期治疗组1的有效率比较,并根据所使用的模型(见“gydF4y2Ba方法gydF4y2Ba部分)用于“gydF4y2Ba设计gydF4y2Ba章节,并在表中描述gydF4y2Ba2gydF4y2Ba而且gydF4y2Ba3.gydF4y2Ba.垂直线指的是在优势比(OR)、风险差(RD)和相对风险(RR)量表上,双臂的时间趋势相等的情况。alltc -步进是指使用所有治疗数据和控制并通过步进函数调整时间的模型(见gydF4y2Ba1gydF4y2Ba)), ALLTCI指的是使用所有治疗数据和控制的模型,与时间和治疗臂之间的交互作用,并通过步进函数调整时间(见gydF4y2Ba2gydF4y2Ba)),池法和分离法分别是指不调整时间的逻辑回归模型,将处理2与使用并发和非并发控制数据以及仅使用并发控制数据的对照进行比较。ALLTCI-Step和单独的方法是重叠的gydF4y2Ba
如果我们考虑与上面相同的情况,但在处理1中没有产生有益的影响,与对照相比,这显示出了负面的影响(见表gydF4y2Ba3.gydF4y2Ba),观察到同样的行为,但通胀要高得多,甚至达到了0.10以上的水平(见图第一列)。gydF4y2Ba5gydF4y2Ba).此外,当趋势是线性或反u,而不是如图所示的分段时,可以观察到类似的结果。gydF4y2Ba6gydF4y2Ba.然而,请注意,由于在我们的模拟中,趋势的强度(gydF4y2BaλgydF4y2Ba1gydF4y2Ba)在所有三种模式中取相同的值,它对分段趋势的影响更大,因为在具有连续时间趋势的两种情况下,变化更渐进。gydF4y2Ba
第一类错误率和拒绝功率gydF4y2BaHgydF4y2Ba02gydF4y2Ba对于存在线性、阶梯式和倒u时间趋势的二元端点(对于gydF4y2BaλgydF4y2Ba0gydF4y2Ba=gydF4y2BaλgydF4y2Ba2gydF4y2Ba)相对于治疗组1的时间趋势强度(gydF4y2BaλgydF4y2Ba1gydF4y2Ba)和根据所使用的模型(见“gydF4y2Ba方法gydF4y2Ba部分)用于“gydF4y2Ba设计gydF4y2Ba”一节。alltc -步进是指使用所有治疗数据和控制并通过步进函数调整时间的模型(见gydF4y2Ba1gydF4y2Ba)), ALLTCI指的是使用所有治疗数据和控制的模型,与时间和治疗臂之间的交互作用,并通过步进函数调整时间(见gydF4y2Ba2gydF4y2Ba)),池法和分离法分别是指不调整时间的逻辑回归模型,将处理2与使用并发和非并发控制数据以及仅使用并发控制数据的对照进行比较。ALLTCI-Step和单独的方法是重叠的gydF4y2Ba
解决第1类错误膨胀的一种方法是应用扩展模型(gydF4y2Ba2gydF4y2Ba),包括疗程与治疗之间的相互作用期限。的确,如图所示。gydF4y2Ba4gydF4y2Ba而且gydF4y2Ba6gydF4y2Ba,对于上面的例子,扩展模型控制类型1的错误率,无论是连续数据还是二进制数据。但是,与仅基于并发数据的分析相比,应用该模型并没有带来相应的功率改进。事实上,对于线性和逻辑回归模型,非并发对照的数据并不有助于治疗效果的估计。然而,对于线性模型,它们有助于方差估计。gydF4y2Ba
注意,在这个模拟研究中,我们关注的是使用基于模型的调整时,时间趋势如何影响操作特性。然而,模拟研究中没有考虑到的模型假设的其他偏差(如异方差)也会影响第1类错误率。特别是,当对照组和治疗组的样本量不等,组间或时段间的方差不等时,线性模型的集合方差估计是有偏的。根据场景的不同,这可能会导致类型1错误率的增加,但也会导致严格保守的测试过程。为了解释异质差异,可以拟合一个模型,允许不同时期和治疗组的不同差异。gydF4y2Ba
三期试验的附加模拟结果gydF4y2Ba
上面我们考虑了从单一治疗和对照开始的平台试验,第二个治疗组稍后进入,但与治疗组1同时结束。因此,本平台试验回归模型的因子周期只有两个水平。gydF4y2Ba
此外,我们还进行了一项模拟研究,即在平台试验结束前招募武装1结束。然后,试验被分为三个时间段,第一和最后一个时间段只涉及一个治疗组和对照组,但在第二个时间段,参与者被随机分配到治疗组和对照组gydF4y2Ba图S16gydF4y2Ba在补充材料中)。总的来说,我们发现两期试验设计描述的特性也适用于模拟中考虑的三期场景。特别是,在等时间趋势下,当使用基于所有臂数据的阶跃函数建模时间趋势时,使用模型的变体(gydF4y2Ba1gydF4y2Ba), period有三个层次。如果处理1的时间趋势与处理2和对照组的时间趋势不同,则类型1错误率可能被夸大。然而,在考虑的例子中,类型1的错误率膨胀比在两期设计中不那么明显,因为第1臂和第2臂之间的重叠更小。因此,非并发控制在从步长函数模型计算的测试统计数据中具有较小的权重。然而,这意味着与仅基于并发控制的分析相比,功率增益小于具有两个周期的设计(有关进一步细节,请参阅补充材料)。gydF4y2Ba
进一步的建模方法gydF4y2Ba
在前面的章节中,我们基于来自所有分支的数据,用阶跃函数对时间趋势进行建模。在本节中,我们将介绍一些替代方法并研究它们的特性。有关这些方法的模拟结果,请参阅补充材料gydF4y2Ba无花果。S4gydF4y2Ba而且gydF4y2BaS12gydF4y2Ba).gydF4y2Ba
如果不使用来自所有治疗部门的数据,如(gydF4y2Ba1gydF4y2Ba)和(gydF4y2Ba2gydF4y2Ba),人们想要比较治疗2与对照的疗效,使用两期对照组的数据和治疗2的数据(仅在第二期收集),一个由观察结果拟合的回归模型{gydF4y2BaYgydF4y2BajgydF4y2Ba,gydF4y2BajgydF4y2Ba∈gydF4y2Ba{1,…,gydF4y2BaNgydF4y2Ba} |gydF4y2BakgydF4y2BajgydF4y2Ba可以使用=0,2}。该回归模型由gydF4y2Ba
其中,周期效应与前面一样,是阶梯式拟合的。gydF4y2Ba
正如李和沃森所指出的[gydF4y2Ba14gydF4y2Ba],线性模型只使用处理2和控制臂的数据(如gydF4y2Ba5gydF4y2Ba))维持第1类错误率,并导致对处理效果的无偏估计。这是成立的,只要残差的方差在两个时期是相同的。此外,即使在治疗组1中出现不同的时间趋势,类型1的错误率控制也保持不变。然而,与单独分析相比,没有相关的功率增益。这是成立的,因为非并发控制数据不有助于治疗效果的估计。然而,对于线性模型,非并发控制数据有助于方差估计。不过,只有在非常小的样本量下,这才会对功率产生影响。因此,用这种方法引入非并发控制并不能提高试验的效率。gydF4y2Ba
可以使用线性调整时间的模型,而不是假设时间的阶段性效应。这里我们假设患者以统一的速度到达,患者指数与时间成正比。回归模型的版本(gydF4y2Ba1gydF4y2Ba), (gydF4y2Ba2gydF4y2Ba)和(gydF4y2Ba5gydF4y2Ba),随时间的变化趋势为线性,将上述模型中的阶跃函数项替换为线性效应函数,得到:gydF4y2Ba
与之前注意到的类似,纳入所有治疗部门数据的模型((gydF4y2Ba1gydF4y2Ba)和(gydF4y2Ba6gydF4y2Ba))控制第1类错误率,并能在模型尺度内所有处理臂的时间趋势均相等的假设下大幅提高功率。然而,这些模型(gydF4y2Ba6gydF4y2Ba)此外,还依赖于模型中对时间趋势的正确说明。如果指定正确,即当时间趋势为线性时,与以阶跃函数形式建模时间的模型相比,此类模型的功率更高(如gydF4y2Ba1gydF4y2Ba),同时控制第1类错误率。但当时间趋势为非线性时,会出现误差膨胀。此外,当两臂之间的时间趋势不同时,膨胀甚至比将时间建模为阶跃函数时还要高。同样,模型(gydF4y2Ba7gydF4y2Ba)和(gydF4y2Ba8gydF4y2Ba)当模型中时间的参数化没有正确指定时,也会产生有偏差的结果和第1类错误膨胀。gydF4y2Ba
讨论gydF4y2Ba
我们研究了频率,基于模型的方法,在使用非并发控制的平台试验中调整时间趋势。我们考察了基于模型的方法能够成功调整时间趋势的条件,这是一个简单的两期试验案例,有两个实验处理和一个共享对照。基于模型的方法包括来自所有臂的数据,并将共同的时间趋势拟合为阶跃函数,控制了第1类错误率,并提高了在所有考虑的情况下的统计能力,在这些情况下,时间趋势在各臂之间相等,并在模型尺度中添加。即使时间趋势不是一个阶跃函数,但具有不同的形状,并且如果使用块随机,这一点也具有渐近性。相反,假设使用随机分配,并且时间趋势不是阶跃函数。在这种情况下,线性模型中的第1类误差可能会膨胀,因为残差的方差可能在不同时期不同(但模型只估计了一个方差项)。解决这个问题的一个简单方法是拟合一个模型,该模型允许每个周期存在不同的剩余方差。另一方面,对于上述阶跃函数模型,如果各臂之间的时间趋势不同或在模型的尺度中不相加,则失去了第1类误差控制。潜在的第1类错误率膨胀的数量取决于各武器之间的时间趋势差异的大小。如果差异足够小,第1类错误率不会受到实质上的影响(见图。gydF4y2Ba3.gydF4y2Ba).gydF4y2Ba
此外,我们考虑了模型,将时间趋势建模为线性函数或具有治疗臂和周期交互项的阶梯函数。此外,我们研究了一个阶梯函数模型拟合对照组数据和治疗组2的数据。我们表明,这些模型不会导致明显的功率增益,或在控制类型1错误率方面较不稳健。gydF4y2Ba
对于临床试验中估计量的评估,估计量和框架[gydF4y2Ba17gydF4y2Ba已经成为一种重要的工具。虽然被定义为估计目标的估计来自试验目标,因此不受使用非并发控制的直接影响,但估计量的性质取决于是否以及如何在估计治疗效果时使用非并发控制[gydF4y2Ba18gydF4y2Ba].时间趋势可以通过临床试验中数据生成过程的几个方面影响估计者,如研究人群、终点的测量或并发事件的影响。gydF4y2Ba
此外,在MDD和NASH中的假设平台试验中,在介绍中考虑到,时间趋势可能会发生。只有在时间趋势的同质性和可加性假设成立的情况下,基于模型的分析才能完全调整时间趋势。虽然人们可以根据观察到的数据对这些假设进行经验评估,但如果试验不为这一目标提供动力,这种评估可能具有有限的敏感性。另一方面,以往试验的经验和主题知识可能为等时间趋势的假设提供理由。不同治疗组之间的时间趋势可能存在差异,当几种治疗方法与对照相比显示出效果时,但导致时间趋势的外部因素并不会同样影响所有考虑的治疗方法的疗效。例如疫苗试验,随着时间的推移,目标病毒的不同变体占主导地位,疫苗效力取决于变体。另一个例子是环境中人群的变化,在那里治疗效果在人群中不是同质的。特别是,在试验早期招募的患者可能已经被研究人员认识,而新诊断的患者可能在较晚的时候进入试验。此外,时间趋势在模型中考虑的尺度中可能不是附加的,例如,如果结果尺度中存在天花板效应(正如发生的那样,例如,在阿尔茨海默病的ADAS-COG中),如果治疗效果不是安慰剂效应的附加[gydF4y2Ba19gydF4y2Ba](正如它可能发生在MDD的例子中),或者,对于二元结果,当时间趋势在不同的尺度上是相等的(作为风险比而不是比值比尺度)。然而,即使存在偏差的风险,由于偏差-方差权衡,使用非并发控制可以在均方误差方面得到更精确的估计。特别是,在小样本量的设置中,可变性的减少可能超过引入的潜在偏差。在实际的临床试验中,时间治疗相互作用的程度将取决于具体的环境,在这方面分析最近的平台试验是很重要的,以更好地理解不同场景的合理性。我们在模拟研究中考虑的场景使用了在传统验证试验中经常使用的1型和2型错误控制的阈值。在早期的平台试验阶段,会做出不同的选择,反映所涉及的不同权衡。此外,试验的设计可能不以错误率控制为主要重点。gydF4y2Ba
虽然我们只考虑了一个简单的场景,但这些模型可以直接扩展到更多治疗和周期的试验中。在这种情况下,周期定义了在平台试验中治疗集不发生变化的时间跨度。同样在这种情况下,需要在模型标度上添加等时间趋势的假设,以获得无偏估计量和保守的检验过程。如果时间趋势不同,偏差量和第1类错误率膨胀将取决于具有偏离时间趋势的处理组在最终测试统计数据中的权重。此外,如果不同武器之间存在不同的偏离时间趋势,它们的影响可能会抵消,这取决于具体的场景。gydF4y2Ba
在这篇论文中,我们关注的是没有中期分析的试验,其中每个手臂的样本量是固定的。然而,平台试验通常允许进行临时分析,由于无效或原假设被早期拒绝,有可能提前停止一个臂。在采用这种中期分析的试验中,由手臂进入或退出之间的时间周期定义的因子周期将取决于中期结果。这增加了额外的复杂性,因为它影响到模型中独立因子周期和因变量的联合分布,并可能导致有偏见的治疗效果估计和第1类错误率的增加。gydF4y2Ba
我们将我们的调查限定为基于线性和逻辑回归模型的分析。为了将这种方法扩展到其他类型的数据(例如,从时间到事件端点、计数和聚类数据),可以应用相应的适当回归模型,包括作为步进函数的时间。此外,为了解决与测量基线变量的混淆,回归模型可以扩展以调整其他协变量。gydF4y2Ba
另一种扩展是用更一般的平滑函数(如样条函数)来模拟时间趋势的模型。此外,有人提出了非参数贝叶斯方法来估计时间的影响,通过借用周期之间的信息来平滑估计时间趋势[gydF4y2Ba20.gydF4y2Ba].然而,这些方法只有在所有方面都相等的情况下才能正确地调整时间趋势。gydF4y2Ba
另一种根据时间趋势进行调整的方法是随机化测试。例如,对于具有协变量和响应自适应随机化的双臂试验,在存在时间趋势的情况下,它们已被证明可以稳稳地控制第1类错误率[gydF4y2Ba21gydF4y2Ba].这些试验可扩展到多武装试验[gydF4y2Ba22gydF4y2Ba使用条件随机化检验,其中对于每个治疗-对照比较,再随机化仅限于各自的治疗和对照。然而,这种条件再随机化对于平台试验中的非并发对照是确定的。因此,与仅基于并发控制的条件随机化试验相比,包含非并发控制并不会提高条件随机化试验的有效性。因此,这种方法将不利于通过合并非并发控制来提高平台试验的效率。gydF4y2Ba
非并发控制可以被认为是历史数据的理想情况,因为它们是从最近的过去借用的,是随机的,并且是相同试验基础设施的一部分[gydF4y2Ba23gydF4y2Ba].为合并历史数据而提出的大量动态建模方法[gydF4y2Ba24gydF4y2Ba- - - - - -gydF4y2Ba28gydF4y2Ba]可用于在平台试验中合并非并发控制。gydF4y2Ba
结论gydF4y2Ba
基于模型的分析利用了来自所有治疗部门(包括非并发控制)的数据,是一种强大且相当稳健的分析策略。如果不同组的时间趋势在模型尺度上对结果具有相等的相加效应,那么基于所有组的数据调整时间为步进函数的模型控制了第1类错误率,同时与仅采用并发控制的分析相比,增加了功率。对于二元数据和逻辑回归模型,即使公共时间趋势的函数形式偏离阶梯函数,也保持第1类误差控制。对于连续数据,如果应用了块随机化或选择了允许跨时期不同方差的模型,这一点就成立。然而,如果时间趋势在两组之间存在差异,或者在模型的尺度上不能作为治疗效果的累加,那么第1类误差控制可能丢失,治疗效果估计可能存在偏差。gydF4y2Ba
如果非并发控制包含在平台试验的分析中,我们建议使用阶跃函数模型来调整潜在的时间趋势。只有在试验期间环境可以被认为是“稳定的”,且结果没有时间趋势的试验中(例如,对于具有客观终点和同质患者群体的短期试验,以及具有长期确定的护理标准和近期治疗方案没有变化的疾病),可能没有必要对时间趋势进行调整,并且,在这种情况下,并发和非并发对照的分布是相同的。我们可以简单地合并并发和非并发控件。在任何情况下,如果使用非并发数据作为主要分析,也应将仅使用并发控制数据的分析作为敏感性分析。gydF4y2Ba
是否使用非并发对照应根据预期的偏差-方差权衡和主题事项考虑(如试验持续时间和试验期间护理标准的潜在变化)逐案决定。特别是在小样本量的设置中,使用阶跃函数模型合并非并发控制所获得的效率可以超过潜在的偏差。为了评估偏差-方差权衡,应该仔细考虑试验的细节、跨处理的异质时间趋势的科学合理性和结果的稳健性。gydF4y2Ba
数据和材料的可用性gydF4y2Ba
R代码可以通过库在GitHub上获得:gydF4y2Bahttps://github.com/MartaBofillRoig/NCC_timetrendsgydF4y2Ba.该存储库包含再现模拟研究结果的主要代码和R函数。生成和/或分析的数据集也可在存储库中获得。gydF4y2Ba
缩写gydF4y2Ba
- 或者:gydF4y2Ba
-
优势比gydF4y2Ba
- ALLTC-Step模型:gydF4y2Ba
-
所有gydF4y2BatgydF4y2Ba强夯-gydF4y2BacgydF4y2Ba控制臂模型(见Eq。gydF4y2Ba1gydF4y2Ba)gydF4y2Ba
- ALLTCI-Step模型:gydF4y2Ba
-
所有gydF4y2BatgydF4y2Ba强夯-gydF4y2BacgydF4y2Ba控制臂模型用gydF4y2Ba我gydF4y2Banteraction(见情商。gydF4y2Ba2gydF4y2Ba)gydF4y2Ba
参考文献gydF4y2Ba
伍德考克J,拉瓦吉LM。研究多种疗法、多种疾病或两者的主方案。英国医学杂志2017;377(1): 62 - 70。gydF4y2Bahttps://doi.org/10.1056/NEJMra1510062gydF4y2Ba.gydF4y2Ba
Meyer EL, Mesenbrink P, Dunger-Baldauf C, Fülle HJ, Glimm E, Li Y, Posch M, König F.主方案临床试验设计的演变:一个系统的文献综述。其他。2020;42(7): 1330 - 60。gydF4y2Bahttps://doi.org/10.1016/j.clinthera.2020.05.010gydF4y2Ba.gydF4y2Ba
萨维尔比,贝里SM。平台临床试验的效率:未来展望。中国新药试验。2016;13(3): 358 - 66。gydF4y2Bahttps://doi.org/10.1177/1740774515626362gydF4y2Ba.gydF4y2Ba
多德·勒,弗莱德林·B,科恩·埃尔。平台试验——注意不可比较的控制组。英国医学2021;384(16): 1572 - 73。gydF4y2Bahttps://doi.org/10.1056/NEJMc2102446gydF4y2Ba.gydF4y2Ba
Lee KM, Brown LC, Jaki T, Stallard N, Wason J.在正在进行的临床试验中添加新臂时的统计学考虑:潜力和注意事项。试验。2021;22(1): 203。gydF4y2Bahttps://doi.org/10.1186/s13063-021-05150-7gydF4y2Ba.gydF4y2Ba
Collignon O, Burman C, Posch M, Schiel a .抗击COVID-19的协作平台试验:为更好的社会结果而考虑的方法和监管因素。临床药理学杂志。2021;110(2): 311 - 20。gydF4y2Bahttps://doi.org/10.1002/cpt.2183gydF4y2Ba.gydF4y2Ba
国际人用药品技术要求协调理事会。E9临床试验统计学原理。1998.gydF4y2Bahttps://www.ema.europa.eu/en/documents/scientific-guideline/ich-e-9-statistical-principles-clinicaltrials-step-5_en.pdfgydF4y2Ba.gydF4y2Ba
国际人用药品技术要求协调理事会。e10临床试验对照组的选择。2000。gydF4y2Bahttps://www.ema.europa.eu/en/documents/scientific-guideline/ich-e-10-choice-controlgroup-clinical-trials-step-5_en.pdfgydF4y2Ba.gydF4y2Ba
Otte C, Gold SM, Penninx BW, Pariante CM, Etkin A, Fava M, Mohr DC, Schatzberg AF.重度抑郁障碍。Nat Rev Dis Prim. 2016;2(1): 1 - 20。gydF4y2Ba
Sforzini L, Worrell C, Kose M, Anderson IM, Aouizerate B, Arolt V, Bauer M, Baune BT, Blier P, Cleare AJ等。基于德尔福方法的临床试验难治性抑郁症定义共识指南。摩尔精神病学。2022;27(3): 1286 - 99。gydF4y2Ba
Gold SM, Bofill Roig M, Miranda JJ, Pariante C, Posch M, Otte C.平台试验和评估治疗性行为干预的未来。Nat Rev Psychol. 2022;1(1): 7 - 8。gydF4y2Ba
Fraile JM, Palliyil S, Barelle C, Porter AJ, Kovaleva M.非酒精性脂肪性肝炎(nash)——一种由复杂疾病驱动的拥挤临床研究综述。药物与发展,2021;15:3997。gydF4y2Ba
Rowe IA, Parker R.非酒精性脂肪性肝炎随机试验中的安慰剂反应简单解释了。clinin Gastroenterol - Hepatol. 2022;20(3): 564 - 72。gydF4y2Ba
Lee KM, Wason J.在分析平台试验中纳入非同期对照患者:值得吗?BMC医学研究方法。2020;20(1): 1 - 12。gydF4y2Ba
Elm JJ, Palesch YY, Koch GG, Hinson V, Ravina B, Zhao W.在正在进行的临床试验中添加治疗臂中期研究的灵活分析方法。J Biopharm Stat. 2012;22(4): 758 - 72。gydF4y2Ba
马特斯JP,拉钦JM。临床试验中排列块随机化的特性。对照临床试验。1988;9(4): 327 - 44。gydF4y2Ba
国际人用药品技术要求协调理事会。ICH E9(R1)临床试验统计原则指南的临床试验估计和敏感性分析附录。2019.gydF4y2Bahttps://database.ich.org/sites/default/files/E9-R1_Step4_Guideline_2019_1203.pdfgydF4y2Ba.gydF4y2Ba
Collignon O, Schiel A, Burman C-F, Rufibach K, Posch M, Bretz F. Estimands和复杂的创新设计。临床药理学,2022。gydF4y2Ba
Boehm K, Berger B, Weger U, Heusser P.安慰剂研究中的相加效应模型仍然成立吗?叙述审查。JRSM开放。2017;8(3): 2054270416681434。gydF4y2Ba
萨维尔BR,贝里DA,贝里NS,维尔K,贝里SM。贝叶斯时间机器:考虑多臂平台试验中的时间漂移。试验。2022。(印刷中)。gydF4y2Ba
Simon R, Simon NR.使用随机化试验,通过响应自适应和协变量自适应随机化保存I型误差。Stat Probab Lett. 2011;81(7): 767 - 72。gydF4y2Bahttps://doi.org/10.1016/j.spl.2010.12.018gydF4y2Ba.gydF4y2Ba
王颖,Rosenberger WF, Uschner D.多武装随机临床试验的随机化检验。统计地中海。2020;39(4): 494 - 509。gydF4y2Ba
Burger HU, Gerlinger C, Harbron C, Koch A, Posch M, Rochon J, Schiel A。外部控制的使用:目前可以推荐到什么程度?制药Stat。2021;20(6): 1002 - 16。gydF4y2Ba
Viele K, Berry S, Neuenschwander B, Amzal B, Chen F, Enas N, Hobbs B, Ibrahim JG, Kinnersley N, Lindborg S, Micallef S, Roychoudhury S, Thompson L.在临床试验中使用历史对照数据评估治疗效果,。制药Stat。2014;13(1): 41-54。gydF4y2Bahttps://doi.org/10.1002/pst.1589gydF4y2Ba.gydF4y2Ba
Ghadessi M、唐锐、周珺、刘锐、王琛、丰田泉K、梅C、张磊、邓昌强、Beckman RA。药物信息协会自适应设计科学工作组(DIA-ADSWG)在临床试验中使用历史对照的路线图。孤儿J罕见病。2020;15(1): 69。gydF4y2Bahttps://doi.org/10.1186/s13023-020-1332-xgydF4y2Ba.gydF4y2Ba
Hall KT, Vase L, Tobias DK, Dashti HT, Vollert J, Kaptchuk TJ, Cook NR.随机临床试验的历史对照:机遇与挑战。临床药理学杂志。2021;109(2): 343 - 51。gydF4y2Bahttps://doi.org/10.1002/cpt.1970gydF4y2Ba.gydF4y2Ba
Schmidli H, Gsteiger S, Roychoudhury S, Hagan AO, Spiegelhalter D, Neuenschwander B.具有历史对照信息的临床试验的稳健元分析预测先验。生物识别技术,2014:1023-32。gydF4y2Bahttps://doi.org/10.1111/biom.12242gydF4y2Ba.gydF4y2Ba
Schmidli H, Häring DA, Thomas M, Cassidy A, Weber S, Bretz F.超越随机临床试验:使用外部对照。临床药典,2020;107(4): 806 - 16。gydF4y2Bahttps://doi.org/10.1002/cpt.1723gydF4y2Ba.gydF4y2Ba
确认gydF4y2Ba
作者感谢审稿人对稿件提出的建设性意见和建议。gydF4y2Ba
资金gydF4y2Ba
欧盟- pearl(欧盟以患者为中心的临床试验平台)项目获得了创新药物计划(IMI) 2联合项目(JU)的资助,资助协议号为853966。该联合项目得到了欧盟“地平线2020”研究和创新计划、EFPIA和儿童肿瘤基金会、全球结核病药物开发联盟、非营利性组织Spring works Therapeutics公司的支持。这篇文章反映了作者的观点。IMI、欧洲联盟、EFPIA或任何相关合作伙伴均不对其中所载信息的任何使用负责。gydF4y2Ba
作者信息gydF4y2Ba
作者和联系gydF4y2Ba
贡献gydF4y2Ba
MBR和MP构思和设计了研究,并共同参与了文章的起草。EG、MBR、MP、PJ和KV起草了方法部分。MBR和PK为模拟编写代码,PK执行模拟并准备图形和表格。所有作者都对研究结果的解释做出了贡献,对手稿进行了严格的审查和编辑。所有作者都对最终稿进行了批判性的评价。作者们阅读并批准了最终稿。gydF4y2Ba
相应的作者gydF4y2Ba
道德声明gydF4y2Ba
伦理批准和同意参与gydF4y2Ba
不适用。gydF4y2Ba
同意出版gydF4y2Ba
不适用。gydF4y2Ba
相互竞争的利益gydF4y2Ba
Carl-Fredrik Burman是阿斯利康的雇员和股东。多米尼克·马吉尔(Dominic Magirr)宣布作为诺华制药公司(Novartis Pharma AG)的员工存在竞争利益。Peter Mesenbrink是诺华制药公司的员工,拥有诺华公司的限制性和非限制性股票。Peter Jacko和Kert Viele是Berry Consultants的员工,这是一家专门从事贝叶斯和适应性临床试验设计的咨询公司。其余作者声明,他们对本文的内容没有竞争利益。gydF4y2Ba
额外的信息gydF4y2Ba
出版商的注意gydF4y2Ba
188博金宝app网施普林格自然对出版的地图和机构附属的管辖权要求保持中立。gydF4y2Ba
补充信息gydF4y2Ba
额外的文件1gydF4y2Ba
附有技术推导、证明和附加模拟研究结果的补充文件。gydF4y2Ba
权利和权限gydF4y2Ba
开放获取gydF4y2Ba本文遵循创作共用署名4.0国际许可协议(Creative Commons Attribution 4.0 International License),该协议允许在任何媒体或格式中使用、分享、改编、分发和复制,只要您给予原作者和来源适当的署名,提供创作共用许可协议的链接,并说明是否有更改。本文中的图片或其他第三方材料包含在文章的创作共用许可中,除非在材料的信用额度中另有说明。如果材料不包含在文章的创作共用许可中,并且您的预期用途不被法律法规允许或超出了允许的用途,您将需要直接从版权所有者那里获得许可。欲查看此许可证的副本,请访问gydF4y2Bahttp://creativecommons.org/licenses/by/4.0/gydF4y2Ba.创作共用公共领域奉献放弃书(gydF4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/gydF4y2Ba)适用于本文提供的数据,除非在数据的信用额度中另有说明。gydF4y2Ba
关于这篇文章gydF4y2Ba
引用这篇文章gydF4y2Ba
罗伊,M.B,克罗特卡,P,伯尔曼,CF。gydF4y2Baet al。gydF4y2Ba基于模型的非并发控制平台试验时间趋势调整。gydF4y2BaBMC医学治疗方法gydF4y2Ba22gydF4y2Ba228(2022)。https://doi.org/10.1186/s12874-022-01683-wgydF4y2Ba
收到了gydF4y2Ba:gydF4y2Ba
接受gydF4y2Ba:gydF4y2Ba
发表gydF4y2Ba:gydF4y2Ba
DOIgydF4y2Ba:gydF4y2Bahttps://doi.org/10.1186/s12874-022-01683-wgydF4y2Ba
关键字gydF4y2Ba
- 增加武器gydF4y2Ba
- 非并发控制gydF4y2Ba
- 平台试验gydF4y2Ba