摘要
背景
COVID-19治疗随机评估(RECOVERY)试验旨在解决为COVID-19疑似或确诊住院患者找到有效治疗方法的迫切需求。该试验取得了许多成功,包括发现地塞米松可有效降低COVID-19死亡率,这是一项随机对照试验中第一个达到这一里程碑的治疗方法。尽管如此,它仍然继续使用标准或“固定”随机分配患者接受治疗。我们评估了在RECOVERY中实施响应自适应随机化的影响,使用了一系列性能度量,以了解它是否可能有益。该设计特性最近已在REMAP-CAP平台试验中实现。
方法
试验数据进行了模拟,以与2020年3月至6月RECOVERY试验中分配到标准护理、地塞米松、羟基氯喹或洛匹那韦-利托那韦的患者的数据密切匹配,代表了整个期间测试的5个试验组中的4个。在使用标准护理和地塞米松的两臂试验环境和使用上述所有治疗的四臂试验环境中模拟试验。两种形式的固定随机化和两种形式的响应自适应随机化进行了测试。在两臂试验中,反应自适应随机化在两个试验臂中实施,而在四臂试验中仅在三个非标准护理臂中实施。在两组试验中,随机化策略在整个试验水平以及根据患者呼吸支持水平定义的三个预先指定的患者亚组中执行。
结果
在试验中,所有的反应适应性随机化策略导致更多的患者被给予地塞米松和较低的死亡率。亚组特异性反应适应性随机化进一步降低了死亡率。在两臂试验中,与FR相比,响应自适应随机降低了统计功率,其中亚组水平自适应随机显示出最大的功率降低。在四组试验中,反应自适应随机化增加了地塞米松组的统计效力,但降低了洛匹那韦组的统计效力。反应自适应随机化在治疗效果估计上没有引起任何有意义的偏差,也没有引起1型错误率的任何膨胀。
结论
在RECOVERY中使用响应自适应随机化可以增加试验期间接受最佳COVID-19治疗的患者数量,同时减少获得与原始研究相同研究强度所需的患者数量。这可能会减少试验期间的患者死亡,并使地塞米松更快地被宣布有效。决定如何平衡试验中患者的需求和未来尚未患病患者的需求,是试验界需要解决的一个重要伦理问题。在未来的COVID-19和其他疾病的试验中,应考虑将响应自适应随机化作为一种设计特征。
背景
2019冠状病毒病(COVID-19)是由严重急性呼吸综合征冠状病毒引起的疾病2 [1].2020年3月11日,COVID-19的全球发病率和毒性达到了世界卫生组织宣布其为大流行的标准[2].截至撰写本报告时(2022年4月),该疾病在全球已造成5亿例病例和600万人死亡[3.].此外,一些感染了covid -19的患者报告说,他们经历了长时间covid -19,这种情况包括许多症状,如严重疲劳,在最初感染过去后可能持续很长时间[4].据估计,英国大约有200万人遭受了长时间covid的折磨[5].这一大流行病的影响深远,不仅仅是感染者。例如,许多疑似癌症的患者没有得到适当的早期治疗,专家认为,由于病情得不到治疗,这将导致死亡率增加[6].同样,人们注意到,大流行增加和恶化了压力和焦虑等心理健康问题[7].就更广泛的社会影响而言,疫情还导致极端贫困人口急剧增加,15亿学生失去教育机会,粮食不安全状况日益严重[8].
当COVID-19首次出现时,人们对其病理生理学知之甚少,因此,临床医生不确定哪些治疗方法会降低COVID-19的相关发病率和死亡率。为了解决这一问题,在COVID-19严重症状的患者中迅速设计、批准并启动了大规模随机临床试验,以寻找有效的治疗方法。最引人注目的例子之一是RandomisedE估值的浸id-19 Th呃美联社Y(追讨)试验[9].该项目于2020年3月19日开始,即疫情宣布大流行的8天后,目的是发现能够有效降低确诊或疑似COVID-19住院患者28天死亡率的新疗法[9].到目前为止,已有15种治疗方法进行了试验,其中大多数由改头换面的药物组成[9].九项试验治疗的结果已经公布。这9种治疗方法中的大多数,包括抗疟疾药物羟氯喹[10]和洛匹那韦-利托那韦的抗病毒组合(洛匹那韦)[11],并没有发现在降低COVID-19死亡率方面有显著效果。然而,有三种治疗方法已被宣布成功:地塞米松[12], tocilizumab [13]和REGENERON [14].在分析地塞米松的数据时,研究人员发现了统计上显著的效果,与标准护理(25.7%)相比,地塞米松治疗的死亡患者(22.9%)更少[12].我们还对三个预先指定的亚组患者进行了分层分析,这些亚组在随机化时接受了不同水平的呼吸支持:(i)无氧、(ii)只吸氧和(iii)有创机械通气供氧。亚组分析揭示了重要的治疗效果异质性:亚组(ii)和亚组(iii)的患者都从服用地塞米松中获益,与单独使用标准护理相比,需要最多呼吸支持的组(iii)获益最大。然而,(i)组中需要最低水平呼吸支持的患者在标准护理下似乎表现更好(尽管这在统计学上不显著)[12].这些结果如表所示1.基于这项研究,国家健康和护理卓越研究所发布了指导方针,指出如果COVID-19住院患者需要氧气,应给予地塞米松[15].
RECOVERY是现代自适应平台试验的一个极好的例子[16].在传统的试验中,所有的设计方面(包括要比较的治疗方法和样本量)都必须在试验开始前决定,而自适应平台试验则不同,可以无限期地进行下去。在试验进行期间,可以添加和测试新的实验治疗,可以放弃收效甚微的旧的实验治疗,有效的实验治疗可以“分级”成为事实上的护理标准。有许多自适应试验设计,但它们的共同目标是更加灵活和资源效率更高。适应性设计的支持者断言,适应性设计更合乎道德。17,虽然这并没有被普遍接受[18].可纳入适应性试验的最具争议的特性之一是响应-适应性随机化(RAR)。RECOVERY没有考虑到这一点,而是在试验期间将患者分配到实验或标准护理组时更倾向于使用标准的“固定”随机(FR)概率。在RAR方案下,分配通常从FR状态开始,以相等的概率将患者随机分配到所有试验组。RAR随后促进了分配比例的调整,因为中期分析开始表明,不同部门的结果之间存在真正的差异,有利于有利结果估计概率较高的治疗。最近一个使用RAR的COVID-19研究的例子是Randomised,Embedded,米ulti-factorial,一个daptiveP梯形试验C社区所-一个cquiredP肺炎(REMAP-CAP) [19].这是一项旨在同时评估针对社区获得性肺炎的多种干预措施的试验,但它有一个用于评估COVID-19治疗方法的子平台REMAP-COVID [20.].
本文的目的是通过模拟研究,在RECOVERY试验中应用RAR代替FR将患者分配到不同的治疗组可能带来的好处。我们假设,应用RAR将通过分配更多患者接受最佳治疗来减少试验参与者的死亡人数。为了实现RAR,我们使用了REMAP-CAP算法以及我们自己定制的调优算法。在不同的模拟中,我们在整个患者队列中应用每种RAR方法,然后分别在患者亚组(i)-(iii)中应用。我们还比较了两个或四个治疗组的试验模拟。我们使用1:1和2:1的分配比例(相对于标准护理:地塞米松)应用FR,后者已在恢复期使用。为了量化效益,我们关注以下五个指标:
分配给每种治疗的患者比例;
整个试验过程中的预期死亡人数;
在所有患者和患者亚组中检测治疗效果的统计能力;
治疗效果估计的偏差和均方误差;
错误地宣布一种或多种治疗具有显著疗效的家庭型错误
方法
模拟设置
采用R统计语言建立了两个仿真模型[21],所选择的参数与RECOVERY试验的观察结果非常相似。第一个模拟是基于RECOVERY试验的两个部分:即地塞米松组和对照组。最初的试验收集了6425名服用地塞米松的患者的主要结果数据(N= 2104)和护理标准(N= 4321)武器,从2020年3月19日到6月8日的81天。此时,地塞米松组被停止,其疗效结果已公布[12].第二个模拟包括在RECOVERY中测试的两种进一步的实验治疗,即羟氯喹(N= 1561)和洛匹那韦(N= 1616),以创建一个四臂试验模拟。虽然没有发现后两种治疗手段在降低COVID-19死亡率方面有显著益处,但将它们纳入模拟是为了展示RAR程序在多臂(与双臂相比)环境下的截然不同的行为。
为了提供实施RAR的方法,模拟100天(或区块)的患者结果数据,每个区块包括80名患者,在2组试验中提供8000名患者,或120名患者,在4组试验中提供12000名患者。这个样本量和试验持续时间有意超过RECOVERY,因为它使我们的研究能够在比实际试验更小和更大的样本量下评估设计的统计特性。两臂和四臂模拟试验的样本量接近最初试验的80天样本量,大多数指标从此时开始收集。为了匹配RECOVERY研究人群,分别从患者亚组(i)-(iii)中抽取24、60和16%。患者结局(Y)表示28天死亡率的主要结局,由伯努利分布生成。对病人我分组随机化j在患者亚组中k,关于治疗l:
在哪里我= 1,…,80(或120对于四臂模拟),j= 1,…,100,k = i, ii, iii,l= 0(护理标准),1(护理标准+地塞米松),2(护理标准+羟氯喹),或3(护理标准+洛匹那韦),。的价值Pk,l(28天死亡率)与恢复期观察到的死亡率相符(见表1).
两臂试验:随机分配策略
六种分配策略(两种FR和四种RAR)作为模拟的一部分进行了研究。每种策略产生一个分配率,用于二项数据生成函数,以便在模拟中产生变化并避免舍入误差。研究FR采用1:1和2:1的标准护理:地塞米松比例。考虑到每个试验组的潜在转换率是相似的(表1)、1:1分配,或50%概率获得其中之一时,根据内曼规则,就统计效力而言,药物是接近最优的[22(确切的数值是51%/49%)。有关详细信息,请参见附加文件1技术附录A.后一种2:1策略在RECOVERY中使用。RAR使用两种随机化算法进行研究,我们自己定制的调谐算法(T)和在REMAP-CAP (RMC)中使用的算法。我们用TfRMC和f,表示应用于整个患者队列的试验患者的RAR分配程序。我们用T年代RMC和年代,表示在每个患者亚组中应用的RAR分配程序。具体来说,是闭塞病人的概率jk亚组被分配到地塞米松组,给予第1块中所有既往患者的治疗和结果数据,j-28用α表示j, k,地点:
在这里,θ(l)表示处理的后验概率l对于参加试验至少28天的患者,无论是全队列还是k亚组(进一步细节请参见附加文件1技术附录B);年代是在适应点完成的试验阶段的比例;而且nj,k,l表示队列/亚组中已分配治疗的k期患者数量l.
此外,RAR方案T和RMC的分配概率受一个最大值和最小值的约束,其规则如下:
T和RMC RAR程序在试验招募的前34天都使用了“磨合”期(在此期间没有应用适应性随机化)(以允许在第一周内招募的参与者在第一次适应时达到28天的主要终点),这意味着前2720名患者或试验的42.5%以固定的1:1比例分配。只有在这一点之后,新的患者才使用RAR分配,αj, k比率每7天更新一次。每次模拟进行1000次。
四臂试验:随机分配策略
作为模拟的一部分,研究了四种分配策略(两种FR和两种RAR)。
研究FR采用1:1:1:1和2:1:1:1的标准护理:地塞米松:羟基氯喹:洛匹那韦的比例。RECOVERY试验中使用的是2:1:1:1的比例,这是与原始试验最一致的模拟策略。
TfRMC和f实验组采用RAR策略,但标准护理组采用40%固定随机概率。第j区和第k亚组的患者被分配到治疗组l(2 =地塞米松,3 =羟氯喹,4 =洛匹那韦)中给予治疗的概率和第1区,…,j-28中所有既往患者的结果数据用α表示j, k, l,地点:
$ ${一}_ {j, k, l} = \左\{{数组}{c} \ \开始压裂{1}{4}:\ mathrm的{}\ 1:1:1:1 \ \ mathrm{固定}\ \ mathrm {=} \ \ mathrm{随机}\ \离开(\ mathrm{拿来}\)\ \ \压裂{1}{}{5}:\ mathrm的{}\ 2:1:1:1 \ \ mathrm{固定}\ \ mathrm{不平等}\ \ mathrm{随机}\ \离开(\ mathrm{皮毛}\)\ \{}\ 0.6 \倍压裂{\θ{(左)}^年代}{θ{(左)}^ \ s +{\离开(1 -θ(l) \ \右)}^年代}/{\总和}_ {l = 1} ^ l \压裂{\θ{(左)}^年代}{θ{(左)}^ \ s +{\离开(1 -θ(l) \ \右)}^年代}:\ mathrm{队列}\ \ mathrm{调优}\ \ mathrm{算法}\\离开({\ mathrm {T}} _ {\ mathrm {f}} \) \ \{} \ 0.6 \倍倍根号{\压裂{\θ(1)}{\ sum_ {j = 1} ^ {J-28} {n} _ {j 1} + 1}} /{\总和}_ {l = 1} ^ l \√6{\压裂{\θ(l)} {\ sum_ {j = 1} ^ {J-28} {n} _ {j l} + 1}}: \ mathrm{队列}\ \ mathrm {REMAPCAP} \ \ mathrm {algortihm} \ \离开({\ mathrm {RMC}} _ {\ mathrm {f}} \) \结束数组{}\ $ $
在四臂仿真中,RAR中的分配概率由一个最大值和一个最小值约束,其规则如下:
试验指标
为了在地塞米松补充结束时匹配恢复的第二和第四组的样本量,在80%的模拟完成时执行单点度量。所有图的x轴以回收率为100%的样本量进行校准N= 6400例患者(或N= 9600(四臂模拟)来匹配招募的结束,125%是模拟的整个长度。为了评估这些方法的性能,我们在1000个模拟试验中计算了以下汇总度量:
分配给地塞米松的预期或平均患者人数E[Nd]
死亡人数:预期或平均死亡人数E[NY], 6400名患者被分配到一个治疗方案中,选择这个数字是因为它接近康复计划中招募的6425名患者。
T1E:当所有治疗的死亡率相同时,错误拒绝无治疗效果原假设的预期概率,也称为I型错误率。E[t1犯错,在整个试验中。在测试一个零假设的两个手臂设置中,测试的显著性阈值固定在5%。在多臂策略中,测试了不止一个假设,p-值比率使用Bonferroni校正对测试的特定假设数量进行调整(即使用的p水平阈值为0.05除以3),以保持家庭错误率。
幂:在一段结束时,正确拒绝无处理效果原假设的期望概率。这是用逻辑回归模型计算出来的。对于亚组水平的随机化,只计算亚组ii和iii的功率,因为在亚组i中地塞米松的效果比标准护理差。对于多臂试验模拟,计算地塞米松和洛匹那韦的效果。虽然洛匹那韦的恢复结果公布时没有显著效果,但洛匹那韦和地塞米松的死亡率估计值都低于标准护理组(不像羟氯喹)。因此,为了比较多个治疗在试验中的有效性,我们假设这种死亡率差异是真实存在的,并且会在比RECOVERY更大的样本量下得到统计上的证实。
治疗效果估计的相对偏差和均方误差。第一个度规,\({偏见}_k = E \离开[\压裂{\离开({帽子\ P {}} _ {k, 0} -{帽子\ P {}} _ {k, 1} \右)- \离开({P} _ {k, 0} - {P} _ {k, 1} \右)}{\离开({P} _ {k, 0} - {P} _ {k, 1} \右)}\右]\),在那里Pk,l实际的死亡率和帽子\ ({\ P {}} _ {k, l} \)亚组的估计死亡率是吗k(1 = (i), 2 = (ii), 3 = (iii))l(1为地塞米松,0为标准护理)。这种偏差只针对RAR程序计算,因为只有RAR在治疗效果估计中会引起偏差,详见技术附加文件1均方误差的计算方法为\ (MSE = \压裂{1}{N} \ sum_ {N = 1} ^ N{\离开(\左({帽子\ P {}} _ {k, 0} -{帽子\ P {}} _ {k, 1} \右)- \离开({P} _ {k, 0} - {P} _ {k, 1} \) \右)}^ 2 \).
总结
总之,双臂模拟研究调查了六种治疗分配方法:
所有患者1:1 FR (FeR)
所有患者FR为1:2 (FuR)
T算法在所有患者(Tf)
所有患者的RMC算法(RMCf)
T算法在子群(i)-(iii)内分别(T年代)
分别在子组(i)-(iii)内的RMC算法年代)
此外,四臂模拟研究调查了以下四种治疗分配方法:
所有患者的1:1:1:1分配(FeR)
2:1:1∶1分配,对照组分配最多(FuR)
40%的患者分配到对照组,其余患者根据T算法分配到治疗组
40%的患者分配到对照组,其余患者根据RMC算法分配到治疗组
结果
分配给每个部门
在两臂模拟中,两种队列RAR方法与两种FR方法相比,导致更多的患者接受地塞米松。Tf导致接受地塞米松治疗的患者略多于RMCf.当考虑子组特定的RAR时,每个子组都有自己的趋势。在亚组(i)中,与FuR相比,两种适应性方法分配到标准护理的患者略少年代为大多数病人分配标准的护理。在(ii)和(iii)子组中,RAR算法主要分配给地塞米松,带有RMC年代分配最多的病人使用地塞米松。然而,亚组(iii)的治疗分配差异要大得多。这些差异如图所示。1.
随着试验的进行,RAR算法在如何“增加”分配到最佳治疗方案上也有所不同。Tf从老化期结束开始,以更稳定的速率增加最佳治疗的随机化,而RMCf在早期试验阶段更快地增加随机化,但也更早地达到稳定。这与亚组级RAR方法的模式一致年代RMC和年代,对于子组(i)和(ii),则在子组(iii)中,RMC年代算法在整个RAR试验阶段更快地增加地塞米松的分配。图中展示了这一点。2而且3..
在四臂模拟中,对照组的分配被保护并固定在40%。在实验治疗组中,RAR导致地塞米松患者分配最多,其次是洛匹那韦,羟氯喹患者分配最少。Tf与RMC相比,随机化算法导致更多的患者接受地塞米松,较少的患者接受羟氯喹f算法。这些结果如图所示。4.
一旦磨耗期结束,参与者分配迅速转变为分配给更多的患者使用地塞米松,同时减少分配给羟氯喹和洛匹那韦的患者数量。羟氯喹的配给量比洛匹那韦的配给量减少得更快。地塞米松和其他治疗组之间分配概率的差异在Tf随机化比RMC要好f.地塞米松分配超过40%的患者分配到标准护理100%试验完成使用Tf算法。如图所示。5.
死亡率
在两臂模拟中,FR导致的预期死亡人数最高(FuR比FeR更糟糕)。其次是队列水平的RAR,使用亚组特异性RAR时观察到的死亡率最低。随机化算法与RMC之间的差异很小fRMC和年代死亡率略低于Tf和T年代分别。预期死亡率数字载于表中4,表示为相对于FuR可避免的死亡人数。
在四臂模拟中,与FuR策略相比,死亡率下降较小。TfRMC和f导致非常相似的死亡率下降,这同样符合FeR战略。这些结果见表5.
统计能力
在两次试验模拟中,FeR在队列水平上导致了最高的研究能力,正如内曼规则所预测的那样。皮毛,TfRMC和f它们的表现都是相似的,在模拟结束时,FuR的功率略高,在模拟的样本量与RECOVERY几乎相同的情况下。队列RAR算法、RMC算法的比较f的性能略优于Tf在大多数的审判中。这些结果如图所示。6.
对于亚组特异性RAR程序,随机方法之间的功率差异是最小的;两个RMC年代和T年代在所有阶段产生相似的能量。然而,这两个亚群之间有显著的差异。治疗效果最大的亚组(iii)的功率最高,在研究过程中达到90%。相比之下,亚组(ii)在研究结束时没有达到80%的力量。如图所示。7.
在多臂试验模拟中,观察到完全不同的趋势。RAR分配方法导致地塞米松和洛匹那韦组比FuR组更有效。与RAR分配相比,FeR分配导致洛匹那韦组能量更大,而地塞米松组能量更小。Tf与RMC相比,分配导致两种治疗方法的力量都略大f.这些结果如图所示。8.
治疗效果估计的偏差和均方误差
众所周知,RAR程序有可能在相应的治疗效果估计中导致小样本偏差,因为它们导致效果估计与其样本量之间存在非零相关性[23].在两臂试验设置中,与使用队列RAR程序相关的偏差在试验的所有阶段显示在图中。9在亚组特异性和队列RAR中,当试验达到图中RECOVERY中观察到的样本量时。10.两个RMCf的偏倚比Tf.子组特定的RAR结果显示,对于两种算法,子组(iii)的偏倚最低,子组(i)对T的偏倚最高年代RMC偏差最大的算法和子组(ii)年代算法。
就均方误差(MSE)而言,FeR在全队列设置中误差最小。RMCf导致了比T更高的误差f, FuR得到与RMC相似的MSEf.表中演示了这一点4.在子组水平的随机试验中,自适应随机化算法在每个子组中都有非常相似的MSE水平,带有RMC年代导致子组(i)和(iii)和T的MSE较高年代导致子组(ii)的MSE略高。子组的MSE与样本量呈负相关,子组(ii)的MSE最低,子组(i)次之,子组(iii)次之,详见表2.
在四臂试验设置中,洛匹那韦治疗效果偏倚最高,地塞米松最低。T和T之间的偏差差别很小fRMC和f除了在羟氯喹组,Tf导致偏倚略有增加。如图所示。11.在均方误差方面,FuR的均方误差最高,FeR的均方误差最低。Tf导致洛匹那韦的MSE更高,但在其他方面它们之间几乎没有区别。表中演示了这一点3..
家庭明智错误率
当在两臂模拟中同时应用全试验和亚组级随机化算法时,第1类错误率在5%左右出现了小波动,这与p-value集,如图所示。12和无花果。13在检查四臂模拟中Bonferroni校正的家族错误率时,也发生了同样的情况,如图所示。14.这表明RAR方法并没有夸大1型错误。
讨论
理解结果
必须考虑为什么不同的方法会导致不同的死亡率。全队列RAR方法导致更多的患者接受地塞米松治疗,这在大多数患者中被证明优于标准治疗,因此在试验模拟中导致更少的总体死亡。亚组RAR方法进一步改善了死亡率,因为它们允许亚组(i)中更多的患者接受标准治疗,并允许亚组(iii)中更快地增加地塞米松的分配。在多臂模拟中,RAR分配并不能减少同样多的死亡率。这是因为能够接受最佳治疗(地塞米松)的患者比例大大降低。分配的40%被保护给标准护理部门,洛匹那韦和羟氯喹部门将始终得到分配的至少5%。这意味着地塞米松组每天最多只能接收分配的50%的患者,而在双组模拟中,这一比例为90%。
研究功率很重要,因为它表明可能需要多少患者才能达到统计上显著的结果。此外,在大流行病的背景下,这将意味着更早公布积极的结果,这将导致在现实世界中更早使用治疗方法。在双臂模拟中,FeR的研究能力最强。这是意料之中的,因为内曼的分配公式表明,研究效率的最优分配几乎是1:1 [22].更一般地说,所有FR和队列RAR策略(在双臂环境中)的力量被认为与它们的平均分配比例偏离最优分配的程度成反比。尽管两种FR方法都比队列RAR方法更有效,但必须指出的是,在RECOVERY试验中使用的FuR方法虽然导致了最多的试验中死亡,但其效果仅略好。在四臂试验模拟中,自适应随机化方法导致地塞米松组功率增加,洛匹那韦组功率降低。这与内曼的分配规则是一致的,因为增加实验臂的样本量会使其更接近于统计能力最大化的1:1比例。
尽管我们关于治疗效果偏差的结果可能没有显示出一致的模式,但这是治疗效果度量的预期结果,因为每个治疗组诱导的偏差的大小不遵循可预测的模式[23].
更广泛的影响
我们的两臂模拟结果说明了在试验中使用RAR降低患者死亡率和使用FR早期获得统计显著结果之间的权衡。然而,在更有代表性的四臂模拟中,不仅总死亡率降低了,而且在确定地塞米松疗效方面的统计力量也增加了。这里的权衡是分配给疗效较差的洛匹那韦组的概率降低,这将意味着由于缺乏益处的证据,将需要更长的时间来停止分配给该组。尽管如此,鉴于RECOVERY的主要作用是尽快找到有效的COVID-19治疗方法,这似乎是一种值得探索的权衡。发现地塞米松在管理COVID-19方面的有效性以及随后使用该药物治疗患者,据估计已在全球挽救了100万人的生命[24].此外,RAR设计已被证明可以改善试验招募,正是因为患者明白他们有更高的机会获得良好的治疗[25) . .可以说,这可以增加可用的样本量,从而进一步提高功率。《世界医学协会赫尔辛基宣言》第8条规定,获取知识的目标不得先于试验参与者的利益[26],但可以证明FR程序正是这样做的。此外,我们的模拟表明,如果我们优先考虑哪些知识对拯救生命更重要,我们可以更快地获得一些知识。
在这个模拟中,调优算法和REMAP-CAP算法之间的区别非常细微。正如他们的公式所预期的那样,在试验的后期阶段,调优算法倾向于更多地利用优势治疗组,而在REMAP-CAP算法中,各治疗组之间的大招募差异是自我限制的。为了更快地发现地塞米松并挽救尽可能多的生命,调优算法似乎具有优势。然而,在诸如RECOVERY这样的试验中使用它是不太可行的,因为它的调优取决于完成试验的固定时间框架。相比之下,REMAP-CAP算法只依赖于子组内的样本量,因此不存在这种缺陷。
毫无疑问,在试验中实施RAR比FR更具挑战性,这对亚组特异性RAR尤其如此。虽然使用的子组是在试验开始前宣布的,但不可能知道三个组之间的治疗效果会不同,也不可能知道是否应该将其他预先指定的子组分为RAR。在子组级别使用RAR意味着拆分样本,导致每个组的样本量更小。这导致子组(i)的统计功率较低,但由于处理效果较大,子组(iii)的统计功率较高。这意味着治疗效果最大的亚组将从RAR中获益最多。
限制
该模型中仍未解释的一个重要部分是患者漂移。当试验队列的特征(因此其对治疗的反应可能性)在整个试验过程中发生变化时,就会发生患者漂移[27].当使用FR时,患者漂移的影响将被最小化,因为任何变化都将独立于治疗组的分配(例如,如果试验后期出现的患者有更少的共病,标准护理组和地塞米松组都将表现出更低的死亡率)。当使用RAR时,情况并非如此,因为随着试验的进行,表现更好的组将接收更大比例的患者。因此,在计算反应率时,必须注意到患者的特征可能是跨臂不平衡的。数据显示,在整个大流行期间,易感染COVID-19的人群类型发生了巨大变化。这是按年龄组别、种族、社会经济阶层和地理位置划分的[28].同样,病毒本身也可能发生了变化,因为突变发生了,而且不同的分裂和变异变得更加常见[29].治疗大流行的资源也可能发生变化,影响患者存活的可能性。例如,COVID-19患者得到的典型护理随着治疗该疾病的临床知识的提高而变化。此外,如果购买更多的呼吸机或医院的COVID-19患者较少,可能会有更大比例的患者使用呼吸机。这有双重效果,一是使整个队列更有可能存活,因为更多的患者可以获得足够的呼吸支持,二是稀释呼吸机亚组中更健康的患者,因为呼吸机不必只保留给最危急的患者。因此,如果应用RAR,死亡率很可能会因患者、疾病和管理特征差异的混杂效应而倾斜。
此外,与所有自适应试验设计一样,实现RAR会带来一定的操作挑战。在RECOVERY中,这些挑战可以分为可能延长试验设计的挑战和可能影响试验运行方式的挑战。RECOVERY试验的建立和招募病人非常迅速,从方案初稿到第一个参与者的登记只用了9天时间[30.].相比之下,实施RAR可能会在计划试验方面增加额外的障碍,因此可能会延迟招募患者。例如,不同的随机化比率需要一个中央系统进行随机化,这意味着更难预测每个手臂所需的药物供应。关键是,这可能会抵消RAR在试验早期获得研究力的能力,这意味着它可能无法挽救生命。尽管如此,就运行试验而言,许多允许它执行响应自适应随机化的要求已经得到满足。恢复委员会有一个数据监测委员会,RAR将需要它。它大量使用重新使用的药物,减少了安全监测的需要,并且它的主要终点在28天测量,使RAR从试验的早期点开始实施[31,如我们的模拟所示。可以说,RAR的加入可能带来的最大问题是对及时数据收集的要求。鉴于NHS在大流行的某些时刻缺乏资源[32],对临床工作人员来说,找到时间及时记录试验患者及其结果可能是一项挑战。考虑到医院严格的感染控制协议,在现场安排额外的工作人员帮助进行试验也很困难。
同样值得注意的是模拟的简单性。RECOVERY的武器被动态地丢弃和添加。相比之下,我们将其模拟为固定臂试验,没有减少或增加治疗。此外,为了简化模拟,患者的结果是统一批量生成的。这与RECOVERY中发生的情况形成对比,在整个试验期间,可招募的住院患者数量变化显著,这将影响RAR的工作方式。在招募期接近结束时,住院病人人数大幅减少[33].这可能意味着在试验开始时获得了更多的信息,因此随机使用地塞米松的患者比例将比模拟中增加得更快。尽管我们的模拟研究过于简单,但我们相信,研究结果大致准确地描绘了使用FR和RAR程序时,RECOVERY的操作特性会有什么不同。
未来的发展方向
为了在自适应平台试验环境中理解RAR,可以进行进一步的模拟研究,以实现模拟研究的更多动态特征。例如,一旦有足够的信心对武器投掷进行分类,它们是比标准护理更好、相同还是更差,就可以进行模拟。此外,模拟可以更加复杂,以调整不同的招募率和评估患者漂移的影响。最后,可以对以前因covid-19住院的患者进行调查,以确定对RAR的态度。
结论
在RECOVERY中使用RAR可能会导致更多的患者得到最佳治疗,因此在试验中死亡人数更少。当在预先指定的子组中使用RAR时,这些好处甚至更加明显。此外,在RAR下,获得相同研究能力所需的患者更少,因此试验周期更短(假设招募率相同)。在RAR试验中,治疗效果估计出现偏差,但其程度可忽略不计。RAR的使用值得考虑在未来的平台试验中使用。试验人员应该更清楚地认识到对试验内外患者需求的考虑,在决定采取何种平衡之前,患者群体自己也应该进行咨询。
数据和材料的可用性
在当前研究中生成和/或分析的数据集可在github存储库中获得,https://github.com/ts482/RECOVERY_RAR
缩写
- RAR:
-
响应自适应随机化
- FR:
-
固定的随机
- COVID-19:
-
2019冠状病毒病
- 恢复:
-
COVID-19治疗的随机评估
- REMAP-CAP:
-
社区获得性肺炎的随机、嵌入、多因素自适应平台试验
- 带:
-
固定相等的随机性
- 毛:
-
固定不平等的随机化
- Tf:
-
调整整个病人队列的方案
- RMCf:
-
整个患者队列的REMAP-CAP随机化方案
- T年代:
-
对每个子组分别进行调优
- RMC年代:
-
分别对每个子组进行REMAP-CAP随机化处理
参考文献
疾病预防控制中心。医疗工作者[互联网]。疾病控制和预防中心。2020[引用2021年6月24日]。可以从:https://www.cdc.gov/coronavirus/2019-ncov/hcp/non-us-settings/overview/index.html
世卫组织总干事2020年3月11日在2019冠状病毒病(COVID-19)疫情媒体通报会上的讲话[互联网]。[引自2021年5月31日]。可以从:https://www.who.int/director-general/speeches/detail/who-director-general-s-opening-remarks-at-the-media-briefing-on-covid-19%2D%2D-11-march-2020
冠状病毒大流行(COVID-19) -数据-统计与研究[互联网]。我们的数据世界。[引自2021年6月1日]。可以从:https://ourworldindata.org/coronavirus-data
长冠病毒:如何定义和如何管理它。BMJ。2020年9月,7 (370):m3489。
Whitaker M, Elliott J, Chadeau-Hyam M, Riley S, Darzi A, Cooke G,等。在508,707人的随机社区样本中,SARS-CoV-2感染后出现持续症状。2021.可以从:http://spiral.imperial.ac.uk/handle/10044/1/89844.Jun[引于2021年6月27日]
肿瘤学TL. COVID-19与癌症:1年。《柳叶刀》杂志2021;22(4):411。
Torales J, O 'Higgins M, Castaldelli-Maia JM, Ventriglio A. COVID-19冠状病毒的爆发及其对全球心理健康的影响。国际社会精神病学杂志。2020;66(4):317-20。
2020年回顾:COVID-19的12张图[互联网]。[引自2021年6月27日]。可以从:https://blogs.worldbank.org/voices/2020-year-review-impact-covid-19-12-charts
牛津大学。新冠肺炎随机治疗评价[互联网]。clinicaltrials.gov;2021年4月[引2021年5月27日]。报告没有。:NCT04381936. Available from:https://clinicaltrials.gov/ct2/show/NCT04381936
羟氯喹在新冠肺炎住院患者中的作用。中华医学杂志2020;383(21):2030-40。
洛匹那韦-利托那韦用于COVID-19住院患者(恢复):一项随机、对照、开放标签的平台试验——《柳叶刀》[互联网]。[引2022年3月22日]。可以从:https://www.thelancet.com/journals/lancet/article/piis0140 - 6736(20) 32013 - 4 /全文
地塞米松在Covid-19住院患者中的应用。中华医学杂志2019;38(4):369 - 369。
阿巴斯O,阿巴斯A,阿巴斯F,阿巴斯M,阿巴斯S,阿巴斯H,等。托珠单抗在COVID-19住院患者中的应用(复苏):一项随机、对照、开放标签的平台试验。柳叶刀》。2021;397(10285):1637 - 45。
RC组,Horby PW, Mafham M, Peto L, Campbell M, Pessoa-Amorim G,等。Casirivimab和imdevimab在COVID-19住院患者中的应用(复苏):一项随机、对照、开放标签平台试验。medRxiv。2021;6月16日,2021.06.15.21258542。
| COVID-19快速指南:管理COVID-19 |指南| NICE[互联网]。漂亮的;[引2021年7月15日]。可以从:https://www.nice.org.uk/guidance/ng191/chapter/Recommendations
安格斯·DC, Alexander BM, Berry S, Buxton M, Lewis R, pauloni M,等。自适应平台试验:定义、设计、实施和报告考虑事项。新药品发现2019;18(10):797-807。
Pallmann P,寝具AW, Choodari-Oskooei B, Dimairo M,航班L,汉普森LV,等。临床试验中的适应性设计:为什么使用它们,以及如何运行和报告它们。BMC医学2018;16(1):29。
抵抗反应自适应随机化的诱惑。中华临床感染杂志2020;71(11):3002-4。
Covid-19危重患者的白细胞介素-6受体拮抗剂。中华医学杂志2019;38(4):369 - 369。
粗毛格子围巾MJM。社区获得性肺炎的随机、嵌入、多因素自适应平台试验。clinicaltrials.gov.2020;可以从:https://clinicaltrials.gov/ct2/show/NCT02735707.[引自2021年5月26日]。报告没有。:NCT02735707.
核心r团队。R:统计计算的语言和环境[互联网]。奥地利维也纳:R统计基金会。计算。2020;可以从:https://www.R-project.org/.
罗森伯杰,史泰德,李文华。二元响应试验的最优自适应设计。生物识别技术。2001;57(3):909 - 13所示。
王晓东,王晓东。反应适应性临床试验的无偏估计。统计方法医学杂志2017;26(5):2376-88。
数据显示,类固醇挽救了全球100万COVID-19患者的生命。医药J. 2021;可以从:https://pharmaceutical-journal.com/article/news/steroid-has-saved-the-lives-of-one-million-covid-19-patients-worldwide-figures-show.
Tehranisa JS, Meurer WJ。反应自适应随机化能增加急性卒中试验的参与率吗?中风。2014;45(7):2131 - 3。
世界医学协会赫尔辛基宣言。涉及人体的医学研究的伦理原则。《美国医学协会杂志》上。2013; 310(20): 2191。
Villar SS, Bowden J, Wason J.二元反应的反应适应设计:如何在对时间趋势具有鲁棒性的同时为患者提供益处?医药统计2018;17(2):182-97。
Venkatesan P. COVID-19人口结构的变化。《柳叶刀呼吸医学》2020;8(12):e95。
lauuring AS, Hodcroft EB。sars - cov -2的基因变异是什么意思?《美国医学协会杂志》上。2021, 325(6): 529。
Wise J, Coombes R.《Covid-19: RECOVERY试验的内幕》。BMJ。2020; 8 (370): m2670。
昆兰JA,克拉姆斯M.实现适应性设计:后勤和操作考虑。中国药理学杂志2006;40(4):437-44。
Iacobucci G. Covid-19:随着重症监护病床人满为患,英国国家卫生服务系统处于最高警戒级别。BMJ。5 (371): m4296。2020;
英国。2019冠状病毒病每日新增入院人数。我们的数据世界。2021;可以从:https://ourworldindata.org/grapher/uk-daily-covid-admissions.
确认
作者感谢在研究过程中与Sofia Villar, Peter Jacko, David Robertson和Amin Yarahmadi在埃克塞特-剑桥-兰开斯特反应自适应随机化讨论小组中进行的有益讨论。
资金
JB由英国埃克塞特大学(University of Exeter)的一项扩展卓越研究(E3)资助。
TS由NHS商业服务管理局通过NHS学生奖学金计划资助。
BJ得到了皇家德文郡和埃克塞特NHS基金会信托的国家卫生研究所(NIHR)应用研究合作(ARC)的支持。在本出版物中表达的观点只是作者的观点,不一定代表NHS、国家卫生条例或英格兰卫生部的观点。这项研究由埃克塞特大学资助。
作者信息
作者和隶属关系
贡献
TS创建了代码模拟,并编写了初稿。JB对作品的构思和设计、代码模拟以及稿件的编辑都有贡献。BJ对作品的构思和设计做出了实质性的贡献,并帮助编辑了手稿。作者(们)阅读并批准了最终稿。
相应的作者
道德声明
伦理批准和同意参与
不适用。
发表同意书
不适用。
相互竞争的利益
作者声明他们没有竞争利益。
额外的信息
出版商的注意
188博金宝app网施普林格自然对出版的地图和机构附属的管辖权要求保持中立。
补充信息
权利与权限
开放获取本文遵循创作共用署名4.0国际许可协议(Creative Commons Attribution 4.0 International License),该协议允许在任何媒体或格式中使用、分享、改编、分发和复制,只要您给予原作者和来源适当的署名,提供创作共用许可协议的链接,并说明是否有更改。本文中的图片或其他第三方材料包含在文章的创作共用许可中,除非在材料的信用额度中另有说明。如果材料不包含在文章的创作共用许可中,并且您的预期用途不被法律法规允许或超出了允许的用途,您将需要直接从版权所有者那里获得许可。欲查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献放弃书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信用额度中另有说明。
关于本文
引用本文
Sirkis, T, Jones, B. & Bowden, J. RECOVERY是否应该使用响应自适应随机化?来自模拟研究的证据。BMC医学治疗方法22, 216(2022)。https://doi.org/10.1186/s12874-022-01691-w
收到了:
接受:
发表:
DOI:https://doi.org/10.1186/s12874-022-01691-w
关键字
- 新型冠状病毒肺炎
- 复苏
- Response-adaptive随机化
- REMAP-CAP
- 冠状病毒
- 适应性试验
- 试验平台
- 模拟