跳到主要内容

基于贝叶斯随机逼近的I期临床试验剂量寻找设计

摘要

背景

目前I期临床试验的剂量测定设计可以根据30名受试者的样本,根据各种条件正确选择30 - 80%的MTD范围。然而,效率和成本节约方面的需求仍未得到满足。

方法

我们提出了一种新的基于贝叶斯随机逼近的剂量发现设计。该设计的特点是通过局部自适应建模和自由假设毒性概率和超参数利用剂量水平信息。它允许灵活的目标毒性率和不同的队列规模。并通过先前有效样本量对其进行扩展以适应历史信息。通过仿真,将所提出的设计方案与一些常用的方法进行了准确性和安全性的比较。

结果

平均而言,当MTD位于搜索域中的早期或中间位置时,我们的设计可以将正确率提高到60%左右,而在其他情况下,我们的设计与其他竞争方法的性能相当。我们提供了一个免费的在线软件包以方便应用,其中可以预先打印设计的简单决策树。

结论

本文提出了一种新的I期临床试验剂量寻找设计。将该设计应用于未来的癌症试验可以大大提高效率,从而节约成本和缩短开发周期。

同行评审报告

简介

在过去的十年中,研究型新药的应用和早期临床试验呈快速增长的趋势。然而,I期试验(过渡)成功的概率仍低至50%左右,特别是肿瘤药物[1].寻量设计的质量和性能成为晚期研制成功的关键。我们的重点是设计确定最大耐受剂量(MTD)的抗癌药物,假设毒性的概率是单调增加的剂量。假设有限样本只有30个受试者,目前的设计可以正确选择/估计约50%的MTD [2],以满足临床需要,这方面仍有很大的改进空间。表示在剂量下发生剂量限制毒性(DLT)事件的概率x通过\(\π(x) = \ mathrm{公关}(y = 1 | x) \),在那里y为DLT的二进制响应。然后,简而言之,给定一个预先指定的可接受毒性率\α(\ \),如20%或30%时,剂量寻找设计可视为从有限候选剂量集合中对分位数的顺序估计\ (\ mathcal C {} \),也就是说,\ (d ^ * = \ mathrm {argmin} _ {d \ \ mathcal {C}} | \ pi (d) -α| \ \)

关于该问题的方法已有丰富的文献,一般可分为三类:基于算法的方法、基于模型的方法和模型辅助的方法。的\ (3 + 3 \)方法(3.是最流行的基于算法的设计。剂量增加的简单规则使临床医生易于使用和获取。尽管它效率低下,正确率低至30% [45],它仍然被制药公司和当局广泛采用。基于模型的方法允许跨剂量借用信息。它们通常由两个步骤组成。第一步是为基本剂量响应曲线假设一些参数模型。第二步使用贝叶斯范式更新参数的后验分布和毒性率的诱导分布,据此决定下一剂量。一些流行的方法包括持续再评估法[6],过量控制的升级(EWOC) [78]和贝叶斯逻辑回归模型(BLRM) [9].近年来,模型辅助间隔设计得到了广泛的应用。该设计首先将毒性概率空间划分为三个子区间,分别代表升级、停留和降级的决策区域。这些设计根据三个间隔的后验覆盖率来决定下一个剂量。具体来说,Ji等人。[10]提出了一种改进的毒性概率区间(mTPI),以基于单位概率质量顺序确定下一剂量。郭等人提出了一个改进的版本,称为mTPI-2。[11以避免一些次优解决方案。后来证明它相当于Yan等人的键盘设计。[212].刘与元[13]提出了一种贝叶斯最优区间(BOIN)设计,该设计通过阈值观察到的毒性率来确定下一剂量,从而从假设检验的角度最小化决策误差。

基于规则的方法(包括基于算法和模型辅助的方法)的一个重要优势是透明性。统计学家可以提前将所有可能结果的场景和相应的剂量分配决策制成表格,这样临床医生就可以很容易地执行它,而无需求助于额外的计算工具。另一方面,这些基于规则的方法的低效率源于对确切剂量信息的无知(因为只使用剂量的等级)和搜索路径的轨迹。3+3方法的目标是DLT概率从1/6到1/3,只使用当前剂量下的频率信息进行决策[14].基于模型的方法会在两个方面失去效率。首先,他们可能会过度强调全球拟合剂量-毒性曲线,而实际兴趣是a的点估计当地的分位数。例如,当MTD位于高剂量区域时,使用在低剂量水平收集的数据来更新参数分布是不明智的。其次,该方法依赖于一些关于先验、超参数和阈值的主观假设/规范。不同的规格会导致MTD选择的结果显著不同。

在另一种方法中,分位数估计问题已使用随机近似处理[15在敏感性实验中。多年来,人们提出了一些有用的变体来提高效率[1617].然而,对于剂量寻找问题,它受到离散势垒的影响[18].

本文试图解决这些效率低下的问题,提高估计精度。我们提出了一种基于Xu等人介绍的贝叶斯随机逼近方法的新设计。[19其思想是使用局部线性模型和贝叶斯方案,直接在搜索路径上顺序估计感兴趣的分位数。结果表明,该设计具有所需的相干性和一致性。此外,它具有简单的意义,既不需要毒性概率的预先说明,也不需要参数的主观先验。我们表明,该设计可以扩展到通过先前有效样本量纳入历史信息。大量的仿真表明,该方法在准确性和过量控制方面优于一些常用方法。平均而言,在30个被试样本的基础上,当MTD位于搜索域的早期或中间位置时,所提出的设计能够正确选择约60%的MTD,而在其他情况下,所提出的设计的性能与其他竞争方法相当。

免费套餐载于https://bsa4df.shinyapp.io/BSA_app提供的目的是为应用程序提供一个预打印的决策树,用于后续三个队列,便于从业者使用。

方法

设计

假设K剂量。为了简化模型,我们需要两个简单的预处理。第一个预处理过程是按(0,1)的剂量水平按升序排列\(\mathcal {C} = \{d_1,\ldots,d_K\}\).可以根据原比例尺或对数比例尺的剂量水平范围绘制线性图,以便剂量水平在区间(0,1)内充分分布。例如,剂量水平1、2、3、4、5通过转换可转换为0.1、0.3、0.5、0.7、0.9\ ((x - 0.5) / 5 \)100、200、400、800的剂量水平通过变换转换为0.28、0.59、0.77、0.91\ (\ {\ log (x) 4 \} / 2.2 \)(一个通用规则描述在补充材料)。第二个预处理过程是将(0,1)等分为年代小区间。这对于局部建模是非常重要的,因为我们每次只关注其中一个子区间。的值年代决定子区间的长度。由于第一阶段试验样本量不足,我们在实践中建议使用较小的整数,如3或4。敏感度分析将在后面提供。

我们应用贝叶斯随机近似(BSA) [19来构建顺序设计。这个过程总结如下。

像往常一样将队列大小设置为3个。我们开始用最低剂量治疗第一批病人。为\ (n = 1 2 \ ldots \),假设电流的剂量水平nth队列是\ (x_n \),对应于\ (d_k \).然后,\ (x_n \)是否包含在子区间中\ ((v_0, v_1] \),在那里\(v_0=(\ leil x_ns \ leil -1)/s\)\(v_1=\ ceil x_ns \ ceil /s\)而且\ (\ lceil \ cdot \ rceil \)是天花板的功能。例如,\ \ (x_n = 0.2 (0, 1/3] \)\ (s = 3 \).让\ (y_ {na} \)的二进制响应一个队列第Th例患者n.的累积数据nth队列,\ (\ mathcal {D} _n”= \ {(x_i, y_ {ia}): i = 1, \ ldots, n = 1, \ ldots 3 \} \).值得注意的是,该设计在整个试验过程中允许不同的队列规模,例如,队列1为三个受试者,队列2为一个受试者。我们在敏感性分析中提供更多的讨论。

\θ(\ \)表示的根\ \(πα(x) = \ \),也就是说,\(\theta =\pi ^{-1}(\alpha)\).当我们假设时,它是唯一的\π(x) (\ \)是严格增加。首先,近似\π(x) (\ \)\ ((v_0, v_1] \)通过该点的线段\(α\θ,\ \)给出的\(F(x) = \alpha + \beta (x-\theta)\).见图S中的插图1.用表示线段在两端的值\ \(ρ_0 = F (v_0) \)而且\ \(ρ_1 = F (v_1) \).的单调性\π(\ \),假设β\ (\ \)是正的。,我们有\ \(ρ_0 < \ρ_1 \).局部自适应建模集中于当前剂量的邻近区域,并将“外部”数据的不必要影响最小化。它提高了后续贝叶斯估计的效率。线性模型满足局部建模的需要,计算和解释简单。

第二,我们强加了一个非信息性的统一先验(\ \(ρ_0,\ρ_1)\)(密度\(2我(0 < \ρ_0 <ρ_1 < 1)\ \),在那里为指标函数)。该先验精确地反映了剂量-毒性关系的单调性假设。它避免了以其他方式参数化的变量的先验的主观规范,如Babb等人所述的截距和斜率。[7Neuenschwander等人。[9].在此先验的基础上,我们导出了对的诱发关节先验\(θ)(β\ \ \)

第三,使用含有当前子区间内剂量的数据\ ((v_0, v_1] \)的后验分布\(θ)(β\ \ \).然后,计算的后验边际\θ(\ \),用h \(θ)(\ \)的后均值\θ(\ \),用\(\ mathm {E}(\theta |\mathcal {D}_n)\),后者是所期望分位数的贝叶斯估计。的后验分布是无信息先验的一个显著结果\θ(\ \)可以递归解析地得到,从而使计算简单,无需使用马尔可夫链蒙特卡洛。(详见Xu等人。]19])

最后,确定下一个队列的剂量为当前剂量附近最接近目标剂量后验均值的剂量,即:\(间{n + 1} = d_ {^ *} \),在那里

$ ${对齐}^ * = \ \开始mathrm {argmin} \左\ {| d_a - \ mathrm {E}(θ| \ \ mathcal {D} _n”)|:a = \马克斯(k - 1, 1), k, \ min (k + 1, k) \ \}。\{对齐}$ $
(1)

这样,实践中通常要求的跳过剂量是不允许的。

所提出的设计具有两个令人满意的特性。首先,设计满足张引入的相干性[20.,即当DLT反应在当前剂量下为1(或0)时,剂量上升(或下降)的概率为0补充材料)。当DLT事件发生时,剂量的增加是不允许的,因此这种有限的样本特性对临床医生很有吸引力。第二,由许等人的命题2。[19和Oron等的定理1。[21我们有估计量的一致性,即,\ (x_n \)收敛于* \ \ (^)几乎可以肯定。

算法

我们将提出的设计的算法总结如下。

  1. 步骤1:

    用最低剂量治疗第一批患者\ (d_1 \)

  2. 步骤2:

    在当前的剂量\ (d_k \),确定\ ((v_0, v_1] \)和子区间中包含的数据。的后验分布\θ(\ \)确定下一个剂量(1).

  3. 步骤3:

    重复步骤2,直到样本容量用尽。选择下一个剂量为MTD。

在实践中,可以采取一些快速操作来加速算法,而无需调用步骤2中的贝叶斯计算。首先,在第一次出现DLT之前升级。前提是在当前剂量之前没有发生过DLT事件\ (d_k \),为下一个队列按剂量进行实验\ (d_ {k + 1} \)无论何时定义它。Simon等人采用了这一步骤。[22和Riviere等人。[23].

第二步,在步骤2中,在积累了一定数量之后,比如说\ (m_0 \),我们构建了一个wald型区间,以快速决策下一个剂量,且置信度高。具体地说,让\ (m_k \)表示在接受治疗的病人人数\ (d_k \),让\ (\ widehat {p} _k \)为DLT的相对频率\ (d_k \).的单调性,我们采用池-邻接-违规者算法\ (\ widehat {p} _k \).例如,替换\ (\ widehat {p} _k \)为DLT相对频率的平均值\ (d_k \)和前一剂量DLT的相对频率,如果它们不是单调的[13]。)让\ (\ mathrm{分对数}(x) = \ log \ {x / (1 - x) \} \)表示logit函数。当\ (m_k \)是大,说不少于\ (m_0 \)在我们的案例中,通过大样本理论和delta方法,\ (\ mathrm{分对数}(\ widehat {p} _k) \)近似分布为\ (N (\ mathrm{分对数}(p_k) \ {m_kp_k (1-p_k) \} ^ {1}) \).表示作为上标准正态分布的百分位。如果\ (p_k \)接近\α(\ \),则概率为\ (\ mathrm{分对数}(\ widehat {p} _k) \)在间隔中落下.或者同样的\ (\ widehat {p} _k \)在间隔中落下\ \ ((\ {1 + exp {(c₁)}\}^ {1},\ {1 + \ exp {(c₂)}^ {1}\})\).(注意,logit转换使的分布\ (\ mathrm{分对数}(\ widehat {p} _k) \)比…更对称(或更不倾斜)\ (\ widehat {p} _k \))。如果\ (\ widehat {p} _k \)是否小于区间指示的下限\ (d_k \)在MTD以下有较高的置信度,升级到\ \ (min (d_ {k + 1}, d_K) \).如果\ (\ widehat {p} _k \)是否大于区间的上限,表明\ (d_k \)为MTD以上,置信度高,降级为\ \ (max (d_ {k - 1}, d_1) \).特别是,如果\ (\ widehat {p} _1 \)大于区间的上界,我们将终止毒性试验[11].否则,当\ (\ widehat {p} _k \)时,采用贝叶斯方法进行过渡决策。要有高度的信心,我们定\ \(ξ= 0.05 \)相当于90%的置信区间\ (m_0 = 12 \)13].事实上,大量的实验,如30个实验中有12个,在特定剂量上表明MTD具有很强的收敛性。

例子

我们通过O 'Quigley等人的一个例子来说明所提出的设计和算法的应用。[6].剂量-毒性反应曲线由\ (\ mathrm{公关}(y = 1) = [\ {\ mathrm{双曲正切}(x) + 1 \} / 2) ^ 2 \),其中六个候选等级的选择如下。

$ ${对齐}\ \开始开始{数组}{c c cccccc} 1 k和{}和{}和{}2 & 3{}和{}4 & 5、6{}{}\ \ \文字{原始剂量水平}和{}\四-1.1和-1.47{}和{}和{}-0.69 & 0.0 & -0.42 &{}{}{}\ 0.42 \ \文字{剂量水平扩展}和{}\四0.20和0.015{}和{}和{}0.405 & 0.75 & 0.54 &{}{}{}\ \ 0.96 \文本{毒性概率}和{}\四0.01和0.002{}和{}和{}0.04 & 0.24 & 0.09 &{}{}{}\ \ 0.49 \结束数组{}\{对齐}$ $

目标毒性率为20 \ % \ \ ().因此,MTD是第五剂。对于所提出的方法,剂量水平通过变换缩放\ ((x + 1.5) / 2 \),下MTD为0.75。我们设置\ (s = 3 \)用于整个局部建模。

图的上面板。1显示了由所提方法获得的一条搜索路径(1,2,3,4,5,6,5,5,5,5)。可以看到,病情快速升级,直到第6队列中第18例患者出现第一例DLT。然后,设计开始在包含6个数据点的子区间(0.667,1)上构建局部模型。的后验均值\θ(\ \)第6个队列后的剂量为0.729,这导致同一子间隔内的第5个剂量水平。在第七个队列中,观察到零DLT和后验均值\θ(\ \)是0.776,又到了第五剂量水平。在第8个队列中,观察到1个DLT,后验均值降至0.760,仍提示保持不变。随后的第9和第10组没有观察到任何DLT。后验均值分别增加到0.791和0.814,维持在第5剂量水平。图的下面板。1给出了相应后验密度的演化\θ(\ \)在第六到第十队之后。可以看到,在7个队列中,观察到零DLT后,后密度向右偏移了更多的质量,在8个队列中,遇到1个DLT后,后密度向左偏移了更多的质量。第9组和第10组后密度再次逐渐右移,未观察到DLT。总的来说,我们看到搜索路径是稳定的,有一个振荡和快速收敛。中还提供了其他方法的搜索路径补充材料

图1
图1

上面板:一条可达10步的搜索路径,用于目标毒性概率0.2,其中观测值为\(最大\)沿着剂量水平用空圆圈表示0,用填充符号表示1。的后验密度(乘上某个常数以作说明)的演化\θ(\ \)在第六到第十组之后。虚线表示子区间的极限,实线表示在0.75处的根

将历史信息

当历史信息可用时,人们希望设计以合理的方式将其纳入。周等人。[24]提出了一个统一的框架,利用框架和先验有效样本量(PESS)来整合信息丰富的先验信息,并推荐了iBOIN方法。段等人。[25]提出了Hi3+3方法,首先通过幂先验方法从历史信息中确定PESS,然后应用i3+3程序[26]转换为合并的数据。

在Zhou等人之后,我们扩展了所提出的方法,将历史信息纳入其中。[24].为\ (k = 1 \ ldots k \),让\ (p_k = \π(d_k) \).的先验概率\ (p_k \),即骨架(如客户关系管理),由\ (q_k \).让\ (n_ {0 k} \)为剂量水平的PESS\ (d_k \).为了确定PESS,我们遵循两条经验法则[24].首先,如果有强有力的证据表明先验是正确指定的,选择大PESS借用更多的信息,以提高准确性和可靠性。第二,如果先验是模糊的,设置\ (n_ {0 k} \)是[中的整数N/ (3K),N/ (2K),N是允许的最大样本量。例如,当\ (N = 30 \),我们设置\ (n_ {0 k} = 3 \)或2\ (K = 5 \)分别或6。让\ (a_k \)而且\ (b_k \)的最近整数\ (n_ {0 k} q_k \)而且\ (n_ {0 k} (1-q_k) \),分别。例如,当\ (q_k = 0.3 \)而且\ (n_ {0 k} = 3 \)\ (a_k = 1 \)而且\ (b_k = 2 \).然后,我们简单地赋值\ (a_k \)DLT事件和\ (b_k \)非dlt事件作为已存在的剂量观察\ (d_k \)在算法的步骤2中。这些\ (a_k + b_k \)观察和随后的观察\ (d_k \)结合起来计算似然函数。我们将这种改进的算法称为hBSA。

比较和评价指标

我们将提出的BSA方法与6种流行的方法进行比较,即3+3 [3.], CRM [6], mTPI [27], mTPI-2 [11],保盈[13和键盘[12].3+3方法由R包进行UBCRM28].CRM、mTPI、mTPI-2和BOIN由商业软件“East BAYES”执行,默认设置用上标1注明。此外,客户关系管理、BOIN和键盘都是通过at的免费软件实现的trialdesign.org,用上标2标明。

我们使用以下四个指标来评估设计的性能。

  1. 我:

    正确选择百分比(PCS)

  2. 2:

    分配到MTD的患者百分比(MTD%)

  3. 第三:

    超过MTD治疗的患者百分比(高于MTD%)

  4. 四:

    整个试验中观察到的dlt的平均数量(dlt的数量)

PCS和MTD%都反映了估计的准确性。后者也揭示了收敛到MTD的速度。指标III和IV分别从过量控制和不良事件的总成本方面评估安全性。在整个过程中,我们在10个规模为3的队列中将最大样本量设置为30,并将重复次数设置为10,000。

结果

解决方案案例

我们采用Yan等人提出的20个具有代表性的毒性率情景。[12]表格S1,其中,前10种情况的目标毒性率为20%,后10种情况的目标毒性率为30%,这样,在5种剂量中,MTD的位置是从低水平到高水平。我们首先将剂量水平转换为0.1、0.3、0.5、0.7、0.9,如前所述,并设置子间隔的数量年代始终是三个。敏感性研究年代稍后给出。

电脑的MTD数字2为3+3、CRM得到的PCS的对比\ (^ 2 \),保盈\ (^ 2 \)和组织。(dld数量的值替换为CRM中的对应值1 \ \ (^),保盈1 \ \ (^)因为它们无法从免费软件中获得。)从商业软件(mTPI, mTPI-2, CRM1 \ \ (^),保盈1 \ \ (^))要么通过免费软件接近各自的对手,要么一致低于BOIN\ (^ 2 \).键盘计算结果与BOIN计算结果非常接近\ (^ 2 \),据Yan等报道。[12].因此,它们在图形比较中被排除在外。表S给出了所有七种竞争方法的完整结果2

3+3法的效率较低,平均PCSs分别为37.5%和32.0%\(α= 20 \ \ % \)和30%,分别。下\(α= 20 \ \ % \),提出的BSA方法在五个场景(sc 1-4和sc 6)中产生了最高的PCS,其中MTD位于较低的水平。第二名的优势差距高达10%。CRM\ (^ 2 \)在MTD位于较高水平的其余5个场景(sc 5,7 - 10)中产生最高的PCS。平均而言,BSA和CRM表现最好的两个个体的PCS\ (^ 2 \)分别为51.4%和53.3%。这揭示了之前所指出的BSA的保守性,特别是在目标DLT概率较小、MTD定位较晚的情况下。下\ \(α= 30 \ % \)在前八种情况下(sc 11-18), BSA产生的PCS最高(均超过50%),其中MTD位于前四个水平。第二优的优势幅度从3%到20%不等。这表明,在最具代表性的场景下,现有方法有了显著的改进。CRM\ (^ 2 \)在剩下的两个场景(sc 19-20)中,MTD位于最高(第五)层,产生最高的PCS。平均而言,BSA和CRM表现最好的两个个体的PCS\ (^ 2 \)分别为62.5%和56.4%。最后,我们注意到MTD在最后一个级别的情况9,10,19,20在现实中是罕见的,因为临床医生会提出一个从历史试验或PK/PD研究中引出的搜索域,并指定候选人,这样猜测的MTD就不会接近搜索窗口的末尾。

MTD %MTD%的结果与PCS的结果一致。对于较低水平的MTD情况(sc 1-4下),表现最好的最高值是BSA\(α= 20 \ \ % \)sc11 - 16下\ \(α= 30 \ % \))或CRM\ (^ 2 \)对于较高级别的MTD情况(sc 5-10之下)\(α= 20 \ \ % \)和sc17 - 20之下\ \(α= 30 \ % \)).完整结果见表S3.

图2
图2

PCS和MTD%由四个竞争设计获得。数值越高越好

above-MTD %BSA除在估计精度方面表现优异外,在过量控制方面的优势更为明显。数字3.和表年代4显示BSA在20个场景的7种竞争方法中产生的高于mtd的百分比最低。排名第二的平均改善幅度约为6%。这是由于BSA的保守性和搜索路径的单调性造成的。另一方面,CRM和BOIN等方法在剂量升级方面更具有库性。

数量的dlt我们注意到,与3+3的比较不应被认为是其已知的低估倾向。提出的BSA方法在16种情况下(sc 3 - 10和13-20),当MTD不是在第一级(6种竞争方法中,不包括3+3),产生最小的dlt数量。当MTD处于第一级时(场景1-2和场景11-12),BSA的性能与其他算法的性能相当,平均最大ddt个数为0.7。完整结果见表S5

图3
图3

以上mtd %和#的dlt由四个竞争的设计。值越低越好

BSA的快速行动章节中描述的BSA的快速行动2.2取决于中毒的实际概率。例如,在场景9、10、19和20中,早期剂量的毒性概率相当小,而MTD位于最后一剂,由零DLT事件(2.49 . 0\ \ (sim \)3.73次/ 10)或沃德式间隔(0.64次/ 10)\ \ (sim \)0.99 / 10)比其他场景占据更多的位置。我们强调这些频率作用与贝叶斯方法的混合节省了计算成本,并且对估计精度几乎没有影响。详细结果见表S6

使用历史信息的性能为节省篇幅,我们将在已有历史资料的情况下将拟议的hBSA与iBOIN进行比较的时间推迟到补充材料.总之,在正确指定骨架的情况下,提出的hBSA在平均估计精度上优于iBOIN。当MTD位于搜索域的早期或中期位置时,这种优势更加明显。当骨骼指定错误时,hBSA的表现与iBOIN相当,在早期或中期位置对MTD有利,在晚期位置对MTD不利。无论骨架是否正确指定,hBSA的过量控制效果都明显优于iBOIN。

随机场景情况下

现在把目标利率定在30%。我们在部分中重复比较3.1在更多随机生成的场景下。我们采用Clertant等人的伪均匀算法[29生成200个随机场景(毒性的概率)\ (K = 5 \)和6个,MTD同样可能位于前四个剂量,其中MTD与其相邻剂量之间的毒性概率差距在(0.05,0.3)以内[24].20个随机场景\ (K = 5 \)和6如图S所示4

对于提议的BSA方法,我们首先使用与节中相同的剂量水平(由等级派生)3.1,简称“BSA(固定)”。其次,为了检验使用精确剂量信息的性能,我们随机生成剂量水平。具体地说,我们首先设置MTD\ (d_k \),取0.3、0.5、0.7分别表示搜索域中的早、中、晚位置,然后生成\ (k - 1 \)剂量的\ ((0, d_k - 0.05) \)而且\ (k次方\)剂量的\ ((d_k + 0.05, 1) \),其中附近\ ((d_k - 0.05, d_k + 0.05) \)为了使其与其他剂量区别开来,我们制造了MTD的剂量。我们将这三种设置下的BSA分别称为“BSA(精确,早期)”、“BSA(精确,中期)”和“BSA(精确,晚期)”。注意,其他相竞争的方法不区分这种位置规范,因为只使用秩。

数据4而且5比较3+3 CRM的性能(在四个指标中平均超过200个随机场景)\ (^ 2 \),保盈\ (^ 2 \)和组织。所有七种方法的完整报告见表S13.总的来说,结果与固定情景下的结果一致。在估计精度方面,3+3方法表现最差,两者的平均PCS均低于30%\ (K = 5 \)和6。mTPI和mTPI-2产生的平均PCS约为47-51%。CRM、BOIN和键盘的性能与pc的平均性能相当,约为53% (% \ \ 1下午(\ \))(两个\ (K = 5 \)6).提出的BSA(固定)产生了改进的结果,平均PCS为57.1%和58.0%\ (K = 5 \)分别和6。BSA(精确的,早期的)的平均PCS为60.5%和58.0%\ (K = 5 \)分别和6。BSA(精确,中间)的平均PCS为64.8%和64.4%\ (K = 5 \)和6分别表示至少10%的优势导致其他竞争方法。BSA(精确的,晚的)的平均PCS为56.7%和56.8%\ (K = 5 \)和6,这仍然优于其他竞争方法。第二个精度指标MTD%的结果与PCS的结果一致。所提出的BSA方法(固定或精确)均优于其他竞争方法,MTD%均为最大值\ (K = 5 \)和6。值得注意的是,其他六种竞争方法的准确性结果与Zhou等人报道的结果一致。[2].关于其他两个安全指标,提出的方法显示出显著优于其他六种方法,根据MTD的位置,该方法的过量(高于MTD)率比第二好的方法减少3-10%。在排除保守的3+3方法后,该方法控制的dlt数量与其他方法相当。

图4
图4

四种竞争设计在随机场景下的表现\ (K = 5 \)

图5
图5

四种竞争设计在随机场景下的表现\ (K = 6 \)

再次,我们推迟了与iBOIN在历史信息存在的比较的结果补充材料.结果与固定情景下的结果相似。

敏感性分析

我们首先对所提出的方法进行了关于子区间数的灵敏度分析年代通过重复节中的模拟3.1.回想一下,年代确定子区间的长度,在此基础上收集最新数据并建立局部模型。表的年代15和S16报告BSA的四个指标年代分别设置为5和7。可以看出,他们的表现与不足的学生相当\ (s = 3 \)(表2- s5),平均PCS变化幅度在1%以内。一般来说,子区间的数量决定了用于过渡决策的局部信息的数量。较小的值年代意味着更大的子区间或更多的本地数据点,这将导致更保守的转换操作。因此,它有利于MTD处于早期位置的情况。另一方面,较大的值年代结果更积极的决策和倾向于MTD在后期的情况。为了平衡相关性和准确性,我们建议设置\ (s = 3 \)(子区间宽度为1/3)\ (le 6 K \ \)而且\ (s = 5 \)(子区间宽度为1/5)通用电气\ (K \ \ 7日)在实践中。当然,大号的K需要更多的样本量。

其次,我们研究了队列规模的影响。我们将队列大小设置为1(即完全顺序设计)、2和随机变化的数量\(\{1、2、3 \}\),同时保持最大样本量为30。(因此对应的队列数分别为30、15和10 ~ 30之间的数字。)这样的设置使设计更加自由,因为在每个队列中移动所需的样本更少。我们在相同的20个具有代表性的场景下使用这些设置进行BSA设计。表的年代17和S18结果表明,与固定队列规模为三个的设计相比,较小队列规模和不同队列规模的设计的性能\(\{1、2、3 \}\)提高了准确性,特别是当MTD停留在较晚的位置,并在过量控制中作为必要的划痕而明显下降时,平均仍优于其他竞争方法。这表明,所提出的设计非常适合于弹性收益。

第三,我们重复Section中的模拟3.2MTD随机分配给所有人K剂量。与表S平行13和S14,表19和S20.在没有或存在历史信息的情况下,报告四个指标,并与各自的竞争方法进行比较。可以看到,结果与前四剂MTD时的结果相似。

讨论

我们为I期临床试验提出了一种新的剂量寻找设计。该设计采用贝叶斯随机逼近方法(i)考虑剂量水平信息以提高估计效率(ii)不需要预先说明参数。所提议的设计的一个显著优势是,它允许在整个试验中改变队列规模。这种灵活性使设计能够适应不同的应计情况,例如,使用小队列规模的慢应计和使用大队列的快应计。

通过商业软件或自由软件与一些流行的方法进行比较,我们表明基于30个样本的BSA设计在PCS为的情况下产生了估计精度\ \ (sim \)60%为早期或中期MTD的常见病例。而且它在过量控制方面要安全得多。新设计的计算简单。我们提供了一个免费的在线软件包以方便应用程序,它预先打印了图形化的决策规则。中的R Shiny应用程序的使用说明补充材料.模拟的R代码提供在补充材料

与其他估计MTD的设计一样,所提出的设计假定剂量-毒性关系的单调性。因此,它不适用于假设不一定成立的最佳生物剂量。

最后,我们注意到设计的扩展,以处理联合药物和纳入协变量,如区域或种族的影响是值得进一步研究的。

数据和材料的可用性

在研究过程中产生或分析的所有数据都包含在本文及其补充信息文件中。

参考文献

  1. 生物技术创新组织。2011-2020年新临床开发成功率报告。www.bio.org/clinical -发展-成功——利率-和-贡献因素- 2011 - 2020.2022年7月30日访问。

  2. 周辉,袁勇,聂磊。新型一期试验设计的准确性、安全性和可靠性。《临床癌症杂志》2018;24:4357-64。

    文章谷歌学术搜索

  3. 仓库保管员。I期临床试验的设计和分析。生物识别技术。1989;45:925-37。

    中科院文章谷歌学术搜索

  4. Reiner E, Paoletti X, O 'Quigley J.标准I期临床试验设计的操作特点。计算统计数据肛门1999;30:303-15。

    文章谷歌学术搜索

  5. 李俊杰,萧丽玲。I期癌症临床试验中的剂量递增方法。美国国家癌症杂志2009;101:708-20。

    文章谷歌学术搜索

  6. 王晓燕,王晓燕,王晓燕,等。癌症I期临床试验持续再评估方法的实践设计。生物识别技术。1990;46:33-48。

    文章谷歌学术搜索

  7. Babb J, Rogatko A, Zacks S.癌症I期临床试验:有效剂量增加与过量控制。统计医学。1998;17:1103-20。

    中科院文章谷歌学术搜索

  8. 癌症临床试验中的剂量发现与过量控制(EWOC)。统计科学。2010;25:217-26。

    文章谷歌学术搜索

  9. Neuenschwander B, Branson M, Gsponer t。I期癌症试验的贝叶斯方法的关键方面。统计医学。2008;27:2420-39。

    文章谷歌学术搜索

  10. 姬莹,刘萍,李莹,Bekele BN。一种剂量寻找试验的改良毒性概率区间法。中国新药试验。2010;7:653 - 63。

    文章谷歌学术搜索

  11. 郭伟,王淑娟,杨松,林宏,季勇。一种针对Ockham剃刀的贝叶斯区间剂量寻找设计:mTPI-2。当代临床试验。2017;58:23-33。

    文章谷歌学术搜索

  12. 颜芳,袁勇,Mandrekar SJ。键盘:一种新的I期临床试验的贝叶斯毒性概率区间设计。临床癌症杂志2017;23:3994-4003。

    文章谷歌学术搜索

  13. 刘松,袁勇。I期临床试验的贝叶斯最优间隔设计。J . R . Stat Soc Ser . 2015; 64:507-23。

    文章谷歌学术搜索

  14. Yuan Y, Hess KR, Hilsenbeck SG, Gilbert MR. Bayesian最优区间设计:一种简单且性能良好的肿瘤I期试验设计。clinincancer Res. 2016; 22:4291-301。

    文章谷歌学术搜索

  15. 王晓明,王晓明。一种随机逼近方法。安数学统计1951;22:400-7。

    文章谷歌学术搜索

  16. 随机逼近。安Stat。2003;31:391 - 406。

    文章谷歌学术搜索

  17. 约瑟夫虚拟现实。二进制数据的高效robins - monro程序。生物统计学。2004;91:461 - 70。

    文章谷歌学术搜索

  18. 张YK。随机近似和基于现代模型的剂量发现临床试验设计。统计科学。2010;25:191 - 201。

    文章谷歌学术搜索

  19. 徐军,穆锐,熊晨。一种贝叶斯随机逼近方法。J统计计划推断。2021;211:391-401。

    文章谷歌学术搜索

  20. 张YK。剂量测定研究中的相干原则。生物统计学。2005;92:863 - 73。

    文章谷歌学术搜索

  21. 奥伦美联社,阿兹瑞尔·D,霍夫警局。剂量测定设计:收敛性质的作用。国际生物化学杂志,2011;7:39。

    谷歌学术搜索

  22. Simon R, Rubinstein L, Arbuck SG, Christian MC, Freidlin B, Collins J.肿瘤I期临床试验的加速滴定设计。中华肿瘤杂志1997;89:1138-47。

    中科院文章谷歌学术搜索

  23. 王晓燕,王晓燕,王晓燕。基于logistic模型的药物联合临床试验贝叶斯剂量寻找设计。制药Stat。2014;13:247-57。

    文章谷歌学术搜索

  24. 周勇,李俊杰,王松,Bailey S,袁勇。结合历史信息改进I期临床试验设计。制药Stat。2021;20:1017-34。

    文章谷歌学术搜索

  25. 段勇,王淑娟,季勇。Hi3+3:借鉴历史数据的模型辅助剂量寻找设计。当代临床试验。2021;109:106437。

  26. 刘敏,王淑娟,季勇。i3+3 I期临床试验设计。《生物危害杂志》2020;30:294-304。

    文章谷歌学术搜索

  27. 季勇,王士杰。改良毒性概率区间设计:在实际的I期试验中,比3+ 3设计更安全、更可靠。中华临床杂志2013;31:17 5 - 21。

    文章谷歌学术搜索

  28. UBCRM:模拟和进行剂量上升I期研究的功能。2015。R包版本1.0.1。https://cran.r-project.org/package=UBCRM.2022年9月14日访问。

  29. 刘志军,李志军。半参数剂量计算方法的研究。J R Stat Soc Ser B. 2017; 79:1487-508。

下载参考

确认

作者感谢袁世杰为东贝叶斯计算提供的帮助。

资金

本研究得到教育部统计与数据科学先进理论与应用重点实验室基金资助。

作者信息

作者和联系

作者

贡献

所有的作者都对稿件的设计、模拟和草稿做出了贡献。张大鹏准备了这款闪亮的应用。作者们阅读并批准了最终稿。

相应的作者

对应到金徐

道德声明

伦理批准和同意参与

不适用。

同意出版

不适用。

相互竞争的利益

作者声明他们没有竞争利益。

额外的信息

出版商的注意

188博金宝app网施普林格自然对出版的地图和机构附属的管辖权要求保持中立。

补充信息

额外的文件1:

补充材料。

权利和权限

开放获取本文遵循创作共用署名4.0国际许可协议(Creative Commons Attribution 4.0 International License),该协议允许在任何媒体或格式中使用、分享、改编、分发和复制,只要您给予原作者和来源适当的署名,提供创作共用许可协议的链接,并说明是否有更改。本文中的图片或其他第三方材料包含在文章的创作共用许可中,除非在材料的信用额度中另有说明。如果材料不包含在文章的创作共用许可中,并且您的预期用途不被法律法规允许或超出了允许的用途,您将需要直接从版权所有者那里获得许可。欲查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献放弃书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信用额度中另有说明。

再版和权限

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

徐建军,张东,穆锐。基于贝叶斯随机逼近的I期临床试验剂量寻找设计。BMC医学治疗方法22258(2022)。https://doi.org/10.1186/s12874-022-01741-3

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/s12874-022-01741-3

关键字

  • 自适应设计
  • 研究
  • 最大耐受剂量
  • 随机近似