摘要
背景
在随机对照试验中,缺失数据是普遍存在的。尽管对不同缺失数据机制(随机缺失与非随机缺失)的敏感性分析被广泛推荐,但它们在实践中很少进行。本研究的目的是使用潜在生长模型(LGM)对随机对照试验中缺失数据机制的不同假设进行敏感性分析。
方法
数据来自一项随机对照短期酒精干预试验。样本包括1646名成年人(56%为女性;平均年龄= 31.0年),来自收到三封个性化酒精反馈信或评估的普通人群。12个月和36个月后通过电话进行了随访采访。分析的主要结果是随着时间的推移酒精使用的变化。采用了三步LGM方法。首先,通过分析两种研究条件中缺失值的程度、缺失数据模式和使用逻辑回归预测参与两次随访评估的基线变量,积累了关于生成缺失数据过程的证据。其次,计算增长模型以分析干预措施随时间的影响。这些模型假设数据是随机缺失的,并应用全信息极大似然估计。第三,通过整合模型组件来考虑数据丢失的可能性,从而保证了研究结果的可靠性。为此,实现了Diggle-Kenward选择模型、Wu-Carroll共享参数模型和模式混合模型。
结果
虽然真正的数据生成过程仍然未知,但证据是明确的:干预组和对照组都随着时间的推移减少了他们的酒精使用量,但没有出现显著的组间差异。无论是假设缺失数据是随机的增长模型,还是假设缺失数据不是随机的增长模型,都没有明确的证据表明干预的有效性。
结论
图解方法允许评估关于干预措施的有效性的结论对关于缺失数据机制的不同假设的敏感性。对于熟悉LGM的研究人员来说,这是一个有价值的统计补充,以保护他们的发现不受不可忽视的遗漏的可能性。
试验注册
PRINT试验在德国临床试验注册(DRKS00014274,注册日期:2018年3月12日)进行了前瞻性注册。
背景
参与者流失在纵向干预研究中很常见[1,2],特别是针对酒精消费等物质使用行为[3.,4].退出或不参加后续调查的原因可能是多方面的。在这种情况下,通常会区分三种缺失的数据机制[5,6]:完全随机缺失(MCAR)、随机缺失(MAR)或非随机缺失(MNAR)。如果丢失的数据不依赖于任何观察到的或未观察到的信息,因此是真正随机的,例如,当数据丢失是由于技术错误而非系统地发生时,则可以认为丢失数据是MCAR。在MAR的情况下,缺失取决于并可以充分解释观察到的变量,如社会人口特征或来自以前评估的信息。相比之下,如果缺失与未观察到的数据本身有系统联系,就必须假定MNAR,例如,当行为改变干预试验的参与者没有从干预中受益的人比那些受益的人更不可能参加随访。
尽管缺失的数据无处不在,但缺失的数据机制往往没有得到严格的检查[7,8,9,10],可能是由于缺乏易于实现的丢失数据策略。相反,缺乏针对性的策略,如完整的案例分析或单一的归责方法经常被应用[9,11].忽视缺失的数据机制可能导致力量减弱、统计推断有偏差,以及对干预措施有效性的无效结论[12,13,14,15,16,17].由于其严格的要求(丢失数据的倾向与观察到的和未观察到的变量完全无关),MCAR在实证研究中很少得到满足。此外,如果缺少的数据是MAR或MNAR,则没有统计学检验来解开[18].当留存率和流失率可以通过观察到的变量进行预测时,假设MAR似乎是合理的。然而,不能完全排除MNAR的可能性。例如,在分配到酒精干预的随机对照试验中,一些参与者可能在研究过程中减少他们的酒精使用量,而另一些人可能保持甚至增加他们的酒精使用量。如果其中一个群体不太愿意参与后续评估,那么MNAR似乎也同样合理。由于MAR和MNAR之间的区别涉及相当大的不确定性,因此需要进行敏感性分析[19,20.].我们的目标是比较在关于数据缺失原因的不同假设下的结果(MAR vs. MNAR)。
潜在增长模型(LGM)提供了一个灵活的框架,可以在MAR和MNAR假设下纳入缺失值[21,22].通过LGM,可以分析随着时间推移个体内部发展的个体间差异(例如干预组与对照组)[23].通过重复的结果变量测量的单个轨迹,由潜在的生长因子(截距和斜率)捕获。近年来,LGM越来越多地被用于随机对照试验的评估,例如针对酒精使用[24,25,26,27].通常,假设缺失数据为mar,使用全信息极大似然估计器(FIML)对LGM进行拟合。此外,在MNAR假设下也可以估计LGM [21].
假设缺失数据为MNAR的生长模型可分为选择[28,共享参数[29和模式混合模型[30.].这些MNAR模型集成了模型组件,以解释生成缺失数据的过程[21].选择模型和共享参数模型通过回归对LGMs进行补充,以预测结果的缺失。为此,通过逻辑回归方程将二元缺失数据指标(0 =观察到的,1 =缺失)与增长模型联系起来。在Diggle和Kenward提出的模型中[28],缺失的数据指标在重复结果测量上直接回归。通过这样做,缺失变得依赖于未观察到的值本身,从而建模一个不可忽略的退出过程。应该注意的是,选择模型(起源于Heckman [31])不是特定于LGM,而是将MNAR过程纳入多元统计模型的通用方法。吴和卡罗尔的方法[29]相当相似,而缺失的数据指标是在个别增长轨迹上回归的。这意味着缺失依赖于随时间变化的速率,包括重复结果变量上观察到的和未观察到的值的整体。因此,重复结果的倾向在时间点缺失t两者都取决于时间点上相同的结果t而且t - 1(Diggle-Kenward模型)或潜在的截距和坡度因素(Wu-Carroll模型)。模式混合模型采用了不同的方法,将样本划分为共享相同(或相似)缺失数据模式的子组[21].每个模式都是由重复结果变量上的观察值和缺失值的组合定义的(例如,间歇性缺失数据,永久遗漏)。使用模式混合模型,每个子组的LGM分别估计,允许预定义组中不同的生长轨迹。通过计算每个子组的增长模型参数的加权平均得到整个样本的参数估计。因此,在模式混合方法中,缺失不被用作结果,而是作为一个预测因子,通知样本分层到不同的组。对上述模型的技术细节感兴趣的读者可以参考这一领域的开创性工作[6,32].
所有MNAR增长模型都有一个关键的局限性:它们依赖于不可测试的假设来实现模型识别。Diggle-Kenward模型假设重复结局指标的多元正态分布,Wu-Carroll模型假设共享参数(即潜在截距和斜率)的多元正态分布。对于图案混合模型,识别参数限制是必要的。存在不同的可能性(完全情况限制、相邻情况限制和可用情况限制),可以将一个子组中的不可估计参数约束到可以估计该参数的一个或多个其他子组中的相同参数。由于基本假设无法得到检验,且当这些假设被违反时,参数估计可能存在偏差[21],仅将结论建立在MNAR模型上是不可取的。相反,敏感性分析是有必要的,以检查从特定研究中得出的结论是否不同,这取决于是否假设了一个可忽略(MAR)或不可忽略(MNAR)的缺失数据机制[20.,33].广泛建议评估结果对不同缺失数据机制的敏感性[17,20.,21,33,34,35,但很少有人意识到[7,8,36].
本研究的目的是证明使用LGM作为评估MAR与MNAR假设下随机对照试验的手段。为此目的,我们使用了PRINT(“测试积极的专家系统干预以预防和戒掉高危酒精使用”)试验的数据,这是一项随机对照试验,比较了简短的酒精反馈干预和仅评估。通过以一种非技术和容易获得的方式进行这项工作,我们为不同缺失数据机制进行敏感性分析提供了一个实用的指南,以回答以下问题:如果一个人改变了对导致缺失数据的过程的假设,关于干预效果的结论将如何改变?
方法
打印试验
PRINT试验是一项双臂、平行组随机对照试验,在1,646名过去一年饮酒的成人样本中检验计算机生成的个性化酒精反馈的有效性。该样本于2018年4月至7月在德国梅克伦堡-西波美拉尼亚格莱夫斯瓦尔德当地注册办公室的等候区招募。所有试验参与者都提供了书面知情同意。有关招募程序、纳入标准、样本描述和主要结果结果的细节已在其他地方发表[37].PRINT试验在德国临床试验注册中心(DRKS00014274,注册日期:12/03/2018)进行了前瞻性注册,并获得了德国Greifswald大学医学院伦理委员会的批准(方案号BB 147/15)。该议定书于2018年7月9日发布[38].Greifswald大学医学院(方案编号BB 053/19)和德累斯顿工业大学(方案编号sr - ec -272062020)批准了针对长期干预效果的额外随访。
参与者被平板电脑随机分为干预组和对照组,使用电脑生成的随机数列表(简单随机,分配比例为1:1)。在接受干预或不接受干预之前,参与者对自己的小组分配一无所知。负责资格筛选和招募的研究助理对参与者的小组分配一无所知。干预组在基线、3、6个月后分别收到3封干预信。给研究参与者的信件是由一个计算机专家系统生成的。它根据预先定义的决策规则自动为给研究参与者的信件选择反馈组件。为了使信件个性化并根据参与者的个人情况量身定制,自我报告数据事先通过计算机辅助电话采访收集。专家系统使用这些数据编写反馈信,然后通过邮件发送给参与者。对照组没有收到任何反馈。为了控制重复评估的效果,对照组参与者在相同的时间点收集相同的自我报告数据。
研究助理在基线(t0)后3 (t1)、6 (t2)、12 (t3)和36 (t4)个月进行计算机辅助电话采访。对干预组和对照组的评估是相同的,涵盖了自我报告的酒精消费,以及关于改变一个人的酒精使用动机的心理变量。在每个时间点,在10次电话联系失败后,通过邮件或电子邮件发送问卷。参与者最多可获得3张价值5欧元的补偿券,一张是在他们同意参与后直接获得的,一张是在t3之前获得的,一张是在t4完成后续评估后获得的。
措施
对于目前的研究,总和得分酒精使用障碍鉴定试验-消费(AUDIT-C;[39])作为结果指标。它的范围在0到12之间,由三个问题计算得出,分别是典型饮酒频率、饮酒时的典型饮酒量和重度饮酒的典型频率(女性一次饮酒4杯或以上,男性一次饮酒5杯或以上)。越高的AUDIT-C总分表示越高的酒精消耗量。AUDIT-C评分还用于区分低风险和高风险酒精使用,其依据是性别特定的临界值(女性≥4,男性≥5)[40].
辅助变量,即用于估计失踪的进一步信息,包括自我报告的性别、年龄、学校教育、与伴侣同居(是/否)、自我报告的健康状况和吸烟(回答选项:从不、以前、偶尔或每天吸烟)。在学校教育方面,最高的普通教育程度被评估并浓缩为一个二元变量(小于12年vs. 12年或以上的学校教育)。自我报告的一般健康状况(根据[41)的评分采用李克特五分制(1 =优秀,2 =非常好,3 =良好,4 =一般,5 =差)。
统计分析
支持本文结论的数据集和语法可通过莱布尼茨心理学研究所(ZPID)的研究数据中心获得,并可通过https://doi.org/10.5160/psychdata.stas21pr11.分析可分为三个主要步骤1).在第1步中,收集关于可能丢失的数据机制的信息。在步骤2中,计算未调整和调整的增长模型,以分析干预效果随时间的变化,假设缺失的数据为mar。在步骤3中,通过将MNAR机制纳入增长模型,保护了步骤2中的结果。
步骤1:缺少数据模式和机制
首先,为可能的数据生成过程收集证据。确定每个测量点的数据缺失率,并在两种研究条件下进行比较。由于所有参与者都提供了基线数据,并且在基线之后有4个测量点,因此可能有16个缺失的数据模式并进行了描述性分析。对于每一个缺失的数据模式,绘制干预组和对照组的AUDIT-C总和随时间的平均值。先前有关接触和保留的工作表明,积极干预阶段(t0 - t2)的辍学与年龄、学校教育和吸烟有关[38].两个logistic回归模型分别预测了t3和t4的参与率,以补充这些发现。性别、年龄、学校教育程度、与伴侣同居、学习状况、自我报告的健康状况、吸烟状况和基线时的酒精相关风险水平被用作预测因素。重要的预测因素将支持MAR假设的合理性。步骤1中的所有分析均使用Stata 14 [42].
步骤2:MAR模型
LGM应用于Mplus 7.31版本[43]在12个月和36个月后评价干预效果。AUDIT-C总和评分被用作重复结果和随时间增长的明显指标,由潜在的生长因子捕获(图中实黑色部分)。1).进行了初步分析,以确定随时间增长的形状。为此,我们计算了具有不同生长因子集的无条件LGMs (Mplus语法1a-1c)。潜在坡度因子的因子载荷分别设为0、0.1、0.2、0.4和1.2,表示测量次数之间的时间间隔(0.1 = 3个月)。据此,潜二次因子的载荷分别设为0、0.01、0.04、0.16、1.44(图略)。1为了清晰起见)。模型比较采用贝叶斯信息准则(BIC;[44)、比较拟合指数(CFI)和近似均方根误差(RMSEA)。由于三种模型的cpi均为> 0.98,RMSEA < 0.08,故采用BIC作为决策依据。这一信息准则平衡了拟合性和简约性,其中较低的BIC值表示较好的拟合模型。比较表明,具有截距、线性和二次斜率的模型对数据的拟合最好(Mplus语法1b)。
然后,根据受试者分组(0 =对照组,1 =干预组)回归潜在生长因子。这样就可以计算出在t3和t4处的组间差异,以及干预组和对照组之间AUDIT-C评分随时间变化的差异(参见Mplus语法2a中的MODEL CONSTRAINTS部分)。这些差异以绝对数字的形式给出,其置信区间为95% (95%可信区间).模型(图中实心黑色)。1)在MAR假设下使用具有鲁棒标准误差的全信息极大似然估计器(FIML)进行估计。在FIML中,使用方差-协方差矩阵中的所有可用数据来寻找模型参数值,使观测数据的似然性最大化。当数据确实随机丢失时,FIML已被证明能产生准确和无偏见的估计[12].
接下来,计算调整后的LGM(未包含在图中)。1避免视觉混乱)。协变量被纳入以支持MAR假设的合理性,即缺失可以被观察到的(基线)变量充分解释。因此,性别、年龄、学校教育程度、与伴侣同居、自我报告的健康状况、吸烟和酒精相关风险水平在t0时被添加为协变量(m +语法2b)。为了防止潜在变量协方差矩阵非正,该模型将二次生长因子的方差固定为零。由于未经调整的增长模型(CFI = 0.995;RMSEA = 0.039)拟合数据优于校正模型(CFI = 0.952;RMSEA = 0.086),所有连续灵敏度分析均建立在无协变量的模型上。然而,在某些情况下,计算以下带有预后协变量的MNAR模型可能是值得的,可以增加分析的力量[45].另一方面,协变量的加入可能阻碍模型的成功收敛。
步骤3:MNAR模型
在步骤3中,假设缺失数据为MNAR,估计不同的增长模型。通过比较MAR(第2步)和MNAR模型(第3步)的结果,可以检查对缺失数据机制的不同假设的结果有多敏感。对于Diggle-Kenward选择模型([28];图中灰色虚线。1),用一组逻辑回归方程对增长模型进行修正,通过logistic回归方程得到各时间点的倾向性t失踪是由时间点的结果来预测的t和前一个时间点观察到的结果(t - 1).为此目的,生成了四个缺失的数据指标(m1 - m4),指示每个参与者是否观察到AUDIT-C评分(m = 1)或(m = 0)。缺失指标的编码方案可分为两种:生存指标编码方案和多项编码方案(表2),这取决于假设的数据生成过程。一般来说,纵向研究可能具有偶尔缺失(间断)或永久缺失值(遗漏)的特点。就生存指标而言,仅假设永久磨损是由MNAR机制引起的,而间歇性缺失值则假设为MAR [21].相比之下,多项式编码方案区分并允许预测间歇和永久缺失。
由于人们只能推测真实的数据生成过程,因此最好检查编码方案的选择是否会影响模型结果。因此,我们计算了两个Diggle-Kenward模型,一个具有生存指标(Mplus语法3a),一个具有多项缺失指标(Mplus语法3b)。为了生成生存缺失指标,可以使用DATA missing命令部分中的Mplus函数SDROPOUT。必须使用Mplus DEFINE命令从缺失的数据模式中重新编码缺失的多项指标。回想一下,二元(Mplus语法3a)和多项逻辑回归(Mplus语法3b)预测结果丢失的倾向,被认为可以解释MNAR数据。只有假设重复结果变量的多元正态分布,才能求解这些方程[28].分组差异的计算方法与之前的模型相同,使用MODEL CONSTRAINT命令。
对于Wu-Carroll共享参数模型([29];图中为纯灰色。1),结果变量缺失的倾向是由随着时间的整体增长轨迹预测的,即缺失的数据指标(m1 - m4)在潜在的增长因素上回归。与Diggle-Kenward模型一样,缺失指标的两种编码方案都在两个独立的模型中实现(Mplus语法3c和3d)。在我们的案例中,当丢失的数据指标在所有三个潜在生长因子(截距、线性和二次)上回归时,Wu-Carroll模型并不收敛。因此,对模型进行了调整,在logistic回归中省略了二次增长因子。Mplus仍然产生了一个警告(观察到的和预期的信息矩阵不匹配),表明估计的标准误差可能是不可信的。使用MLF代替MLR估计器提供了一种补救措施,并最终导致Wu-Carroll模型的成功和可靠收敛。
对于图案混合模型(图中灰色点)。1),采用多组分析,对具有相同缺失数据模式的不同亚组分别估计潜在生长模型。在我们的案例中,估计16个不同子组的增长模型是不可行的。因此,缺失数据模式相似的参与者子组被组合起来。这一决定是基于观察值和缺失值随时间分布的相似性、干预组和对照组中观察到的轨迹以及每个缺失数据模式的参与者数量。关于分类的详细信息在结果部分。一般来说,模式混合模型的子组的形成可能取决于研究的类型、思考似然性和统计可行性。对于本研究,模式混合模型的计算分为三个亚组:完整案例、间歇性缺失值的参与者和未提供任何后续数据的参与者。为了估计模型,使用了Mplus中的KNOWNCLASS选项,创建了一个伪潜在类变量。考虑到每个潜在类在总样本中的比例,通过对类特定估计的平均得到总体模型估计。在一个或多个潜在类别中,有些参数可能是不可估量的(例如,在一个类别中,参与者只在两次测量场合提供数据,则该类别中的二次增长因子)。这个问题可以通过参数限制来解决[21].实施了三种类型的限制并进行了比较。(i)对于完全情形限制,将不可估参数固定为完全情形潜在类的估计(Mplus语法3e)。(ii)对于相邻的情况限制,使用最相似的潜在类的参数(Mplus语法3f)。(iii)可用的情况限制用其他潜在类中参数的加权平均值代替不可估量的参数(Mplus语法3g)。
结果
步骤1:PRINT试验中缺少数据模式和机制
在1646名参与者中(56%为女性;平均年龄= 31.0±10.8岁,80% (n= 1314)参与12个月随访(t3), 65% (n= 1074),随访36个月(t4)。2).
与干预组相比,对照组的参与率略高3.).两组在t3和t4时的AUDIT-C总和评分均低于基线值。预测t3和t4参与的逻辑回归模型显示,年龄较大的参与者(或= 1.04,95%可信区间= 1.02 - -1.05;而且或= 1.03,95%可信区间= 1.02-1.04)及接受过12年或以上教育(Ref。: 12年以下;或= 2.05,95%可信区间= 1.55 - -2.73;而且或= 2.67,95%可信区间= 2.09-3.42)更有可能参与。吸烟(Ref。:不吸烟者;或= 0.45,95%可信区间= 0.34 - -0.59;而且或= 0.49,95%可信区间= 0.39-0.63)和基线时的高危酒精使用情况(Ref。使用低风险酒精;或= 0.76,95%可信区间= 0.59 - -0.99;而且或= 0.74,95%可信区间= 0.59-0.93)分别降低了在t3和t4提供数据的几率。因此,t3和t4时的结果数据丢失的倾向可以部分解释为基线时的年龄、学校教育、吸烟和饮酒情况,这为数据为MAR的假设提供了支持。
最常观察到的三种缺失数据模式(图1)。3.)是没有缺失数据的参与者(模式1,n= 968, 59%),除t4外数据完整的参与者(模式5,n= 218, 13%), t1, t2, t3和t4数据缺失的参与者(模式16,n= 140, 9%)。6种缺失的数据模式显示了类似的轨迹,即随着时间的推移几乎恒定的酒精使用(模式1、2、5、9、10、12和13),占77% (n= 1273)。在某些模式中,发现了大量的时间波动(模式3、4、6和7),占4% (n= 64)的样本。模式14和模式15中观察到的轨迹可能表明,在t3和t4迷失的参与者中,酒精使用量随着时间的推移而增加,占5% (n= 86)。虽然只是推测,但这可能表明(缺失的)数据生成过程不是随机的,需要进行敏感性分析。
步骤2:MAR模型
未调整和调整的LGM均未提供干预效应的证据。根据未调整的LGM,干预组参与者的平均AUDIT-C得分分别从t0时的3.50降至t3时的3.27和t4时的3.18。在对照组参与者中也发现了类似的下降(分别从t0时的3.50到t3时的3.18和t4时的3.10)。干预组和对照组之间模型隐含的差异在量级上很小,没有统计学意义(表4),除了调整后的MAR模型在t3处存在差异,提示干预组的AUDIT-C评分更高。
步骤3:MNAR模型
Diggle-Kenward选择模型没有提供随时间变化的群体差异的证据4).与干预组相比,控制组的AUDIT-C分数随着时间的推移表现出略微更强的下降,但null总是包含在95%顺式.值得注意的是,预测缺失指标的逻辑回归显示,当用生存指标(系数)编码缺失时,每个AUDIT-C评分与该评分缺失的倾向之间没有显著关联log2在Mplus语法3a)。当使用多项缺失指标时,较高的AUDIT-C分数增加了该分数缺失的概率(系数)log2在Mplus语法中3b:或= 1.22,95%可信区间= 1.08 - -1.38)。尽管基于不可测试的模型假设,但这一发现表明,缺失的数据机制不是随机的。
Wu-Carroll共享参数模型也出现了类似的情况。对照组参与者倾向于比干预组参与者稍微降低他们的AUDIT-C分数,但同样的,模型没有产生统计学上显著的组间差异(表4).潜在的拦截预测了缺失的指标:较高的初始AUDIT-C分数增加了随后评估的AUDIT-C分数缺失的概率。这在存在生存缺失指标(系数)的模型中均有发现log1在Mplus语法中3c:或= 1.12,95%可信区间= 1.05-1.19)和多项缺失指标(系数log1而且log3在Mplus语法3d:或= 1.18,95%可信区间-1.29 = 1.07,或= 1.13,95%可信区间= 1.04-1.24),与基于后续参与预测的假定MAR机制一致。潜在斜率既不能预测生存期,也不能预测多项缺失指标。因此,Wu-Carroll模型没有提供缺失值为MNAR的迹象。
对于模式混合方法,缺失的16个数据模式(图。3.)被分成三组。这一决定主要是基于在试验过程中参与和不参与的相似性,以及在这些亚组中产生的样本量的统计可行性。完整的情况下(73%,n= 1206;缺失的数据模式1、4和5)按照研究方案中的计划接受干预,并提供至少一次随访评估的数据。间歇性缺失值的参与者(9%,n= 151;缺失的数据模式2、3、6-10、12和13)没有得到完整的干预,因为这些参与者在主动干预阶段至少错过了一次评估,但至少提供了一次后续数据。第三组是没有提供任何后续数据的参与者(18%,n= 289;缺少数据模式11,14 - 16)。在任何模式混合模型中均未发现有统计学意义的组间差异4).如果有什么区别的话,控制组参与者倾向于比干预组参与者稍微降低他们的AUDIT-C分数,但再次强调,null总是包含在95%顺式.由于三种模式混合模型中潜在类别之间的建模轨迹随时间的变化非常相似,没有迹象支持MNAR假设。
讨论
本论文的目的是证明对随机对照试验中缺失数据机制的不同假设的敏感性分析。为此目的,使用来自一个简短的酒精干预试验的数据,估计潜在生长模型,假设缺失的数据是MAR或MNAR。在干预组和对照组之间,酒精使用随时间的变化无差异。没有明确的证据表明干预对AUDIT-C评分的影响。本研究中所阐述的分析方法使我们能够确定我们的发现对不同的缺失数据机制不敏感。
在随机对照试验中,极有可能发生数据流失和丢失。人们永远无法确定所缺少的值是MAR还是MNAR [5].在任何情况下,研究人员都必须考虑如何处理缺失数据,以防止由于处理不当而导致的偏见和错误结论[14,15].为了方便实现缺失数据策略,我们的目标是阐明使用LGM的敏感性方法,该方法可以大致分为三个主要步骤。首先,收集有关潜在数据生成过程的信息。检查丢失数据的程度,检查所有可能丢失的数据模式,并使用基线变量预测后续参与,使我们能够积累丢失数据机制的证据。其次,计算未调整增长模型和调整增长模型,分析干预措施随时间的影响。这些模型基于MAR假设,并应用了FIML估计,当数据确实随机丢失时,可以产生无偏参数估计[12].第三,通过在增长模型中加入MNAR机制,第二步的研究结果得到了保障。为此,我们阐述了选择的不同版本[28,共享参数[29和模式混合模型[30.].模型比较使我们能够评估我们的发现对缺失数据机制(MAR与MNAR)的不同假设的敏感性。MAR和MNAR之间的区别仍然是推测性的,但关于干预有效性的主要发现被不同的模型证实了,它们都得出了相同的结论:我们在36个月后没有发现干预有效性的证据。
纵向研究中缺少数据几乎是不可避免的。因此,在随机对照试验的规划阶段已经需要一个缺失数据策略。应考虑的不仅是如何防止辍学和保持参与者参与研究方案,而且还应考虑如何处理统计分析中的缺失值。后者还包括考虑可能与参与者减员有关的变量。目前,解释失踪的信息大多是事后选择的,使用现成的变量。如果在规划时已经系统地考虑了变量的选择,那么对缺失数据的分析将会更有意义。在这方面,流程数据也可以非常有用,例如每个电话需要联系某人的尝试次数,或者某人在给出知情同意时提供的联系信息类型(固定电话号码或移动电话号码、电子邮件地址,或两者都有)。除此之外,及早解决数据缺失问题将有助于更好地说明覆盖范围是公共卫生干预成功的一个重要方面[46].
应用LGM进行敏感性分析有几个优点。首先,成长模型是一种灵活的工具,可以分析个体内部轨迹随时间变化的个体间差异[23].对缺失数据机制的考虑可能取决于主题、研究设计和程序、样本组成以及达到率和保留率。增长模型是一个可定制的框架,它使研究人员能够考虑到所有这些方面,并收集关于数据丢失原因的证据。其次,概述的最大似然方法遵循意图对待原则,并确保在缺少数据的背景下,无偏见的估计和足够的统计能力[12,47].因此,与仍在广泛使用的方法相比,从LGMs中得出的结论在有效性上是优越的,但不利的策略如完全案例分析和单一imputation方法[9,11].第三,生长模型已经开始用于随机对照健康行为试验的评估[25,26,48,49,50,51].因此,对缺失的数据进行额外的敏感性分析可能不需要付出额外的努力。第四,该方法能够提供关于干预效果的结论如何根据假定的参与者流失机制而变化的细微洞察。在我们的案例中,一致的发现可能会支持干预措施是否有效的初步结论。另一方面,不一致的发现表明,基于单一缺失数据机制(最有可能是MAR)的结论可能是有缺陷的。在这种情况下,干预措施的有效性可能取决于谁完成了研究,谁没有,这肯定会使研究结果的解释更加复杂(例如:21,52,53]),但同时也强调有必要更好地理解研究中途退出的原因,并优化与参与者保留有关的干预措施。
然而,我们必须承认局限性。所有说明的MNAR模型都是基于不可测试的模型假设。违反这些假设可能导致有偏差的参数估计[21].共享参数模型的计算要求很高,因为它们需要蒙特卡洛积分。更重要的是,这些模型只被证明有一个连续的结果。在实践中,主要端点可以是计数的、分类的或二分类的。尽管LGM可以应用于非连续重复的结果变量[54,55,56],在这些模型中实现MNAR扩展可能具有挑战性,并使成功的模型收敛复杂化。我们的方法没有解释数学或技术基础。有兴趣的读者可以考虑开创性的著作[6,21,28,29]概述模型的技术细节。
敏感性分析被广泛建议纳入干预研究评价的统计资料中[17,20.,21,33,34,35].我们在本文中概述的方法只是将这一建议付诸实践的一种方法,特别是对于那些熟悉LGM的人。其他方法也不能不提。例如,研究建议区分MNAR缺失数据机制的不同子类型[57].灵敏度分析也可使用多重imputation实现[58,59,60或贝叶斯统计[61,62,63].
数据和材料的可用性
支持本文结论的数据集和语法可通过莱布尼茨心理学研究所(ZPID)的研究数据中心获得,并可通过https://doi.org/10.5160/psychdata.stas21pr11.
缩写
- AUDIT-C:
-
酒精使用障碍鉴定试验-消费
- 置信区间:
-
置信区间
- FIML:
-
完整信息极大似然
- IRR:
-
发病率比
- LGM:
-
潜在的增长模式
- 3月:
-
随机缺失
- MCAR:
-
完全随机失踪
- MNAR:
-
失踪不是随机的
- 或者:
-
优势比
- 打印:
-
随机对照试验“测试预防和戒除高危饮酒的主动专家系统干预”
参考文献
Brueton VC, Tierney JF, Stenning S, Meredith S, Harding S, Nazareth I,等。在随机试验中提高留存率的策略:Cochrane系统综述和荟萃分析。BMJ开放。2014;4:e003821。https://doi.org/10.1136/bmjopen-2013-003821.
邵志强,徐志强,徐志强。rct缺失数据处理;顶级医学杂志的评论。中华医学杂志。2014;14:118。https://doi.org/10.1186/1471-2288-14-118.
Riper H, Hoogendoorn A, Cuijpers P, Karyotaki E, Boumparis N, Mira A,等。网络干预对成人问题饮酒的有效性和治疗调节:19个随机对照试验的个体患者数据元分析。《公共科学图书馆·医学。2018;15:e1002714。https://doi.org/10.1371/journal.pmed.1002714.
ker EF, Beyer FR, Muirhead C, Campbell F, Pienaar ED, Bertholet N,等。初级保健人群短暂酒精干预的有效性。2:CD004148。https://doi.org/10.1002/14651858.CD004148.pub4.
鲁宾DB。推理和缺失数据。生物统计学。1976;63:581 - 92。https://doi.org/10.1093/biomet/63.3.581.
小RJ,鲁宾·DB。数据缺失的统计分析。第三版。霍博肯:威利;2020.
基于调查的酒精和药物使用研究的数据缺失技术和统计结论效度:对再现性的回顾和评论。《药物问题》2019;49:44-56。https://doi.org/10.1177/0022042618795878.
Díaz-Ordaz K, Kenward MG, Cohen A, Coleman CL, Eldridge s,在集群随机试验中缺失的数据是否得到充分处理?系统的审查和指导方针。中国新药试验。2014;11:590 - 600。https://doi.org/10.1177/1740774514537136.
Sullivan TR, Yelland LN, Lee KJ, Ryan P, Salter AB.随机对照试验随访研究中缺失数据的处理:文献的系统回顾。中国新药试验。2017;14:387 - 95。https://doi.org/10.1177/1740774517703319.
龙巴赫一世,里弗罗-阿里亚斯O,格雷AM,詹金森C,伯克Ó。在RCT出版物中广泛使用的8个PROMs中处理和报告缺失结果数据的当前实践:对当前文献的回顾。Qual Life Res. 2016; 25:13 - 23。https://doi.org/10.1007/s11136-015-1206-1.
Powney M, Williamson P, Kirkham J, kolamunnera - dona R.临床试验中缺失纵向结局数据的处理综述。试验。2014;15:237。https://doi.org/10.1186/1745-6215-15-237.
酒精临床试验中缺失数据:方法的比较。酒精临床试验杂志2013;37:2152-60。https://doi.org/10.1111/acer.12205.
Witkiewitz K, Falk DE, Kranzler HR, Litten RZ, Hallgren KA, O’malley SS,等。在酒精临床试验中,当参与者退出治疗时,在缺乏数据的情况下,分析持续重度饮酒结局测量的治疗效果。酒精临床试验杂志2014;38:2826-34。https://doi.org/10.1111/acer.12543.
赵强,傅铮,李晓燕。临床试验中数据缺失的处理策略:从设计到分析。耶鲁生物医学杂志2013;86:343-58。
小RJ, D'Agostino R, Cohen ML, Dickersin K, Emerson SS, Farrar JT等。临床试验数据缺失的预防与处理。中华医学杂志2012;367:1355-60。https://doi.org/10.1056/NEJMsr1203730.
Ashbeck EL, Bell ML.纵向随机对照试验中的单时间点比较:缺失数据存在下的功率和偏倚。中华医学杂志。2016;16:43。https://doi.org/10.1186/s12874-016-0144-0.
Goldberg SB, Bolt DM, Davidson RJ。在移动健康研究中,数据的丢失不是随机的:问题的评估和敏感性分析的一个案例。J Med Internet Res. 2021;23:e26749。https://doi.org/10.2196/26749.
Bell ML, Kenward MG, Fairclough DL, Horton NJ。随机对照试验中的差异退出和偏倚:何时重要,何时可能不重要。BMJ。2013; 346: e8668。https://doi.org/10.1136/bmj.e8668.
国家研究委员会。临床试验数据缺失的预防与处理。华盛顿:国家科学院出版社(美国);2010.
莫里斯TP,卡汉BC,怀特IR。选择随机试验的敏感性分析:原则。中华医学杂志。2014;14:11。https://doi.org/10.1186/1471-2288-14-11.
恩德斯CK。潜在生长曲线分析缺少非随机模型。Psychol方法。2011;16:1-16。https://doi.org/10.1037/a0022640.
Muthén B, Asparouhov T, Hunter AM, Leuchter AF.生长模型与不可忽视的辍学:STAR*D抗抑郁药物试验的替代分析。Psychol方法。2011;16:17-33。https://doi.org/10.1037/a0022634.
Curran PJ, Obeidat K, Losardo D.生长曲线建模的12个常见问题。J Cogn Dev. 2010; 11:121-36。https://doi.org/10.1080/15248371003699969.
Teesson M, Newton NC, Slade T, Carragher N, Barrett EL, Champion KE,等。青少年酒精使用的综合普遍和选择性预防:一项聚类随机对照试验Psychol医学。2017;47:1761 - 70。https://doi.org/10.1017/S0033291717000198.
Carey KB, Walsh JL, Merrill JE, Lust SA, Reid AE, Scott-Sheldon LAJ,等。对强制性大学生进行短暂酒精干预后,使用电子邮件促进剂维持变化:一项随机对照试验。中华临床精神病学杂志2018;86:787-98。https://doi.org/10.1037/ccp0000339.
Voogt C, Kuntsche E, Kleinjan M, Poelen E, Engels R.使用生态瞬间评估测试基于网络的短期酒精干预在重度饮酒学生中的有效性:随机对照试验。J medical Internet res 2014;16:e5。https://doi.org/10.2196/jmir.2817.
Freyer-Adam J, Baumann S, Haberecht K, Tobschall S, Bischof G, John U,等。面对面的酒精咨询与计算机生成反馈:来自随机对照试验的结果。健康Psychol。2018;37:70 - 80。https://doi.org/10.1037/hea0000556.
Diggle P, Kenward MG。纵向数据分析中的信息遗漏。:统计。1994;43:49。https://doi.org/10.2307/2986113.
吴MC, Carroll RJ。通过对审查过程建模,估计和比较信息权审查存在时的变化。生物识别技术。1988;44:175。https://doi.org/10.2307/2531905.
小RJ。一类普通不完全数据的模式-混合模型。生物统计学。1994;81:471 - 83。https://doi.org/10.1093/biomet/81.3.471.
赫克曼JJ。样本选择偏差是一种规格误差。费雪。1979;47:153。https://doi.org/10.2307/1912352.
恩德斯CK。应用缺失数据分析。2版。纽约:吉尔福德出版社;2022.
White IR, Horton NJ, Carpenter J, Pocock SJ。在缺少结果数据的随机试验中意图治疗分析的策略。BMJ。2011; 342: d40。https://doi.org/10.1136/bmj.d40.
Thabane L, Mbuagbaw L, Zhang S, Samaan Z, Marcucci M, Ye C,等。临床试验中敏感性分析的教程:什么,为什么,何时和如何。中华医学杂志。2013;13:92。https://doi.org/10.1186/1471-2288-13-92.
Li P, Stuart EA.最佳(但经常被遗忘的)实践:随机对照营养试验中缺失的数据方法。美国临床杂志。2019;109:504-8。https://doi.org/10.1093/ajcn/nqy271.
王晓明,黄晓明,黄晓明。聚类随机试验中缺失数据的统计分析与处理:一项系统综述。试验。2016;17:72。https://doi.org/10.1186/s13063-016-1201-z.
鲍曼S, Staudt A, Freyer-Adam J, Bischof G, Meyer C, John U.针对成年一般人群全谱饮酒的短暂酒精干预的影响:一项随机对照试验。上瘾。2021;116:2056 - 66。https://doi.org/10.1111/add.15412.
恩德斯CE, Staudt A, Freyer-Adam J, Meyer C, Ulbricht S, John U,等。在市登记办公室进行简短的酒精干预:接触和保留。欧洲J酒吧健康。2021;31:418-23。https://doi.org/10.1093/eurpub/ckaa195.
Bush K, Kivlahan DR, McDonell MB, Fihn SD, Bradley KA。审计酒精消费问题(AUDIT- c):对问题饮酒的有效的简短筛选测试。门诊护理质素改善计划(ACQUIP)酒精使用障碍鉴定试验。Arch实习医师1998;158:179 - 95。https://doi.org/10.1001/archinte.158.16.1789.
Reinert DF, Allen JP。酒精使用障碍鉴定测试:研究结果的更新。酒精临床试验决议2007;31:185-99。https://doi.org/10.1111/j.1530-0277.2006.00295.x.
自评健康和死亡率:27项社区研究的综述。《卫生社会行为杂志》1997;38:21。https://doi.org/10.2307/2955359.
StataCorp。Stata统计软件:版本14。大学站:StataCorp LP;2015.
Muthén LK, Muthén B. Mplus用户指南。第七版。洛杉矶:Muthén和Muthén;1998 - 2015。
估算模型的尺寸。安Stat。1978;6:461-4。https://doi.org/10.1214/aos/1176344136.
Kahan BC, Jairath V, Doré CJ, Morris TP。随机试验中协变量调整的风险和回报:来自8项研究的12项结果的评估。试验。2014;15:139。https://doi.org/10.1186/1745-6215-15-139.
格拉斯哥RE, Vogt TM, Boles SM。评估健康促进措施对公共健康的影响:RE-AIM框架。《公共卫生》1999;89:1322-7。https://doi.org/10.2105/AJPH.89.9.1322.
Buhi E, Goodson P, Neilands TB。眼不见心不烦:处理丢失数据的策略。健康行为杂志2008。https://doi.org/10.5993/AJHB.32.1.8.
laul - barraco C, Braitman AL, Stamates AL.一项针对非学生新兴成年高危饮酒者的个性化反馈干预的随机试验。酒精临床试验报告2018;42:781-94。https://doi.org/10.1111/acer.13606.
迪什曼RK,德乔伊DM,威尔逊MG,范登伯格RJ。提高:增加身体活动的随机工作场所试验。美国预防医学杂志2009;36:33 - 41。https://doi.org/10.1016/j.amepre.2008.09.038.
贝茨S,诺曼P,布雷兹P,布伦南A,埃亨AL.行为体重管理计划的作用机制:潜在生长曲线分析。Ann Behav Med。2022;56:64-77。https://doi.org/10.1093/abm/kaab019.
王晓燕,王晓燕,王晓燕。基于人群的生活方式干预对烟酒消费的长期影响。Inter99研究——一项随机对照试验。上瘾。2015;110:1853-60。https://doi.org/10.1111/add.13052.
mcmcdonell MG, Srebnik D, Angelo F, McPherson S, Lowe JM, Sugar A,等。社区精神卫生严重精神疾病患者使用兴奋剂应急管理的随机对照试验美国精神病学杂志。2013;170:94-101。https://doi.org/10.1176/appi.ajp.2012.11121831.
McPherson S, Barbosa-Leiker C, Mamey MR, McDonell M, Enders CK, Roll J.“非随机缺失”(MNAR)和“随机缺失”(MAR)生长模型与丁丙诺啡/纳洛酮临床试验的比较上瘾。2015;110:51-8。https://doi.org/10.1111/add.12714.
李TK,维克拉马KKAS,奥尼尔CW。带有分类反应的潜在生长曲线分析在社会行为研究中的应用。结构方程建模。2018;25:294-306。https://doi.org/10.1080/10705511.2017.1375858.
纽森JT,史密斯NA。二元变量潜在生长曲线模型的性能。结构方程建模。2020;27:88 - 907。https://doi.org/10.1080/10705511.2019.1705825.
零膨胀计数数据的生长曲线模型:在吸烟行为中的应用。结构方程建模。2007;14:247-79。https://doi.org/10.1080/10705510709336746.
高梅,袁克华。子类型的缺失不是随机缺失数据的机制。Psychol方法。2021。https://doi.org/10.1037/met0000377.
雷斯奎埃,乔尔基,保莱蒂。非随机丢失数据时的灵敏度分析。流行病学。2011;22:282。https://doi.org/10.1097/EDE.0b013e318209dec7.
Carreras G, Miccinesi G, Wilcock A, Preston N, Nieboer D, Deliens L,等。生命终末期护理研究中不随机缺失:对ACTION研究数据的多重归责和敏感性分析。医学医学研究。2021;21:13。https://doi.org/10.1186/s12874-020-01180-y.
徐春华,何勇,胡超,周伟。基于多重归因的非随机缺失数据灵敏度分析方法。统计医学。2020;39:3756 - 71。https://doi.org/10.1002/sim.8691.
Linero AR, Daniels MJ。贝叶斯方法用于遗漏非随机结果数据:识别限制的作用。统计科学。2018;33:198 - 213。https://doi.org/10.1214/17-STS630.
Kaciroti NA,小RJA。具有潜在缺失而非随机缺失的纵向数据的贝叶斯灵敏度分析:高维模式-混合模型。统计医学。2021;40:4609-28。https://doi.org/10.1002/sim.9083.
杜H,恩德斯C,凯勒BT,布莱德伯里TN,卡尼BR。不可忽略缺失的贝叶斯潜变量选择模型。多元行为决议201:1 - 49。https://doi.org/10.1080/00273171.2021.1874259.
确认
我们感谢所有参与者的参与,感谢所有数据收集和管理的研究和学习助理,感谢Maria Zeiser协调和管理36个月的后续评估,感谢Christian Goeze的软件编程。
资金
由Projekt DEAL支持和组织的开放获取资金。该研究由德国研究基金会(BA 5858/2-1, BA 5858/2-3)资助,该基金会对设计、分析和数据解释没有影响。
作者信息
作者和联系
贡献
AS制定了研究问题,进行了数据分析,并起草了手稿。SB设计了这项研究并获得了资金。SB和AS管理数据收集。AS、JFA、TI、CM、GB、UJ和SB参与了对数据的解释,并对重要的知识内容进行了批判性的修改。所有作者阅读并批准了最终稿件。
相应的作者
道德声明
伦理批准和同意参与
PRINT试验获得了德国Greifswald大学医学院伦理委员会的批准(方案号BB 147/15)。Greifswald大学医学院(方案编号BB 053/19)和德累斯顿工业大学(方案编号sr - ec -272062020)批准了针对长期干预效果的额外随访。所有参与者都提供了书面知情同意。所有方法都是根据有关准则和条例,特别是《赫尔辛基宣言》进行的。
同意出版
不适用。
相互竞争的利益
一个也没有。
额外的信息
出版商的注意
188博金宝app网施普林格自然对出版的地图和机构附属的管辖权要求保持中立。
权利和权限
开放获取本文遵循创作共用署名4.0国际许可协议(Creative Commons Attribution 4.0 International License),该协议允许在任何媒体或格式中使用、分享、改编、分发和复制,只要您给予原作者和来源适当的署名,提供创作共用许可协议的链接,并说明是否有更改。本文中的图片或其他第三方材料包含在文章的创作共用许可中,除非在材料的信用额度中另有说明。如果材料不包含在文章的创作共用许可中,并且您的预期用途不被法律法规允许或超出了允许的用途,您将需要直接从版权所有者那里获得许可。欲查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献放弃书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信用额度中另有说明。
关于这篇文章
引用这篇文章
斯图尔特(A. Staudt),弗莱尔-亚当(J. Freyer-Adam),伊特曼(T. Ittermann)。et al。使用潜在生长模型对随机丢失数据与非随机丢失数据的敏感性分析:随机对照试验的实用指南。BMC医学治疗方法22250(2022)。https://doi.org/10.1186/s12874-022-01727-1
收到了:
接受:
发表:
DOI:https://doi.org/10.1186/s12874-022-01727-1
关键字
- 3月
- MNAR
- 生长曲线模型
- 参与者磨损
- 辍学