摘要
背景
抑郁症在人类免疫缺陷病毒(HIV)-丙型肝炎病毒(HCV)合并感染人群中很常见。在研究环境中收集的人口统计学、行为和临床数据可能有助于确定那些有临床抑郁症风险的人。我们的目标是预测预示抑郁风险的抑郁症状的存在,并使用监督机器学习识别重要的分类预测因子。
方法
我们使用了来自加拿大联合感染队列(一个多中心前瞻性队列)及其有关粮食安全(FS)的子研究的数据。流行病学研究中心抑郁量表-10 (CES-D-10)在FS子研究中实施;如果得分≥10,则将参与者归类为临床抑郁症风险人群。我们开发了两种随机森林算法,使用训练数据(80%)和十倍交叉验证来预测CES-D-10类-1。完整的算法与所有候选预测器(137个预测器)和2。使用基于专家意见(46个预测器)的预测器子集的简化算法。我们使用接受者工作特征曲线(AUC)下的面积来评估算法在测试数据中的性能,并生成预测器重要性图。
结果
我们纳入了来自717名参与者的1934次FS子研究访问,这些参与者主要是男性(73%)、白人(76%)、失业者(73%)和高中学历(52%)。第一次就诊时,中位年龄为49岁(IQR: 43-54), 53%报告存在抑郁症状,CES-D-10评分≥10分。完整算法的AUC为0.82 (95% CI: 0.78-0.86),简化算法的AUC为0.76 (95% CI: 0.71-0.81)。就业、艾滋病临床分期、收入来源、体重指数和教育程度是最重要的五个预测因素。
结论
我们开发了一种预测算法,可以在研究环境中识别HIV-HCV联合感染人群中有抑郁风险的个体。利用具有丰富预测信息的研究数据开发这种机器学习算法,可以用于回顾性分析有关抑郁症状对弱势人群临床和以患者为中心的结果的影响的未回答问题。
背景
由于传播方式相同,人类免疫缺陷病毒(HIV)和丙型肝炎病毒(HCV)合并感染很常见,全世界约有230万人同时感染[1,2].抑郁症是艾滋病毒感染者和慢性丙型肝炎患者中最常见的神经精神表现。在艾滋病毒感染者中,诊断为临床抑郁症的患病率比一般人群高2至4倍,据报道,在慢性丙型肝炎病毒感染者中,诊断为临床抑郁症的患病率高达24% [3.,4].潜在的生物学机制包括中枢神经系统的直接感染和已被证明可诱发抑郁症的外周免疫反应[3.,5].包括污名化、歧视、缺乏支持和药物使用在内的社会心理风险因素也已被证明是促成因素[3.,5].研究报告称,在合并感染人群中抑郁症的患病率更高,这可能是由于危险因素的共存[6].
显著抑郁症状的存在可能对患者的预后产生影响,即使在没有临床抑郁症诊断的情况下;例如,在艾滋病毒感染者中,抑郁症状的存在与不坚持抗逆转录病毒治疗有关,这可能导致病毒载量增加和免疫功能抑制[7,8].筛查工具可用于评估抑郁症状的存在和严重程度,并确定那些有患重度抑郁症风险的人[9,10,允许早期干预。合并感染的个体往往患有多种共同疾病,因此在医疗保健机构中花费相当长的时间[11].在临床评估或纵向队列研究中,很少对HIV和HCV感染患者进行抑郁症筛查,尽管已知抑郁症患病率很高[12,13,14].多种人口统计学、临床和行为特征已被证明是抑郁症的危险因素[15这些数据通常是在临床和研究队列中收集的。因此,这些数据可以用于回顾性地预测是否存在严重到与负面健康结果或被诊断为重度抑郁症的风险增加相关的抑郁症状,并随着时间的推移跟踪这种风险。这些措施将有助于探索有关合并感染人群的抑郁症状、其演变和对治疗的反应的重要问题。
机器学习包括强大的技术,可以在医学研究中准确预测结果。在心理健康研究中,机器学习已被用于预测包括抑郁症、焦虑和精神分裂症在内的精神障碍的当前或未来发病、病程和治疗结果[1,16,17].开发这些预测算法使用了广泛的数据源,包括电子医疗记录、神经成像和社交媒体。人口统计学和临床数据已被用于创建老年人和糖尿病患者的抑郁症预测模型[18,19].然而,类似的模型尚未在HIV-HCV合并感染人群中开发出来。
我们利用非参数监督机器学习技术,利用队列数据开发分类算法,以预测加拿大HIV-HCV合并感染个体中临床抑郁风险的抑郁症状的存在,以及对预测抑郁症状重要的特征。
方法
数据来源和研究样本
我们使用了加拿大HIV-HCV联合感染队列(CCC)的数据,这是一项自2003年开始进行的开放多中心前瞻性队列研究,以及一项相关的子研究,即食品安全和HIV-HCV联合感染研究(FS子研究)[20.,21].CCC从加拿大6个省(魁北克、不列颠哥伦比亚省、阿尔伯塔省、安大略省、新斯科舍省和萨斯喀彻温省)的18个城市和半城市艾滋病毒中心招募人员[20.].资格标准包括年龄≥16岁,有艾滋病毒感染记录,HCV感染证据(HCV RNA阳性和/或HCV血清阳性)。截至2020年7月,该研究招募了2018名参与者。对参与者进行纵向随访,每六个月进行一次随访。社会人口学、行为和与健康相关的生活质量(HR-QoL)数据在每次访问时通过标准化的自我管理问卷收集。使用EuroQol-5 Dimension-3 Level (EQ-5D-3L)测量人力资源生活质量[22].临床数据包括HIV/HCV治疗、共发病、精神病诊断和其他药物通过医疗图表审查收集。每次就诊的实验室检测包括HIV和HCV相关检测、血液学、生物化学和肝脏概况。
FS子研究是CCC在2012年至2015年间进行的一项混合方法研究。所有CCC参与者都被邀请参加,并将研究访问纳入一年两次的CCC访问中。FS子研究招募了725名参与者,并对他们进行了最多5次随访。该研究采用自我填写的问卷收集了有关粮食不安全、一般健康和心理健康(包括抑郁症筛查)、治疗依从性和医疗保健利用的数据[21].
抑郁筛查仅在FS子研究中进行;因此,本研究的分析样本仅包括FS子研究参与者访视。FS子研究访问与相应的CCC访问数据合并。由于CCC和FS子研究的两次研究访问有时不在同一天,因此三个月内的访问信息被认为是“同时进行的”。我们使用了三个排除标准来创建最终的研究样本:1)如果访问时没有抑郁症筛查措施(见下文),则排除参与者访问;2)如果没有相应的CCC访问(3个月窗口内),则排除参与者访问,因为本分析中使用的预测因子来自CCC;3)如果在所有研究访问中没有可用的预测数据,则排除参与者的所有访问。
结果
FS子研究采用流行病学研究中心抑郁量表-10 (CES-D-10)进行抑郁筛查,这是CES-D-20量表的简化版本[23].CES-D-10是一份10项李克特量表问卷,用于评估过去一周内抑郁症状的存在和严重程度。每个项目采用4分制进行测量,其中2个积极项目进行反向评分,总分范围为0-30分。我们将得分按10分为两类,以创建CES-D-10等级(1/0),因为得分≥10被广泛认为存在抑郁症状,表明临床抑郁症的高风险,以下简称为抑郁症状[23].在加拿大的HIV人群中,该量表和10的二分法都得到了验证[24].
预测
我们根据文献和主题专业知识从CCC数据中选择候选预测因子(x)。我们纳入了五个主要类别的预测因素:与心理健康、人力资源-生活质量、社会人口学、行为和临床特征相关的问题;见表1.我们总共选择了137个候选预测因子,其中136个是分类预测因子,1个是连续预测因子(EQ-5D-3L-health state)。从这个候选预测因子列表中,我们选择了一个预测因子子集(x = 46),根据专家意见,这些预测因子可能在大多数研究环境中更常见。见表S1参见附录A中候选预测因子(x = 137)及其对应类别的详尽列表。
统计分析
主要分析
我们评估了每个预测器缺失数据的比例。对于缺失数据< 5%的预测因子,我们将上次访问的值向前移动。对于数据缺失≥5%的预测因子,以及当一个参与者的所有访问都缺少某个预测因子的数据时,我们对分类变量使用了“无响应”的额外类别,我们假设这可能在预测算法中具有信息性(见表S1在附录A中),因为参与者决定回应(或不回应)本身就是潜在的临床信息。
我们使用了随机森林(RF)的监督机器学习技术,这是一种集成学习方法,使用多个决策树的自举聚合,结合来自这些树的预测[25];详见附录b。我们使用概率机估计每次访问的CES-D-10类别概率,然后在默认概率阈值下确定CES-D-10类别[26].我们开发了两种射频算法- 1。完整算法:使用所有候选预测器(x = 137)和2。简化算法:基于专家意见,使用更常用的预测因子(x = 46)的选择子集,这可能更适用于CCC以外的研究;参见附录a。我们将分析样本分成训练和测试数据,使用推荐的80:20分割,这样我们就有了用于性能评估(测试)的数据,这些数据完全独立于用于模型开发(训练)的数据,从而确保了无偏倚的评估[27].我们使用R中的插入包中的“createdataption”函数执行80/20分割,这样两个CES-D-10类都表示在每个集合中[28].然后,该算法通过十次交叉验证开发,仅使用训练数据和RF超参数(即各种RF设置,如决策树的数量)进行调整,以最大限度地提高精度[27];详见附录C。
额外的分析
我们进行了几项分析,以提供关于主要分析的分类特征的额外细节,并评估结果的稳健性:A)使用每个个体一次就诊(共717次),以评估与使用每个个体多次就诊相比的性能差异;B)基于文献中建议的截止点,使用三种不同的CES-D-10阈值(8,13,15)的算法[29,30.];C)将粮食不安全作为预测因素的算法,该算法仅在FS子研究中收集。过去6个月的粮食不安全状况采用家庭粮食安全调查模块(HFSSM)的10项成人量表[31].使用分类变量,根据加拿大卫生部标准,0 - 1,2 - 5或≥6个肯定回答的参与者分别被分为粮食安全、中度粮食不安全或严重粮食不安全;和D. RF回归算法预测连续的CES-D-10评分,使用r平方和均方根误差(RMSE)进行评估,它提供了关于预测分数和实际分数之间差异的信息[32].
绩效评估
最终调优的算法在测试数据中实现,在开发阶段没有使用。调优参数如表S所示2附录c中详细描述了总体性能和校准措施。为了评估区分类别(区分)的能力,我们绘制了受试者工作特征(ROC),并估计了ROC曲线下的面积(AUC) [32,33].我们使用默认概率阈值0.50进行分类,在该阈值下,用95%置信区间(CI)估计敏感性、特异性、阳性预测值(PPV)、阴性预测值(NPV)、阳性似然比(LR +)和阴性似然比(LR-)测量值[34].最后,生成RF重要性指标,并生成重要性图,以展示用两种算法对抑郁症状参与者进行分类时25个最重要的预测因子。我们使用RStudio .1.2和Stata .16.0来开发和评估这些算法[35,36].射频算法的开发使用R包完成护垫和插入;对于绩效评估,我们使用Wong et. al.(2019)在R中的绩效评估函数[28,37,38,39].
结果
研究人群
在1973年FS共725名参与者的子研究访问中,根据方法中描述的排除标准,39次研究访问被排除——16次访问(2名参与者)无CES-D-10评分,18次访问(5名参与者)无同时CCC访问,以及所有访问中来自1名参与者的所有5次访问均无预测数据(EQ-5D健康状态)。因此,717名参与者共访问了1934次,为最终的研究样本做出了贡献。样本中首次就诊的参与者特征见表2.es - d -10评分中位数为10 (IQR, 5,15), 53%的参与者报告存在抑郁症状,es - d -10评分≥10;45%的人在基线时被开了一种或多种精神药物,如安非他酮和西酞普兰,但只有10%的人在病历中记录了抑郁症诊断。参与者主要是男性(73%)和白人(76%)。在社会经济地位(SES)特征方面,人口是脆弱的,73%的人失业,76%的人月收入低于1500美元,52%的人高中是最高教育水平,46%的人在基线时接受福利。目前注射吸毒者约占34%,目前饮酒者约占62%,目前吸烟者约占75%。只有一小部分患者患有晚期肝病(4%)或目前患有艾滋病相关疾病(4%),35%患者无症状,CD4细胞计数为> 500个/μl (CDC临床分期- a1)。
绩效评估
训练数据为1548次,测试数据为386次。初步分析中的算法显示出可接受的校准,如图S所示1关于鉴别,初步分析的ROC曲线如图所示。1,曲线靠近左上角。完整算法和简化算法的估计auc分别为0.82 (95% CI: 0.78-0.86)和0.76 (95% CI: 0.71-0.81)。估计的敏感性、特异性、PPV、NPV、LR +和LR-见表3..两种算法的25个最重要预测因子的重要性图如图所示。2.就业、HIV临床分期、收入来源、身体质量指数(BMI)和教育程度是最重要的5个预测因素。
附加分析A-D的结果见表4总结在这里。A)当使用来自每个人一次访问的信息时,整体性能要低得多,完整算法的AUC为0.74 vs 0.82,简化算法为0.60 vs 0.76。B)对于附加CES-D-10阈值的算法,截止点为15的完整算法的AUC点估计值高于10 (0.87 vs 0.82)。其他截止估计与截止10的相应算法相似,具有重叠的置信区间。c .)包含额外的粮食不安全预测因子的算法具有与完整算法相似的AUC估计,具有重叠的置信区间。d .)预测连续CES-D-10分数的完整算法的r-平方为0.5,这表明该算法只能解释CES-D-10分数中50%的可变性,并且具有4.8的高RMSE,而对于r-平方为0.3的简化算法,该算法只能解释分数中30%的可变性,并且具有5.5的高RMSE。
讨论
我们利用一项队列研究的患者数据开发了一种随机森林算法,该队列研究可靠地预测了易感染HIV-HCV合并感染人群中临床抑郁症风险的抑郁症状的存在。算法使用了一组从队列中选择的候选预测因子(x = 137)。使用所有候选预测因子的完整算法表现更好,AUC为0.82,这表明区分CES-D-10类的几率为82%,而使用更小子集(x = 46)的简化算法为0.76 [33].在我们的研究中,抑郁症状的患病率非常高,超过50%的人在首次就诊时被CES-D-10发现有抑郁风险。尽管如此,只有10%的人在他们的医疗记录中有抑郁症诊断记录,这表明在没有筛查的情况下,这一人群可能严重低估了抑郁症的负担。
我们开发了这个工具来评估临床图表和研究中通常收集的患者数据是否有助于预测抑郁症状的存在,这些数据很少对所有患者进行常规直接测量,也不会随着时间的推移反复测量。这个工具将最有用进行纵向临床和流行病学研究,而不是临床护理。它可能有助于识别有抑郁症风险的人,研究这种风险如何随着时间的推移和各种干预措施而变化。
大多数使用机器学习的研究都预测了抑郁症状的未来发作[19,40,41而像我们这样的少数研究则专注于当前的抑郁症预测[42,43].研究了各种预测因素,包括人口统计学和临床数据、过去的病史和生活事件。一系列机器学习算法,如人工神经网络、支持向量机、naïve贝叶斯分类器和随机森林,被用于一般人群和特定群体,如老年人群和糖尿病患者。这些算法得出的AUC测量值与我们的相似,范围在0.70-0.95之间。
CCC收集广泛的人口统计学、行为学和临床数据。在完整的算法中,使用可用预测器的全范围和多样性确实显示出出色的辨别能力。然而,为了更大的适用性,我们选择了46个预测因子的子集,这些预测因子可能在其他研究环境中更容易获得,尽管使用了三分之一的预测因子数量和更少的粒度数据,但总体上的区分仍然是可以接受的。每名参与者仅访问一次的附加分析的AUC相对较低,这可能是由于样本量较小,因此可用数据的可变性较低。
我们开发的算法是一个纯粹的预测算法,因此估计单个预测因子的影响强度是不可能的。该评估需要使用不同的建模策略进行进一步的分析。然而,该算法确实提供了一些对分类可能很重要的因素的见解。这五个最重要的预测因子与两个主要主题有关。SES(教育、收入来源和就业);总体健康状况(艾滋病毒临床阶段和BMI)。众所周知,SES是抑郁症的一个重要决定因素。领取福利和来自低收入家庭与食品不安全和精神健康问题的风险增加有关[44,45].据报道,在加拿大,近20%的重度抑郁症患者失业。46].另一个与健康状况相关的重要预测因子是BMI。关于BMI和抑郁症之间的关系,以及种族和性别之间的可能差异,已有研究得出了相互矛盾的结果[47,48] BMI分类可能无法充分反映人们的健康状况,因此需要谨慎考虑这一预测因素[49].最后,在包含所有137个预测因子的完整算法中,EQ-5D- 3l焦虑/抑郁维度是最重要的预测因子,所有EQ-5D维度(活动能力、自我护理、日常活动、疼痛/不适和健康状态)都是25个最重要的预测因子。这进一步证明了参与者的健康状况,以及在EQ-5D-3L的情况下,他们感知的健康状况,在预测抑郁症状方面是重要的。
因此,这项研究有很多优点。由于从各种临床环境(全国城市和半城市地区的外联、初级和三级保健诊所)招募人员,CCC可推广到加拿大从事护理的艾滋病毒-丙型肝炎合并感染患者。用于开发这些算法的样本可以推广到父CCC(参见附录D;表的年代3.).所使用的方法RF是非参数的,高度准确,对异常值和噪声具有相对鲁棒性,并且确实具有防止过拟合的保障措施,因此提高了数据以外的适用性的机会。然而,在应用于其他队列和研究之前,需要外部验证,以降低过拟合的风险。此外,预测者重要性图提供了一些关于预测者在准确预测抑郁症状中起主要作用的见解。
然而,这项研究也有局限性。与使用电子健康记录的射频大数据应用相比,样本量较小。在其他研究中描述的一些预测因素,如童年创伤、食物不安全等,并不能用于完整的CCC。例如,在我们添加了仅在粮食安全子研究中收集的粮食安全变量的附加分析中,AUC略高。此外,我们对CES-D-10进行分类以创建二进制类,因此可能由于没有预测单个CES-D-10分数而丢失了一些数据。我们确实开发了一种回归算法来预测附加分析E中的连续CES-D-10评分,但它只能解释结果变异性的一小部分。在这项研究中,抑郁症的金标准诊断是不可用的,因此在这个样本中,10的截止值的有效性不能直接评估。总的来说,当使用其他三个建议的CES-D- 10临界值(8,13,15)与临界值为10时,总体auc相似。然而,使用截止15的完整算法似乎比使用截止10(0.82)具有更高的AUC(0.87)。在未来的研究中评估这一较高的阈值是否更适用于合并感染人群将是重要的。 However, since the CES-D-10 cut-off of 10 has been validated in HIV populations in Canada [24],我们决定使用这一阈值与现有文献和未来可能使用这一通用阈值的研究进行比较。
在这一人群中,抑郁症状的参与者比例很高,重要的是不要错过可能的病例。即使我们开发的算法基于任意阈值被认为具有可接受的辨别能力(≥0.7),我们仍然会对相当比例的案例进行错误分类,因此需要考虑这种可能的错误分类。最后,该算法适用于大部分预测因子被收集的情况。然而,在没有这些数据的情况下,尤其是完全临床非研究的情况下,应该考虑实施像CES-D-10这样的常规筛查工具,特别是考虑到我们在这一合并感染人群中观察到的抑郁症状的高患病率。
结论
在我们的HIV-HCV合并感染人群中,表明临床抑郁症风险的抑郁症状很常见。我们开发的随机森林算法在使用研究环境中收集的患者特征数据准确预测临床抑郁症风险升高方面表现出了希望。这些算法确定了抑郁症症状分类的重要特征,包括就业、HIV临床阶段、收入来源、BMI和教育程度。这种机器学习算法可以用于研究环境,特别是队列研究,在这些研究中,这些数据可能用于预测抑郁症状的存在,并使用这些信息来了解抑郁症状对脆弱人群的临床、卫生服务和患者报告结果的影响。
数据和材料的可用性
在当前研究期间生成和/或分析的数据集尚未公开。根据提供的患者同意书和我们的机构伦理审查委员会的规定,根据加拿大临床试验法规的要求,包括在研究期间收集的机密信息在内的研究记录必须在研究结束后安全存储25年。然而,去除个人标识符的数据,可应要求共享给通讯作者,或共享给:MUHC应用伦理中心临床试验2研究伦理委员会(REB)协调员Sheldon Levy先生(sheldon.levy@muhc.mcgill.ca)。
缩写
- 艾滋病:
-
获得性免疫缺陷综合症
- APRI:
-
天冬氨酸转氨酶(AST)与血小板比
- AUC:
-
受试者工作特征曲线下面积
- 体重指数:
-
身体质量指数
- CCC:
-
加拿大合并感染队列
- CD4:
-
分化受体簇
- 疾病预防控制中心:
-
疾病控制中心
- CES-D-10:
-
流行病学研究中心抑郁症10级
- 置信区间:
-
置信区间
- EQ-5D-3L:
-
EuroQol-5 Dimension-3 Level
- FS:
-
食品安全
- 丙肝病毒:
-
丙型肝炎病毒
- 乙肝病毒:
-
乙型肝炎病毒
- HFSSM:
-
家庭粮食安全调查模块
- 艾滋病毒:
-
人体免疫缺陷病毒
- HR-QoL:
-
与健康有关的生活质量
- 差:
-
四分位范围
- LR -:
-
负似然比
- lr +:
-
正似然比
- 净现值:
-
负预测值(NPV),
- OOB:
-
Out-of-Bag样品
- P6M:
-
在过去6个月
- PPV:
-
正向预测值
- 射频:
-
随机森林
- RMSE:
-
均方根误差
- RNA:
-
核糖核酸
- 中华民国:
-
接收机工作特性
- SES:
-
社会经济地位
参考文献
Shatte ABR, Hutchinson DM, Teague SJ。心理健康中的机器学习:方法和应用的范围审查。精神医学2019;49(9):1426-48。
慢性丙型肝炎病毒感染者的护理和治疗指南日内瓦:世界卫生组织;2018.报告没有。:License: CC BY-NC-SA 3.0 IGO.https://www.who.int/publications/i/item/9789241550345.
徐志伟,徐志伟,张志伟,陈志伟,等。HIV感染患者抑郁的临床研究进展。Curr Psychiatry代表2015;17(1):530。
Younossi Z, Park H, Henry L, Adeyemi A, Stepanova M.丙型肝炎的肝外表现:患病率、生活质量和经济负担的荟萃分析胃肠病学。2016;150(7):1599 - 608。
杨紫琼,霍姆斯ACN, Saling MM, Everall IP, Nicoll AJ。慢性丙型肝炎患者的抑郁、疲劳和神经认知障碍。国际肝病杂志,2018;12(4)294-304。
Fialho R, Pereira M, Rusted J, Whale R. HIV和HCV合并感染患者的抑郁:系统回顾和荟萃分析。心理健康医学,2017;22(9):1089-104。
Belenky NM, Cole SR, Pence BW, Itemba D, Maro V, Whetten K.坦桑尼亚的抑郁症状、HIV药物依从性和HIV临床结果:一项前瞻性观察性研究。PLoS ONE。2014; 9 (5): e95469。
艾比布拉W, Cox J, Hamelin A- m, Moodie EEM, Anema A, Klein Marina B,等。HIV- hcv合并感染者抑郁症状、CD4计数和HIV病毒抑制的相关性艾滋病护理。2018;30(5):643-9。
Malhi GS, Mann JJ。抑郁症。柳叶刀(伦敦,英国)。2018, 392(10161): 2299 - 312。
伊顿WW。约翰霍普金斯大学布隆伯格公共卫生学院精神学系H.公共精神卫生。纽约:牛津大学出版社;2012.
马华,陈志伟,陈志伟,等。加拿大不列颠哥伦比亚省HIV感染者HCV合并感染状况对医疗保健相关利用的影响:一项回顾性队列研究BMC健康服务决议2018;18(1):319。
李国强,李国强,李国强。打破丙型肝炎病毒(HCV) /艾滋病毒合并感染个体治疗的障碍:系统、提供者和患者层面需要采取的行动。中华传染病杂志,2013;37 (1):S19-25。
Bonner JE, Barritt AST, Fried MW, Evon DM.是时候重新考虑同时存在精神健康/药物滥用问题的丙型肝炎患者的抗病毒治疗了。中国生物医学工程学报(自然科学版),2012;
Knott A, Dieperink E, Willenbring ML, Heit S, Durfee JM, Wingert M,等。慢性丙型肝炎临床的综合精神/医疗护理:对抗病毒治疗评估和结果的影响中华胃肠病杂志。2006;101(10):2254-62。
阿纳格诺斯托波洛斯A, Ledergerber B, Jaccard R, Shaw SA, Stoeckle M, Bernasconi E,等。瑞士艾滋病毒队列研究(SHCS)参与者中抑郁症的频率和危险因素。PLoS ONE。2015; 10 (10): e0140943。
德怀尔DB, Falkai P, Koutsouleris N.临床心理学和精神病学的机器学习方法。临床精神病学。2018;14(1):91-118。
Graham S, Depp C, Lee EE, Nebeker C, Tu X, Kim HC,等。心理健康和精神疾病的人工智能:概述。Curr Psychiatry代表2019;21(11):116。
Sau A, Bhakta I.人工神经网络(ANN)模型预测加尔各答贫民窟老年人群的抑郁症。印度临床诊断杂志,2017;11(5):Vc01-vc4。
金华,吴松,迪卡普亚。糖尿病患者共病抑郁症临床预测模型的建立及其在抑郁症筛查政策制定中的应用。慢性疾病2015;12:E142。
杨海燕,李志强,李志强,等。队列概况:加拿大hiv -丙型肝炎合并感染队列研究。国际流行病学杂志,2010;39(5):1162-9。
张文杰,李文杰,李文杰,等。加拿大艾滋病-丙型肝炎病毒联合感染个体的粮食不安全:共病的重要性艾滋病行为学杂志,2017;21(3):792-802。
EuroQol————衡量健康相关生活质量的新设施。《卫生政策》,1990;16(3):199-208。https://doi.org/10.1016/0168 - 8510 (90) 90421 - 9.
安德烈森EM,马尔姆格伦JA,卡特WB,帕特里克DL。老年人抑郁症筛查:流行病学研究中心抑郁量表(CES-D)简写评估中华预防医学杂志1994;10(2):77-84。
张伟,O 'Brien N, Forrest JI, Salters KA, Patterson TL, Montaner JS,等。在加拿大不列颠哥伦比亚省的hiv阳性人群中验证缩短抑郁量表(10项CES-D)。PLoS ONE。7 (7): 2012; e40793。
随机森林。Mach Learn. 2001;45(1): 5-32。
马丽娟,陈建平,陈建平。基于非参数学习机的概率机器一致性估计方法。方法中华医学杂志,2012;51(1):74-81。
李志强,李志强。统计学习的要素:数据挖掘、推断和预测。第二版。纽约:施普林格;2009.https://doi.org/10.1007/978-0-387-84858-7.
来自Jed Wing SW, Andre Williams, Chris Keefer, Allan Engelhardt, Tony Cooper, Zachary Mayer和Brenton Kenkel, R Core Team, Michael Benesty, Reynald Lescarbeau, Andrew Ziem, Luca scucca, Yuan Tang, Can Candan, Tyler Hunt的贡献。插入:分类和回归训练。R包版本6.0-842019。
Baron EC, Davies T, Lund C.流行病学研究中心10项抑郁量表(CES-D-10)在南非祖鲁人、科萨人和南非荷兰人中的验证。BMC精神病学杂志,2017;17(1):6。
Bjorgvinsson T, Kertz SJ, Bigda-Peyton JS, McCoy KL, Aderka IM。精神病学样本中CES-D-10的心理测量特性。评估。2013;20(4):429 - 36。
加拿大社区健康调查,周期2.2,营养(2004年):加拿大与收入相关的家庭粮食安全。渥太华:加拿大卫生部;2007.ISBN 978-0-662-45595-0。https://www.canada.ca/en/health-canada/services/food-nutrition/food-nutrition-surveillance/health-nutrition-surveys/canadian-community-health-survey-cchs/canadian-community-health-survey-cycle-2-2-nutrition-2004-income-related-household-food-security-canada-health-canada-2007.html.
Steyerberg电子战。临床预测模型 :开发、验证和更新的实用方法。瑞士占姆:施普林格;2019.
Hosmer DW, Lemeshow S, Sturdivant RX。应用逻辑回归。高雅:威利;2013.
Youden WJ。对诊断测试进行评级的索引。癌症。1950;3(1):32-5。
StataCorp。Stata统计软件:第16版。大学城,德克萨斯州:StataCorp LLC;2019.
R核心团队。R:统计计算的语言和环境。Austria2013的维也纳。
Ziegler A. ranger:在c++和R. 2017中快速实现高维数据的随机森林。2017, 77(1): 17。
王杰,王晓明,王晓明,王晓明。超参数调优能否提高超级学习者的学习性能?:案例研究。流行病学。2019;30(4):521 - 31所示。
Joie E, Kym IES, Emma CM。PMCALPLOT: Stata模块,用于生成预测模型性能的校准图。S458486 ed:波士顿学院经济系;2018.
Sau A, Bhakta I.使用机器学习技术筛查海员中的焦虑和抑郁。通知Med解锁。2018:100149。https://doi.org/10.1016/j.imu.2018.12.004.
Rosellini AJ, Liu S, Anderson GN, Sbi S, Tung ES, Knyazhanskaya E.开发预测成人发病内化障碍的算法:集成学习方法。《精神病学杂志》2019;121:189-96。
王娟,Sareen J, Patten S, Bolton J, Schmitz N, Birney A.一般人群重性抑郁症首次发病的预测算法:发展与验证。中华流行病学杂志,2014;68(5):418-24。
King M, Bottomley C, Bellon-Saameno J, Torres-Gonzalez F, Svab I, Rotar D,等。预测欧洲全科患者的重度抑郁症发作:将预测风险算法的应用从12个月扩展到24个月。精神医学。2013;43(9):1929-39。
Coiro乔丹。领取福利的妇女的抑郁症状。妇女健康,2001;32(1-2):1-23。
吴s, Fraser MW, Chapman MV,高强,黄杰,Chowa GA。探索美国儿童福利参与与成年抑郁症之间的关系。社会科学,2018;76:12-22。
李志刚,李志刚,李志刚,李志刚,等。初级和三级保健机构的抑郁和就业状况。中华精神病学杂志。2015;60(1):14-22。
Monda V, La Marra M, Perrella R, Caviglia G, Iavarone A, Chieffi S,等。肥胖与脑部疾病:从认知与心理证据到肥胖悖论。中国糖尿病杂志,2017;10:473-9。
Banack HR, Kaufman JS。从坏到坏:对撞机分层放大了“肥胖悖论”中的混杂偏见。中华流行病学杂志,2015;30(10):1111-4。
Nuttall FQ。身体质量指数:肥胖,bmi,与健康:一个重要的回顾。植物学报。2015;50(3):117-28。
确认
我们要感谢加拿大联合感染队列(CTN222)的参与者,研究协调员和护士在研究协调、参与者招募和护理方面的帮助,以及加拿大联合感染队列(CTN222)的共同研究者-博士。丽莎·巴雷特,杰夫·科恩,布莱恩·康威,柯蒂斯·库珀,皮埃尔Côté,约瑟夫·考克斯,M.约翰·吉尔,沙里克·海德尔,大卫·哈斯,马克·赫尔,Valérie Martel-Laferrière,胡里奥·蒙塔纳,艾丽卡·e·m·莫迪,尼奥拉·皮克,丹妮尔·鲁洛,艾达·萨德尔,史蒂夫·桑奇,罗杰·桑德尔,马克·廷德尔,玛丽-路易斯·瓦琼,莎伦·沃姆斯利和亚历山大·王。
财团的名字:加拿大合并感染队列
首席研究员:玛丽娜·克莱因1 2 11
同事们:丽莎·巴雷特12——杰夫·科恩13——布莱恩·康威5——柯蒂斯·库珀4,皮埃尔Côté14约瑟夫·考克斯1、2——约翰·吉尔15,沙里克·海德尔16——马克·赫尔6, Valérie Martel-Laferrière7埃丽卡·e·m·穆迪1——尼奥拉·匹克17,丹妮尔·鲁洛18——史蒂夫·桑奇19——罗杰·桑德20.玛丽·路易斯·瓦尚8莎伦·沃姆斯利9,黄大仁10
12.加拿大新斯科舍省哈利法克斯的达尔豪斯大学
13.温莎地区医院大都会校区,温莎,安大略省,加拿大
14.倩碧Médicale du Quartier Latin,蒙特利尔,魁北克,加拿大
15.南阿尔伯塔艾滋病诊所,卡尔加里,阿尔伯塔,加拿大
16.麦克马斯特大学,加拿大安大略省汉密尔顿
17.橡树诊所,温哥华,不列颠哥伦比亚,加拿大
18.Université de Montréal,蒙特利尔,魁北克,加拿大
19.萨斯喀彻温大学,萨斯卡通,萨斯喀彻温,加拿大
20.加拿大安大略省萨德伯里萨德伯里地区医院
资金
这项工作得到Fonds de recherche du Québec-Santé的支持;Réseau sida/疾病感染,加拿大卫生研究所(CIHR;fdn - 143270);CIHR加拿大HIV试验网络(CTN222 & CTN264)。通用由加拿大丙型肝炎网络的博士培训生奖学金支持。MBK由一级加拿大研究主席支持。资助者在这篇手稿的制作中没有任何作用。EEMM由Québec-Santé研究基金会的chercheur de mérite奖和加拿大研究主席(Tier 1)支持。VML由Québec-Santé研究基金会的临床研究学者-初级1奖学金支持。
作者信息
作者及隶属关系
财团
贡献
根据国际医学杂志编辑委员会的要求,所有作者都对这项研究做出了贡献。MBK、EEMM和GM构想并设计了这项研究。GM和CLD准备了分析数据集。通用汽车公司进行了所有统计分析。通用、EEMM和安博凯起草了初稿。所有共同作者MJB, JC, CC, BC, MH, VML, MLV, SW和AW对文件进行了严格的修改,并在完成之前给予了最终的批准。所有作者都对这项工作的准确性和完整性负责。作者阅读并批准最终的手稿。
作者的信息
不适用。
相应的作者
道德声明
伦理批准并同意参与
这项研究得到了麦吉尔大学健康中心研究伦理委员会的批准(2021-6985)。CCC和FS子研究得到了麦吉尔大学卫生中心研究伦理委员会(2006-1875,BMB-06-006t, 2013-994)和参与机构的研究伦理委员会的批准。这项研究是根据《赫尔辛基宣言》进行的。研究中所有个体参与者都获得了知情同意。
发表同意书
不适用。
相互竞争的利益
JC从ViiV Healthcare、Merck和Gilead获得了补助金和咨询费,并从Bristol-Myers Squibb获得了个人费用。CC曾作为吉利德、默克、杨森和百时美施贵宝国家顾问委员会的成员收取个人费用。BC是董事会成员、顾问,接受过艾伯维(AbbVie)、吉利德(Gilead)和默克(Merck)的资助和讲座费用,以及艾伯维(AbbVie)的教育演示费用。MH曾担任Merck, Vertex Pharmaceuticals, Pfizer, Viiv Healthcare和or - jansen的顾问。MH还获得了国家药物滥用研究所的资助,以及默克公司和or - janssen公司的讲座费用。MLV报告来自艾伯维的个人费用,来自默克的个人费用,来自吉利德的个人费用,在提交的工作之外。SW从默克公司、ViiV Healthcare、葛兰素史克公司、辉瑞公司、吉利德公司、艾伯维公司、百时美施贵宝公司和杨森公司获得了补助金、咨询费、讲解费、非金融支持和教育演示文稿开发费。安博凯报告了来自ViiV Healthcare、艾伯维、默克和吉利德的研究者发起的研究资助;以及ViiV Healthcare、默克、艾伯维和吉利德的咨询费。GM, EEMM, MJB, CLD, VML和AW没有利益冲突需要披露。
额外的信息
出版商的注意
188博金宝app网施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。
补充信息
权利和权限
开放获取本文遵循知识共享署名4.0国际许可协议,允许以任何媒介或格式使用、分享、改编、分发和复制,只要您对原作者和来源给予适当的署名,提供知识共享许可协议的链接,并注明是否有更改。本文中的图像或其他第三方材料包含在文章的创作共用许可协议中,除非在材料的信用额度中另有说明。如果材料未包含在文章的创作共用许可协议中,并且您的预期使用不被法定法规所允许或超出了允许的使用范围,您将需要直接获得版权所有者的许可。如欲查看本牌照的副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献弃权书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条所提供的资料,除非在资料的信用额度中另有说明。
关于本文
引用本文
马拉瑟,G.,穆迪,E.E.M,布鲁莱特,MJ。et al。使用监督机器学习预测加拿大HIV-HCV合并感染人群中抑郁症状的存在BMC医学Res Methodol22, 223(2022)。https://doi.org/10.1186/s12874-022-01700-y
收到了:
接受:
发表:
DOI:https://doi.org/10.1186/s12874-022-01700-y
关键字
- HIV-HCV合并感染
- 抑郁症状
- 监督式机器学习
- 随机森林