跳到主要内容

regCOVID:跟踪已注册的COVID-19研究的出版物

摘要

背景

为了应对COVID-19大流行,已经启动了许多临床研究,因此需要有效的方法来跟踪和分析研究结果。我们扩大了之前跟踪已注册COVID-19临床研究的项目,同时跟踪这些研究产生的结果文章。我们的目标是开发一种数据科学方法,以识别和分析与COVID-19临床研究相关的所有出版物,并生成一份优先出版物列表,以有效了解COVID-19临床研究的状态。

方法

我们对ClinicalTrials.gov和PubMed进行了搜索,以确定与COVID-19研究相关的文章,并根据试验阶段、干预措施、位置和最近记录制定了标准,以制定优先排序的结果发表列表。

结果

进行检索的结果是与565项介入试验相关的1 022篇文章(占截至2022年1月31日所有3 167项COVID-19介入试验的17.8%)。通过PubMed的摘要链接确定了609篇论文,通过ClinicalTrials.gov的注册链接确定了413篇论文,其中27篇文章从两个来源链接。在565个发表至少一篇文章的试验中,197个(34.9%)有多个链接出版物。为每篇出版物分配了关注评分,以制定与COVID-19试验相关的所有出版物的优先列表,并确定了83篇来自晚期(3期)试验的结果文章,至少有一个美国站点和多个研究记录更新。在COVID-19疫苗试验中,共发现64项试验的108篇链接结果文章(占436项COVID-19疫苗试验总数的14.7%)。

结论

我们的方法可以有效识别报告注册临床试验结果的重要COVID-19文章,并通过结构化的文章-试验链接进行连接。我们的数据科学方法还允许根据需要进行一致的数据更新,并可推广到其他感兴趣的条件。

同行评审报告

简介

COVID-19大流行导致启动了数千项临床研究,测试各种干预措施并研究疾病的自然病程[12].这包括对各种用于预防或治疗COVID-19的新颖和重新用途的干预措施的研究[3.].对于研究人员或公众来说,浏览和组织大量这样的研究可能很困难。我们以前使用ClinicalTrials.gov (CTG)注册表创建了一个监测已注册的COVID-19研究的框架,称为regCOVID [45].该框架使用数据科学方法,通过关键字搜索计算确定COVID-19临床研究。该框架还使用计算机代码定期监测和分析与COVID-19介入试验、观察性研究和在CTG注册的患者登记有关的关键特征。

一项研究可能发布三种类型的信息:研究开始时的[1]注册数据(在临床试验注册中心,如CTG),研究完成时的[2]基本总结结果(在临床试验注册中心),或[3]一篇评论良好的完整研究结果的文章(在期刊上)。先前对2期或更高阶段介入试验的分析表明,只有27.8%发表了研究结果文章[6].一项完整的研究和一篇或多篇研究结果期刊文章为研究人员和公众提供了最大的价值。研究状态或研究结果信息不足可能导致公众对临床试验企业的信任降低[7].

在本研究中,我们扩展了regCOVID监测项目,现在可以识别与已注册的COVID-19试验相关的研究结果文章[46].由于所有已发表的COVID-19文章的总量可能令人难以承受[89],我们建议只关注与正式注册的研究相关的文章,以促进对COVID-19科学文献的有效审查。不像许多主要使用人工审查的努力,向公众提供试验及其结果的概述[10],我们使用计算临床研究信息学方法来评估哪些COVID-19研究正在发表、发表什么内容以及何时发表[11].读者阅读和审查文章或摘要的时间可能有限,找到一种方法来对文章进行优先级排序是允许有效审查的关键。

因此,本研究的目的是开发一种数据科学驱动的方法,以识别已发表的临床试验结果文章,并优先考虑临床研究人员、卫生保健专业人员和感兴趣的个人可以阅读的文章,以更好地了解COVID-19临床试验研究的现状。我们的计算机化处理脚本也可以推广应用到其他情况。

材料与方法

我们的项目存储库(可在https://github.com/lhncbc/r-snippets-bmi/tree/master/regCOVID/regCOVIDpublications)包括我们的电脑程式码、补充档案、分析结果及详细的网上结果报告[12].我们还使用regCOVIDpub的简称来引用该项目。在整个方法和结果中,我们通过文件名引用项目存储库上的补充文件。脚本是用R语言编写的。对于结果报告,我们使用R Markdown框架。对于大多数分析,存储库将提供每月更新的结果。

为了找到与在CTG上注册的COVID-19临床研究相关的结果文章,我们执行了三个高级步骤。在第一步中,确定了COVID-19研究。在第二步中,我们试图收集与这些研究相关的所有已发表的研究结果文章,在第三步中,我们检索关于这些文章及其附属研究的额外元数据,并创建一个优先级评分系统,以确定最重要的出版物。下面的部分详细介绍了每个高级步骤的细节。

COVID-19研究

在第一步中,使用我们之前发表的关于跟踪已注册COVID-19临床研究(regCOVID)的工作结果检索了CTG所有已注册的COVID-19研究(见研究资源库中的补充文件' ../regCOVIDpublications_trials_all.csv ') [4].用于分析的符合条件的研究包括在CTG上注册并正在招募、活跃或结束(完成或终止)的所有COVID-19介入试验、观察性研究或注册。所有研究,无论国家和地点,只要在CTG上注册,都被包括在内。

COVID-19研究论文鉴定

一旦确定了符合条件的研究,在第二步中,我们使用两种不同的方法搜索与每项研究相关的出版物:注册表链接和摘要链接。该方法基于我们研究小组先前发表的工作[6].我们在下面分别描述每篇文章的链接机制。

注册中心链接的结果文章搜索

注册表链接的结果文章是包括在CTG注册表上的研究记录中的文章。我们使用了杜克大学研究人员开发的临床试验综合分析(AACT)数据库[13].AACT数据库是通过解析来自CTG的XML研究数据而创建的。13].研究记录中的' result_reference ' XML字段用于标识研究的结果发布。使用先前的知识,一些结果参考文章被错误地贴上了标签,我们使用文章发表日期来删除错误分类的文章(实际上是“supporting_reference”类型的文章)。详情请参阅此先前出版物[6].然后,我们将CTG研究记录中发现的结果出版物与PubMed摘要链接起来,以确定关于文章的关键细节,例如文章标题和类型。作为背景,之前对2006年至2009年间完成的8 907项试验的研究发现,7.3%的试验倾向于至少有一项注册中心相关的结果文章[6].

摘要链接结果文章搜索

摘要链接文章是指试验结果文章的作者遵循国际医学期刊编辑委员会的指导,并在文章摘要中适当引用相关试验标识符的文章。该引用由PubMed处理并转换为可搜索的文章元数据(称为辅助标识符)。我们在PubMed中通过元数据搜索检索了摘要链接文章,其中文章辅助标识符包含COVID-19试验的CTG标识符(NCT ID)。在上下文方面,先前提到的同一项研究发现,23.3%的试验倾向于有抽象链接的结果文章[6].

我们结合了这两种搜索方法的出版物列表,生成了链接COVID-19文章的主列表(请参阅补充文件' regCOVIDpublications_publication_list_all.csv ')。主发布列表允许对生成的文章进行增强的审查。它结合了PubMed和CTG数据,并显示试验NCT标识符、PubMed PMID标识符、试验干预(例如,恢复期血浆)、使用医学主题标题(MeSH)的文章关键词、试验赞助商(例如,牛津大学)和许多其他文章或试验元数据。我们根据研究类型对文章集进行了分离,并仅对介入性试验进行了其余的分析,因为它们是(在大流行的现阶段)最相关的试验,也是我们研究的主要重点。

刊物分析

干预措施

在一项试验中研究的干预措施(例如,瑞德西韦)并在一份出版物中讨论有助于该出版物在研究领域中的重要性。干预必须通过干预试验阶段(1/2/3阶段)才能获得特定适应症的监管批准。随着干预措施在不同试验阶段的进展,它们达到了申请监管机构批准和广泛应用的点,并在成功的第三阶段试验中获得应用,它们在应用中获得了重要意义。许多干预措施可能无法进入第三阶段试验,也永远不会进入监管部门批准的阶段。研究了针对COVID-19的不同干预措施,并推进到不同阶段。因此,我们为研究的每项干预都创建了干预显著性评分。该评分的计算方法是,根据干预措施在特定阶段是否有试验,分配基于阶段的数值,并为该阶段的每个试验添加0.001,以增加该阶段存在多个试验的显著性。虽然研究干预措施的试验数量很重要,但具有多个1期或2期试验的干预措施并不具有具有成功的3期试验并获得监管机构批准的试验的意义,因为这些没有进展的干预措施不容易应用于现实世界。评分系统解释了这一点。例如,tocilizumab有12个3期试验,因此干预评分将增加3.012(3期试验为3,12个3期试验为0.12[12 *0.001])。 The higher the score the more significant the level of study of the intervention in the COVID-19 research landscape. For trials that combined two phases, we counted the trial as being of the higher phase (a phase 2/3 trial was considered just a phase 3 trial).

出版关注得分

我们的目标是生成一个出版物排名列表,其中最重要的出版物出现在顶部。我们使用了一个注意力评分的结构,给最重要的出版物更高的值。评分基于发表的最近时间、试验的阶段、干预显著性评分、试验记录更新的次数(高影响试验更新频率更高),以及试验是否包括美国站点。换句话说,最近的、后期试验的、涉及重大干预的、涉及多次更新的CTG研究记录的以及至少有一个美国站点的出版物排名更高。出于评分的目的,如果一个试验是两个阶段的组合,例如2/3阶段试验,我们将其视为较高阶段(本例中的阶段3)。

我们还从PubMed检索了文章类型,并给予非研究结果文章的出版物,如协议或社论,其重要性较低,因此注意力得分较低。

在最终排名的出版物列表中,我们还向用户展示了进一步重要的出版物和研究元数据,这些元数据不是计算关注得分的输入参数。这些信息包括研究发起人、发表论文的期刊,以及研究结果是否作为试验记录的一部分存入CTG。这些信息可以在补充材料(项目存储库中的regCovidpublications_Master.csv)中看到。

COVID-19疫苗试验的子集

鉴于对COVID-19疫苗试验的高度重视和兴趣,我们专门研究了COVID-19疫苗干预试验的一个子集。该子集是通过搜索试验标题中的“疫苗”一词来开发的(在先前发表的regCOVID研究中开发和评估;截至2021年,CTG未将疫苗作为单独的干预类型捕获)[4].与COVID-19研究的总体集类似,我们根据关键试验和出版物特征分析了疫苗试验,并为与COVID-19疫苗试验相关的每篇出版物生成了关注得分。

观察性研究和登记

除了前面提到的介入试验分析外,还分析了观察性研究和登记。同样,对于介入试验,我们确定了摘要和注册中心链接的出版物,并根据出版物的最近性、研究记录更新的数量以及研究是否包括美国网站来分配注意力评分。阶段与观察性研究和登记无关。

结果

以下所有分析结果均基于2022年1月31日的查询日期。我们计划在研究资料库中发表更新的结果[12].存储库历史机制和正式的数据发布允许随着时间的推移检索任何数据发布。存储库包含使用R notebook框架生成的报告(计算机代码与用户友好的结果输出相结合)。除了报告之外,重要的结果还以电子表格格式作为单独的文件提供。这些单独的文件在以' regcovidpublations_ '为前缀的结果中被引用。

介入试验

截至查询日(2022年1月31日),共确定和分析了3167项正在招募、活跃或已结束(完成或终止)的COVID-19介入试验(见文件regCOVIDpublications_trials_int.csv)。在试验层面,共有565项试验(3167项试验中的17.8%)至少有一篇相关结果文章。197项(34.9%)试验发表了多篇文章,106项(18.8%)试验发表了三篇或三篇以上文章。

试验文章链接类型组合的总数为1 022个,其中609篇(59.6%)独特文章通过摘要链接识别,413篇(40.4%)独特文章通过注册链接识别。27篇(2.6%)文章重叠,并通过两种链接类型进行识别。由于同一篇文章可以链接到多个试验(例如,荟萃分析或关于多个试验的社论),926篇不同的出版物链接到所有纳入的COVID-19介入试验。

重要的是要考虑(首席研究员或其他研究官员)将出版物与试验联系起来的努力程度。摘要链接更容易、更快,因为文章作者可以简单地在摘要中陈述NCT ID,并且由于PubMed摘要的自动化处理,文章-研究链接是自动生成的。大多数结果文章(59.6%)是摘要链接。另一方面,注册表链接需要更新CTG中的记录,要么通过应用协议接口提交XML文件,要么使用CTG基于web的数据输入系统(称为协议注册和结果系统;PRS)。根据我们的方法,1170篇与注册中心链接的文章被删除为不正确的、错误分类的结果文章(在试验开始之前有发表日期的文章)。

干预措施

使用我们的计算机化方法,我们确定了在COVID-19介入试验中使用的4036种干预措施。在这4036项干预中,784项至少有一项与试验相关的出版物。表格1显示了基于干预评分的干预措施的子集,包括测试给定干预措施的发起人数量,以及这些试验产生的出版物数量。数字1显示了相同干预措施在不同阶段的试验数量。所有干预措施的数据(除表中所示的前10项外)1)可在regCovid_intervention-phase_cnts_int2.csv文件中以及项目存储库中的regCOVIDpublications报告中找到。

表1按阶段、出版物和赞助商按干预汇总的试验计数
图1
图1

选择COVID-19干预措施按阶段进行试验计数

根据试验数量和试验涵盖的阶段广度,羟氯喹是发表最多(86篇)和干预得分最高(11.122分)的干预措施,而恢复期血浆是研究它的赞助商最多的干预措施(103篇)。850项干预措施至少进行了一次3期(或2/3期)试验。虽然多个候选疫苗在每个阶段都取得了进展,但干预显著性得分低于大多数其他进展到类似阶段的干预措施,因为研究候选疫苗的试验量通常受到只有开发者(和选定的联合发起人)研究候选疫苗的限制。例如,Moderna公司的候选疫苗mrna-1273共有15项试验(3项1期试验,4项2期试验,7项3期试验和1项4期试验),干预显著性评分为10.015,低于大多数其他也进入3期的干预(见表)1),它们的总试验量要高得多。

出版的意义

使用关注得分对出版物进行排名,我们生成了所有1022种出版物的排名列表和83种优先出版物的简短列表(出版物不是协议,来自至少一个美国站点的晚期试验(阶段3),并有多次研究记录更新)。在1022个试验发表组合中,309个(30.2%)为3期,261个(25.5%)至少有一个美国位点,742个(72.6%)有多个研究记录更新。

表格2显示排位列表中文章的子集。为简洁起见,该表仅显示可用表列的子集。有关1 022篇COVID-19介入试验结果文章和试验组合的完整列表以及所有元数据(表列),请参阅补充文件regCOVIDpublications_ publication_list_int.csv(主文章列表)。主文章列表聚合了来自PubMed和CTG的元数据。

表2高关注分数的出版物子集

使用注意力评分和对审判和出版物的某些事实进行优先排序,极大地减少了所有出版物的列表,使之成为便于读者审查的出版物列表(83种出版物,而1 022种出版物)。假设研究人员在每个摘要上花费2分钟,回顾完整列表和优先排序的短列表的总回顾时间相差31.3小时。

疫苗试验子集

在436个COVID-19疫苗试验的子集中(截至查询日期),至少有一篇论文发表了64篇(14.7%)。在这64个试验中,有108个试验和出版组合,其中92个(85.2%)是摘要链接。鉴于COVID-19疫苗的紧迫性和公众对其的巨大兴趣,我们观察到已发表的关于正在正式进行的试验的重要结果文章,例如辉瑞公司对其候选疫苗BNT162b1和BNT162b2的2/3期试验,该试验已经发表了6篇结果文章,但直到2023年5月2日才列出完成日期。

截至查询日,已有6项疫苗试验正式向CTG注册中心提交了基本摘要结果,其中一项(NCT04498247)也发表了一篇结果文章。法律授权允许在正式完成试验后,为适用的美国试验提供一年的时间。这表明疫苗试验发起人可能更喜欢在学术期刊上发表结果文章,而不是在注册中心发表结果,以向公众传达结果。尽管这种不平衡也受到管理注册中心结果沉积的法律规则(对于美国的试验)的影响,即正式的主要完成日期和该日期之后允许的一年法定时间窗口在很大程度上影响注册中心结果沉积的时间。

观察性研究和登记

由于我们的分析主要是计算机化的,因此对COVID-19观察性研究和登记进行了相同的分析。共发现661篇观察性研究结果文章。与介入试验相比,注册库链接的出版物(365篇,55.2%)多于摘要链接的出版物(296篇)。在研究层面,339项COVID-19观察性研究(在所有2 350项COVID-19注册观察性研究中占14.4%)至少发表了一项结果。

与观察性研究类似,发现了175篇用于注册中心的结果文章,大多数与注册中心相关(106篇,占175篇出版物的60.6%)。在研究层面,72个COVID-19注册中心(占359个COVID-19注册中心总数的20.1%)至少有一篇相关研究结果文章。

与适用的介入试验不同,美国法律不要求对观察性研究进行注册或登记。由于缺乏登记授权,无法确定适当的分母(以了解COVID-19观察性研究或登记的总数)。使用抽象链接或注册链接(依赖于NCT ID)的整个方法对于未注册的研究自然是失败的。研究人员必须依靠传统的PubMed搜索来发现未注册研究的结果文章。

讨论

有几项先前的分析报告了有多少研究向公众提供了结果。Huser等人2013年的分析报告称,27.8%的介入分析试验发表了相关结果文章[6].Bashir等人从2017年开始的系统回顾发现,23%的中位数(从13%到42%不等)与结果文章有关[14].在COVID-19大流行期间,由于公众的关注大大增加,我们有动力了解COVID-19研究的百分比。截至查询日期,我们的结果显示,只有17.8%的COVID-19介入试验有链接的结果文章。然而,由于许多试验的完成日期(或正式进行状态)相对较晚,现在得出一个正式的数字还为时过早。

我们的方法迅速确定了著名试验的结果出版物,例如涉及美国批准的疫苗的试验。对这些研究的有针对性的回顾表明,这些研究经常更新其CTG记录,这使研究元数据和研究状态(已完成、终止或正在进行)更有信心。在将试验与其结果报告的期刊文章进行对比方面,大多数COVID-19介入性试验的链接结果文章都是通过摘要链接找到的(59.6%),这可能是因为在文章摘要中包含NCT ID更容易。

我们方法的主要优势是为研究人员和公众提供有价值的元数据的结构化文献概述,这些元数据结合了来自科学文献(PubMed)和临床试验注册(CTG)的信息。它允许研究人员根据各种有用的参数(试验阶段、发起人、干预等)对文章进行排序或聚合。这种能力是现有工具无法实现的。无论是PubMed搜索还是临床试验注册都不允许将两种来源的数据结合起来进行审查。它允许通过自动计算机脚本生成特定疾病的临床研究概述。例如,对某一干预措施(如羟氯喹)的所有文章进行回顾,可以揭示对其疗效是否存在共识,或者是否存在分歧,需要进行更多的研究。以羟氯喹为例,对美国6项临床试验的12篇结果文章的回顾(在优先的短名单上)都表示干预无效。一个完整的文章主列表的审查(全球范围;不限于至少有一个美国站点的试验)将显示来自40个研究羟氯喹的试验的总共97篇文章(参见主文章列表的补充文件,称为' regCOVIDpublications_publication_list_int.csv ')。

试验可见性水平

我们的结果显示了不同程度的试验结果报告,从零到多个结果文章。发现146项COVID-19介入试验有多个研究结果文章,以及多个注册记录更新。下一个层次是只有一篇结果文章的试验。考虑到至少有一篇期刊文章链接的试验,65.1%的试验中只有一篇文章。在只有一篇文章的一组试验中,20.9%的试验只发表了发表类型的方案,而没有发表类型的研究结果文章,这是最有价值的。最后,绝大多数COVID-19试验没有任何相关的结果发表(2 602项研究,占82.2%),这使得感兴趣的各方很难知道试验的结果。一个更极端的试验信息极少的例子是没有相关结果文章和CTG研究记录零更新(除了初始注册)的试验(506项介入试验,占3167项介入试验总数的16.0%)。我们的项目regCOVID是第一个利用注册表记录更新的数量(以及更新的类型)作为一种新颖的计算研究元数据结构,以进一步按活动级别对研究进行分类。这有助于比较具有相同官方研究状态的研究,并提高来自这些研究的结果发表的优先级。

由于沉积

作为一种通过文章发表研究结果的替代方法,许多研究选择将研究结果存入CTG来分发。共有146项试验保存了基本的总结结果。在这些试验中,56个试验只登记了结果,没有研究结果文章,而其余90个试验既登记了结果,也发表了结果文章。

试用注册时间

作为我们分析的一部分,我们发现试验记录在三个不同的时间点:[1]之前到试验开始,试验开始后和完成前的[2]()和[3]试验完成。先前的一项研究表明,大多数研究都是在研究开始后但结果发表之前进行回顾性登记的[15].另一项研究表明,试验登记和时间可能受到各种试验特征的影响[16].在所有COVID-19试验中,试验开始前注册的试验有2 641项(44.9%),试验期间注册的试验有2 487项(42.3%),试验结束后注册的试验有748项(12.7%)。相比之下,考虑到2020年启动的所有研究(不限于COVID-19), 59.3%在研究开始前注册,27.1%在研究期间注册,13.6%在研究完成后注册。比较表明,COVID-19研究更有可能在研究后期(在研究期间;COVID-19研究的比例为42.3%,而一般研究为27.1%)。

出版时间

发表研究结果,包括同行评议,可能是一个复杂而漫长的过程。先前的研究表明,这可能需要21个月[17].在像COVID-19这样的大流行疫情中,快速公布试验结果对于了解哪些干预措施是有效的至关重要。在COVID-19疫苗获得批准之前,在医院工作人员和床位严重短缺的情况下,临床医生迫切希望了解许多经过测试的干预措施的疗效。更短的发表时间是目标,在先前的研究中似乎很明显[8].使用我们的一组已注册的COVID-19研究,平均而言,非协议的文章在试验开始214天后发表。试验开始日期被用作锚定,因为CTG列出了许多试验预期的未来完成日期。

正式研究完成前出版

虽然主要的临床试验在正式的试验完成日期后发表研究结果文章,但对于高调的试验来说,相反的情况并不少见。在持续的大流行期间,及时公布结果非常重要。例如,关于Moderna COVID-19疫苗(NCT04470427)的广为人知的试验,其官方主要完成日期为2022年10月27日,研究结果文章于2020年12月发表(PMID: 33,378,609)。事实上,这种情况很常见。截至查询日期,与130项COVID-19试验相关的289篇试验结果文章尚未正式完成。

其他的考虑

终止原因

研究登记记录的更新对公众和研究人员来说是非常重要的。一个特别重要的更新是将学习状态更改为终止。也就是说,终止的原因可以为试验和研究干预提供非常有价值的见解[18].这种类型的更新不太可能作为一篇单独的文章发表在医学期刊上,而试验注册中心是传播这种更新的最合适平台。值得注意的是,并非所有注册中心都支持记录更新,有些可能只关注初始注册。为了补充我们的干预和发布优先级,我们还简要分析了CTG注册中心支持的终止原因元数据。大多数终止的试验(174项终止的COVID-19研究中有152项,87.4%)都指明了终止原因,有助于解释试验终止的原因。大多数情况下,COVID-19试验由于无法招募和招募参与者而终止。其他终止原因包括:干预的安全性问题、干预的无效或其他试验结果的可用性使得试验没有必要继续。

发表偏倚

虽然人工审阅结果发表摘要超出了范围,但我们理解可能存在的发表偏倚,可能导致一些试验没有正式在医学杂志上发表结果。例如,由于一些发起人明确终止了进一步疫苗开发计划的报告,缺乏某些试验和候选疫苗的结果文章暗示了疫苗试验中可能存在的发表偏倚。

其他手动试验跟踪器

除了用计算方法获取最相关的COVID-19期刊文章外,也可以依赖网站(和研究团队),这些网站提供人工审阅的已完成研究列表,并报告了结果。例如,《纽约时报》有一个疫苗和治疗追踪器[11].另一项研究追踪由国家卫生研究院发表[19].虽然手动管理复杂的COVID-19研究列表,或将我们的结果与手动COVID-19研究跟踪器进行全面审查和比较超出了范围,但我们确实将通过我们的方法确定的COVID-19研究的疫苗子集与《纽约时报》和美国国立卫生研究院COVID-19疫苗研究跟踪器确定的疫苗子集进行了比较。我们的动机是看看我们的方法有多包容。我们的计算机化方法研究识别方法确定了包括在《纽约时报》疫苗跟踪系统中的37个3期疫苗试验中的29个,包括了NIH研究跟踪系统中的6个试验中的5个。

推广到其他疾病:regtg出版物

由于我们方法的计算机化性质,该方法和开发的脚本可以应用于其他条件,以实现类似的干预措施概述和出版物排名列表。我们的项目叫regCTG [20.]查找给定条件下的研究列表(regCOVID的泛化)[4].第二个项目称为regCTGpublications(或简称regCTGpub),为给定条件下的试验生成结果文章的排序列表(regCOVIDpublications的概括)。regCTGpub项目存储库[21]包含基于web的结果报告(类似于表格1而且2),以治疗某些疾病(如老年性黄斑变性、阿尔茨海默病等)。

限制

我们的研究有几个局限性。首先,我们依赖于注册研究和结果文章之间的结构化链接。对2004年至2008年完成的试验的先前研究表明,这种联系的阴性预测值可能低至56% [22].换句话说,试验可能存在未链接的结果文章。然而,近年来,期刊要求在摘要中包括NCT试验标识符的要求现在可能得到更好的执行。其次,研究人员没有义务在医学杂志上发表研究成果。我们的研究使用索引医学期刊出版物,尽管赞助商可以通过新闻稿将研究结果公之于众。第三,我们的研究只使用了一个位于美国的临床试验注册中心:ClinicalTrials.gov,但另一方面,其他注册中心通常不允许在注册中心记录中链接结果发表,不支持基本的摘要结果沉积,并且只有有限或没有API访问选项。此外,CTG注册中心有大量非美国研究:截至2021年3月,60%的招募状态研究仅在非美国进行。第四,我们算法的一部分,可以针对不同的国家关闭或重新配置,重点是在至少一个美国网站上进行试验。我们选择这个是因为一些法律授权与这个因素相关。此外,在美国(由食品和药物管理局)的批准是全球监管环境中的一个重要因素(有一些例外)。 Fifth, interventions are entered into CTG as free text and proper linkage of identical interventions (expressed using similar intervention strings, such as ‘anti-sars-cov-2 convalescent plasma’ and ‘convalescent covid 19 plasma’) depends on a computational algorithm that can miss some linkage of identical interventions.

结论

我们开发了一种数据科学驱动的方法,用于快速识别和跟踪COVID-19临床研究的链接文章,并确定哪些研究正在发表,使用了哪种类型的试验文章链接,并设计了一个排名评分,以优先考虑对了解COVID-19临床研究最重要的出版物。在一组3167项活性或已结束的介入试验中,确定了1 022篇发表的研究结果文章,包括83篇来自美国晚期试验的关键文章的优先列表,其中有多项研究更新。我们分别分析了COVID-19疫苗的试验,发现了108篇链接的结果文章(包括辉瑞/BioNTech、Moderna和强生疫苗试验)。我们的方法使研究人员和卫生保健专业人员能够快速概述COVID-19临床研究的状态,并能够最有效地审查临床研究结果。我们研究的计算机化性质也允许一致的和必要的更新结果,并很容易推广到任何感兴趣的条件。

数据和材料的可用性

在当前研究期间生成和/或分析的数据集可在regCOVID和regCOVID出版物存储库中获得,r-snippets-bmi/regCOVID位于master lhncbc/r-snippets-bmi GitHub, r-snippets-bmi/regCOVID/regCOVIDpublications位于master lhncbc/r-snippets-bmi -bmi GitHub。

参考文献

  1. Ejaz K, Kauser T, Siddiqa A. COVID-19临床试验综合概述。中华医学杂志2020;(0):1。

  2. 王东,李智,刘颖。新型冠状病毒肺炎治疗方法的安全性、临床应用及抗病毒研究综述。中华传染病学杂志,2020;13(10):1405-14。

    文章谷歌学者

  3. Mohamed K, Yazdanpanah N, Saghazadeh A, Rezaei N.用于治疗COVID-19的计算药物发现和再利用:系统综述。生物有机化学。2021;39:104490。

    中科院文章谷歌学者

  4. Mayer CS, Huser V.对COVID-19临床试验、研究和登记的计算机化监测。政府注册。PeerJ。2020; 8: e10261。

    文章谷歌学者

  5. Mayer C, Huser V. regCOVID项目存储库。https://github.com/lhncbc/r-snippets-bmi/tree/master/regCOVID.2020年5月26日访问。

  6. 胡泽五世,西米诺JJ。将clinicaltrials.gov和PubMed连接起来,跟踪介入性人体临床试验的结果。PLoS ONE。2013;8(7):e68409

    中科院文章谷歌学者

  7. 鸡毛SE,卡利夫RM,迪恩NE,古德曼SN,奥格本EL。COVID-19临床试验:改善我们研究基础设施和相关性的教学时刻。中华医学杂志(英文版);

    文章谷歌学者

  8. Aviv-Reuven S, Rosenfeld a .由于COVID-19大流行而导致的出版模式变化:纵向和短期科学计量学分析。科学计量学。2021;126(8):6761 - 84。

    中科院文章谷歌学者

  9. 雷诺M,古蒂耶V,路易斯K, al - awadhi S, Dubourg Q, Truchot A,等。COVID-19大流行对出版动态和非COVID-19研究成果的影响。中国生物医学工程学报。2017;21(1):357。

    中科院文章谷歌学者

  10. Mathioudakis AG, Fally M, Hashad R, Kouta A, Hadi AS, Knight SB,等。在COVID-19管理的对照临床试验中评估的结果:一项方法学系统综述生活。2020;10(12):350。

    文章谷歌学者

  11. 《纽约时报》:Covid-19疫苗追踪器。https://www.nytimes.com/interactive/2020/science/coronavirus-vaccine-tracker.html.2021年2月9日访问。

  12. Mayer C, Huser V. regCOVID研究库(出版物)。https://github.com/lhncbc/r-snippets-bmi/tree/master/regCOVID/regCOVIDpublications.2021年2月24日访问。

  13. AACT团队。ClinicalTrials.gov (AACT)数据库2020年汇总分析。https://aact.ctti-clinicaltrials.org/learn_more.2020年3月20日访问。

  14. Bashir R, Bourgeois FT, Dunn AG。系统回顾用于将临床试验注册与其发表结果联系起来的过程。系统科学进展。2017;6(1):123。

    文章谷歌学者

  15. Harriman SL, Patel J.临床试验何时注册?前瞻性和回顾性注册分析。试验。2016;17(1):187。

    文章谷歌学者

  16. Tan AC, Jiang I, Askie L, Hunter K, Simes RJ, Seidler AL.试验注册的患病率因研究特征和偏倚风险而异。临床流行病学杂志2019;113:64-74。

    文章谷歌学者

  17. Ross JS, Mocanu M, Lampropulos JF, Tse T, Zarin DA, Krumholz HM。已完成临床试验的发表时间。中国医学杂志,2013;29(3):344 - 344。

    文章谷歌学者

  18. Williams RJ, Tse T, DiPiazza K, Zarin DA。在clinicaltrials.gov结果数据库中终止试验:评估主要结果数据的可用性和终止原因。PLOS ONE。2015;10(5):e0127242

    文章谷歌学者

  19. 使用ACTIV-Informed协调协议的SARS-CoV-2疫苗临床试验|美国国立卫生研究院(NIH)https://www.nih.gov/research-training/medical-research-initiatives/activ/sars-cov-2-vaccine-clinical-trials-using-activ-informed-harmonized-protocols.2021年2月9日访问。

  20. Mayer C, Huser V. regCTG项目存储库。https://github.com/lhncbc/CRI/tree/master/regCTG.访问2020年6月10日。

  21. Mayer C. Huser V. CRI/ regtg出版物在master·lhncbc/CRI[互联网]。https://github.com/lhncbc/CRI/tree/master/regCTGpublications.2021年9月1日访问。

  22. 胡泽五世,西米诺JJ。ClinicalTrials.gov与PubMed之间链接的精密度和负预测值。美国医学会年度分会。2012;2012:400 - 8。

下载参考

确认

这项研究是由国立卫生研究院国家医学图书馆(NLM)的工作人员进行的,并得到了NLM的支持。本文中的发现和结论仅代表作者的观点,并不代表NLM、NIH或卫生与公众服务部的官方立场。

资金

由美国国立卫生研究院(NIH)提供的开放获取资金。这项研究是由美国国立卫生研究院国家医学图书馆利斯特希尔国家生物医学传播中心的校内研究项目发起的。

作者信息

作者及隶属关系

作者

贡献

C.M.和V.H.撰写了文章的主要内容,并编辑了文章的草稿。C.M.和V/H。参与项目和方法的概念化。C.M.对数据进行了分析和质量检查。vh解释了结果并得出了结论。作者阅读并批准最终的手稿。

相应的作者

对应到克雷格·s·梅尔

道德声明

伦理批准并同意参与

不适用。

发表同意书

不适用。

相互竞争的利益

作者宣称他们之间没有利益冲突。

额外的信息

出版商的注意

188博金宝app网施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。

权利和权限

开放获取本文遵循知识共享署名4.0国际许可协议,允许以任何媒介或格式使用、分享、改编、分发和复制,只要您对原作者和来源给予适当的署名,提供知识共享许可协议的链接,并注明是否有更改。本文中的图像或其他第三方材料包含在文章的创作共用许可协议中,除非在材料的信用额度中另有说明。如果材料未包含在文章的创作共用许可协议中,并且您的预期使用不被法定法规所允许或超出了允许的使用范围,您将需要直接获得版权所有者的许可。如欲查看本牌照的副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献弃权书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条所提供的资料,除非在资料的信用额度中另有说明。

转载及权限

关于本文

通过CrossMark验证货币和真实性

引用本文

Mayer, c.s., Huser, V. regCOVID:跟踪已注册的COVID-19研究的出版物。BMC医学Res Methodol22, 221(2022)。https://doi.org/10.1186/s12874-022-01703-9

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/s12874-022-01703-9

关键字

  • 新型冠状病毒肺炎
  • 数据科学
  • 临床试验
  • 结果出版物
  • 信息学