机器学习标志着危险的沙门氏菌菌株
一种新的机器学习工具,可以检测新出现的细菌沙门氏菌是否更容易引起危险的血流感染,而不是食物中毒。该工具由Wellcome Sanger研究所的科学家和她在新西兰奥塔哥大学的合作者以及德国Helmholtz感染研究中心的Helmholtz基于RNA的感染研究所创建,大大加快了鉴定公共卫生关注的新型侵入性沙门氏菌的遗传变化的过程。
今天(5月8日)在PLOS Genetics上报道,机器学习工具可用于在危险细菌引发疾病爆发之前将其标记为从医院病房到全球范围。
随着基因组测序成本的下降,世界各地的科学家们正在利用遗传学来更好地了解导致感染的细菌,疾病如何传播,细菌如何获得对药物的抵抗力,以及哪些细菌菌株可能导致爆发。
然而,目前用于鉴定爆发后新出现的细菌菌株的遗传适应性的方法是耗时的并且通常涉及手动将新菌株与较旧的参考集合进行比较。
被称为沙门氏菌的细菌群包括许多不同的类型,它们引起的疾病严重程度各不相同。有些类型导致食物中毒,称为胃肠道沙门氏菌,而其他类型则通过扩散到肠道以外引起严重疾病,例如引起伤寒的伤寒沙门氏菌。
为了解遗传变化,确定新出现的肠道沙门氏菌菌株是否会导致食物中毒而不是更严重的感染,研究人员建立了一个机器学习模型,分析哪些突变起着重要作用。
该团队使用进化上截然不同的老沙门氏菌谱系训练该模型,其中包括6种引起侵袭性感染的沙门氏菌,以及7种细菌的胃肠道菌株。机器学习模型确定了近200个参与确定细菌是否会引起食物中毒或更好地适应侵入性感染的基因。
“我们设计了一种新的机器学习模型,可以识别哪些新出现的细菌菌株可能成为公共健康问题。使用此工具,我们可以处理大量数据集并在几秒钟内获得结果。最终,这项工作将对我们以前无法实现的危险细菌监测产生重大影响,不仅在医院病房,而且在全球范围内,“Nicole Wheeler博士说,他是联合主要作者。惠康桑格研究所
当应用于撒哈拉以南非洲目前正在出现的沙门氏菌菌株时,该工具正确地强调了两种类型的常见循环感染(肠炎沙门氏菌和鼠伤寒沙门氏菌),它们更危险并且与更多的血流感染病例相关。
这些感染在免疫系统较弱的人群中尤为严重,例如艾滋病病毒感染者。机器学习工具揭示了遗传变化,使沙门氏菌菌株能够适应宿主并变得更具侵入性。
来自德国亥姆霍兹基于RNA的感染研究所的联合主要作者Lars Barquist博士说:“与其他方法相比,机器学习工具是一项进步,因为它不仅可以搜索基因和突变,还可以寻找功能影响突变有这些错误。它可以告诉我们哪些突变使病原体更好地扩散到肠道以外并导致危及生命的疾病而不是食物中毒。这将有助于在未来设计更有效的治疗方法。“
机器学习工具不仅限于沙门氏菌,还可用于研究其他因素,如任何细菌中出现的抗生素耐药性。它可以实时用于识别危险的细菌菌株,然后再传播以引发爆发。