当一个患者确诊为细菌感染,医生会在实验室中对细菌进行药敏检测,并根据检测结果开具合适的抗生素。但细菌感染的复发率很高,大约25%罹患尿路感染的女性在6个月内被另一种细菌感染。众多研究发现,大多数复发感染的病原菌与初次感染的病原菌不同。医生按照细菌药敏检测的结果开具有效的抗生素尽管能够降低总体的复发率,但同样也提升了处于潜伏状态的耐药性菌株感染的可能性。因此,这样的治疗行为是一把双刃剑。2022年2月24日,以色列理工学院马修 · 斯特拉西(Mathew Stracy)等人在《科学》杂志发表的研究指出,运用数据驱动的方法,通过机器学习模型,结合人群统计数据和患者的个人病史,提出抗生素使用建议,能够将这种风险最小化。
这项研究的关键在于一个纵向数据的大数据库。该数据库包含以色列马卡比健康服务在2007年到2019年间收集的各个年龄段男性和女性患者尿路感染、伤口感染、抗生素敏感性和抗生素处方等信息。对于大部分病例,抗生素能够有效治疗初次感染,但有10%的尿路感染和6%的伤口感染患者会在初次感染后的28天内发生早期复发。其中部分病例是因为医生错误地开具了细菌耐药的抗生素。这种情况通常见于医生在等待细菌药敏检测结果的过程中需要对患者采取快速临床干预。但是,存在相当一部分病例在正确使用了符合药敏检测结果的抗生素后,仍然因为感染了对该抗生素耐药的细菌而再次就医。
那么这些耐药菌株是如何出现的?斯特拉西等人对这些细菌进行了基因测序,将初次感染的病原菌菌株与复发感染的病原菌菌株进行了比较,从而为我们提供一些更加细致的观点。这项研究指出了一条先前被低估的再感染途径:虽然导致初次感染的菌株经治疗被消灭了,但是其他对该抗生素耐药的菌株却最终出现了。近期的一些研究有力证实了患者体内的微生物群在感染过程中起到了微生物储存库的作用。举例来说,肠道中储存了能够导致尿路感染的细菌。此项研究分析还纳入了这些研究:突显将基因组测序数据与临床数据相结合的效果和潜力。
基于包含大量感染和治疗病史信息的大数据集,斯特拉西等人开发了一个能够为患者提供个体化药物推荐的机器学习算法。这一策略十分成功,因为患者感染复发的风险与他们的感染病史和治疗方法息息相关。多因素logistic回归分析(一种广义线性回归分析)是一种强大的、经过实践检验的工具,用于预测医疗行为结果。斯特拉西团队用它来评估临床上使用各个候选抗生素后发生早期复发的风险。该算法可以识别出最不可能导致感染后早期复发的抗生素以及已经产生耐药性的抗生素。值得注意的是,该模型仅需尿路感染患者的13个指标来为他们推荐抗生素,而对于伤口感染患者则只需8个指标。这些指标包括年龄、性别、妊娠状态、导尿管使用和感染史等因素。
这些用于推荐抗生素的算法根据早期感染复发的数据模型进行演算。相比医生参考药敏试验结果开具的处方,这些算法能够将耐药菌导致尿路感染和伤口感染的早期复发概率降低一半。机器学习最大的优点在于其通过系统回顾患者的全部信息,并利用经过数千个病例训练产生的数据模型识别出病例中不显著的特征,据此推算出有价值的见解和建议,从而为医生决策提供支持。即使当前有规定要求医生以规定的比例开具不同的抗生素,使用算法也能够在遵从这些规定的基础上显著提升医疗水平。这是十分重要的,因为诸如副作用和给药方式等其他因素也会影响抗生素的选择。算法能够追溯每位患者包括年龄或耐药菌感染史在内的风险因素,并对每种抗生素所包含的风险因素进行评估和量化。因此,基于算法的决策是可以解读的。这是在医疗系统内建立对机器学习推荐系统的信任的关键一步。
一个机器学习模型中储存着上千例尿路感染和伤口感染患者的信息。机器学习模型能够基于此识别与复发感染病原菌耐药性有关的因素。机器学习模型能够将患者的传染病病史及抗生素治疗史与人群数据相结合,预测出防止出现复发感染的最佳的抗生素
但是这些算法目前尚不能投入临床使用,因为它们降低感染早期复发概率的能力仅在数据库测试中得到了验证,而没有在临床患者身上得到验证。该算法对与初次感染相距超过28天的耐药菌感染的预防能力也需要进一步的评估。我们也不清楚用于训练机器学习模型所需的数据量的具体大小,以及诸如数据点缺失或文书错误在内的训练完成之后该系统可能出现的问题的严重性。
总体来说,正如世界卫生组织所强调的,将数据驱动的方法运用于临床还需解决众多社会、法律和伦理的问题。算法会巩固次优甚至是歧视性医疗行为。斯特拉西等人所制作的推荐模型并不能直接匹配临床决策的需求。其存在的问题之一就是该模型中磷霉素在10~19岁女性中使用效果的数据不足,相关的条件下,模型推荐的药物并不可靠。我们也不清楚模型会如何适应诸如新抗生素出现等情况在内的医疗实践的改变。尽管如此,包括斯特拉西等人开发的算法在内的基于机器学习的药物推荐系统有大幅改善患者预后的潜力,并能在减少抗生素耐药性方面扮演重要角色。
目前将数据驱动方法运用医疗已成潮流。这不仅为解决大量公共健康问题提供了机会,也为我们利用该方法建立新的数据收集标准、评估指标和培训方法创造了条件。这些方法成功的关键在于,获得纵向数据的数据库和跨学科研究成果——基于基因组序列分析的研究,为耐药性产生的机制提供了真知灼见。
资料来源 Science