利用機(jī)器學(xué)習(xí)在基因組層面預(yù)測(cè)食源性沙門氏菌的耐藥性
發(fā)布時(shí)間:2024-09-14 瀏覽次數(shù):188
AMR是一種全球性的健康危機(jī),給食品生產(chǎn)和安全、醫(yī)療保健、公共衛(wèi)生和國(guó)家經(jīng)濟(jì)都帶來了多方面的挑戰(zhàn)。盡管AMR本質(zhì)上是一種自然進(jìn)化的過程,但是抗生素的使用是耐藥菌的出現(xiàn)和傳播的一大驅(qū)動(dòng)力。另外,農(nóng)業(yè)環(huán)境中抗生素的濫用或者誤用是造成沙門氏菌耐藥的主要驅(qū)動(dòng)力。隨著測(cè)序技術(shù)的進(jìn)步,全基因組測(cè)序(WGS)已成為常規(guī)流行病學(xué)監(jiān)測(cè)的一部分。在數(shù)據(jù)分析方面,機(jī)器學(xué)習(xí)已成為分析測(cè)序平臺(tái)產(chǎn)生的大型數(shù)據(jù)集的首選方法。然而,當(dāng)前卻鮮有研究將基于機(jī)器學(xué)習(xí)的數(shù)據(jù)分析技術(shù)應(yīng)用在食源性致病菌的耐藥性預(yù)測(cè)上?;诖?,Edmund O. Benefo等人開發(fā)一種基于基因組的機(jī)器學(xué)習(xí)模型,用于預(yù)測(cè)來自雞肉的沙門氏菌的AMR,重點(diǎn)關(guān)注了八種抗菌劑,包括阿莫西林-克拉維酸、氨芐西林、頭孢菌素、頭孢曲松、磺胺異惡唑、鏈霉素、四環(huán)素和頭孢西丁。
研究共收集了雞源沙門氏菌405株,取205株菌的表型和基因組信息用于機(jī)器學(xué)習(xí)模型的搭建,剩下200株作為機(jī)器模型的性能表征。研究訓(xùn)練了四種機(jī)器學(xué)習(xí)算法:集成分類器、隨機(jī)森林、支持向量機(jī)和極端梯度提升去分析菌株中的基因存在或缺失,并將其與表型關(guān)聯(lián)。在模型構(gòu)建過程中,將菌株進(jìn)一步按照7:3規(guī)劃訓(xùn)練集和驗(yàn)證集,利用靈敏度、特異性、數(shù)據(jù)平衡準(zhǔn)確性及科恩的κ統(tǒng)計(jì)值,針對(duì)每一抗生素篩選出表現(xiàn)性能最好的模型(表1)。然后,作者分別利用這些構(gòu)建好的模型對(duì)剩余200株菌株的表型進(jìn)行預(yù)測(cè),并將其結(jié)果與ResFinder數(shù)據(jù)庫中的預(yù)測(cè)結(jié)果進(jìn)行比較。結(jié)果顯示,模型預(yù)測(cè)的耐藥性流行率從1%(頭孢曲松)到65.5%(鏈霉素)不等。與ResFinder的預(yù)測(cè)相比,本研究的預(yù)測(cè)準(zhǔn)確度超過95%,見圖1和表2。另外,作者還分別列舉出了針對(duì)每種抗生素進(jìn)行預(yù)測(cè)AMR的耐藥決定因子,盡管有些決定因子現(xiàn)今還未得到驗(yàn)證。
總的來說,文章證明了機(jī)器學(xué)習(xí)在預(yù)測(cè)食源性病原菌AMR的潛力,突出了機(jī)器學(xué)習(xí)方法在理解AMR機(jī)制和預(yù)測(cè)耐藥模式方面的適用性和可靠性。然而,文章也有幾點(diǎn)問題值得指出:(1)文章最后更多地關(guān)注于和ResFinder的比較,而實(shí)際上應(yīng)該給出此預(yù)測(cè)方法與標(biāo)準(zhǔn)方法的比較結(jié)果;(2)研究列舉了機(jī)器算法給出的權(quán)重位于前10的耐藥決定因子,但是有些因子是否真的和耐藥表型相關(guān),在研究中并未得到證明。因而,未來在基于機(jī)器學(xué)習(xí)算法的耐藥性預(yù)測(cè)方面,開展一些基因表達(dá)或者敲除實(shí)驗(yàn)去驗(yàn)證這些新的耐藥決定因子是非常必要的。
表1 針對(duì)8種抗生素的機(jī)器學(xué)習(xí)最佳模型及其預(yù)測(cè)性能展示
表2 基于本研究機(jī)器學(xué)習(xí)模型和基于ResFinder數(shù)據(jù)庫的預(yù)測(cè)性能比較
圖1 所建立的機(jī)器學(xué)習(xí)模型給出的200株沙門氏菌中AMR流行率統(tǒng)計(jì)結(jié)果
原文鏈接:https://doi.org/10.1016/j.lwt.2024.116122
來源:微生物安全與健康網(wǎng),作者~鄒晶晶。