据物理学家组织网28日报道,加拿大计算机科学家和生物学家在当日出版的《科学公共图书馆·综合》(PLOS ONE)杂志撰文指出,他们借助机器学习方法,在短短几分钟内对29个不同新冠病毒DNA序列进行分类,鉴定出一个潜在的“基因签名”。
他们表示,机器学习这种新的数据发现工具将使科学家能在短短几分钟内快速轻松地对致命病毒(如新冠病毒)分类,而加快这一过程对于大流行期间医疗资源的战略规划至关重要。此外,最新研究还支持一个科学假设——新冠病毒起源于蝙蝠,属于β冠状病毒属的Sarbecovirus亚型。
韦仕敦大学生物学教授凯瑟琳·希尔与该校计算机科学、统计与精算科学领域的同事,以及滑铁卢大学计算机科学系的研究人员共同开展了这项研究。
他们指出,这个“超快速、可扩展且高度准确”的分类系统使用新的基于图形的专用软件和决策树方法来解释分类,并从所有可能结果中找出最佳选择。这一机器学习方法可对新冠病毒序列进行100%准确分类,更重要的是,可在数分钟内再次发现5000多个病毒基因组之间最密切的关系。
希尔说:“我们需要的是新冠病毒DNA序列能发现自身的内在序列模式,我们使用该签名模式和一种逻辑方法,使该模式与其他病毒尽可能接近,并在数分钟而非数天、数小时内对新冠病毒进行了非常准确的分类。”
研究人员指出,该工具能对任何新发现的新冠病毒或其他病毒序列进行分类,将成为全球大流行期间疫苗和药物开发人员、一线医疗工作者、研究人员和科学家使用的工具包的重要组成部分。