运用人工智能挖掘信息战“疫”价值

新型冠状病毒肺炎疫情暴发以来,各大媒体网站、社交平台上关于疫情的话题热度持续高涨,频上热搜,几乎人人都在时刻关注着疫情的最新走向。

在这种环境下,有效信息的高效传播成为一项重要诉求。“这次疫情不同于2003年非典等重大公共卫生突发事件,互联网成为这次疫情主要的‘信息源’,传播模式更是基于人手一机的‘自媒体’,信息流的爆发不仅降低了大众获取信息的信噪比,更滋生了不同程度的谣言。”瑞莱智慧(RealAI)首席执行官田天说,信息传播速度之快、话题数量之大、更新变化之迅速,都对疫情信息的有效传达提出了更高要求。

瑞莱智慧是一家由清华大学人工智能研究院孵化的高新技术企业。近日,瑞莱智慧联合清华大学人工智能研究院共同研发,推出了“新冠肺炎疫情AI话题分析平台”,帮助用户随时了解疫情的最新变化,同时也帮助相关政府部门了解疫情舆情的实时动态。

田天介绍说,该平台能够对多渠道海量媒体信息进行自动抓取采集、识别分析,解决了传统信息检索过程中因消息源头繁杂、消息过多、检索意图不明确而产生的困扰。

同时,基于大数据分析和AI建模,该平台能够自动识别出近期的热点话题,进行新闻追踪和话题导向分析,分析地区关注度变化,为用户第一时间推送话题的全网最新动态,满足用户对疫情舆情监测的需求,为作出正确舆论引导提供分析依据。

田天认为,人类的每一次重大灾难都伴随着“信息爆炸”,在当前的疫情下,不仅信息本身值得关注,了解用户获取信息的习惯、缩短信息获取途径也是重要的工作。在这场疫情阻击战中,针对疫情期间的热点事件、话题,RealAI融合多种模型算法挖掘和实时跟踪全网数据,力求为公众在众多碎片化的内容中构建一套完整的信息入口。

在底层算法支持上,该平台基于清华大学人工智能研究院、清华大学计算机科学与技术系推出的WarpLDA主题提取算法研发。这种算法在访存效率、并行度方面相比传统算法更有优势,可用于上亿级别文本的主题提取。该成果最早首发于数据库领域顶级学术会议国际超大型数据库会议上。

截至目前,该平台已正式上线“全国热门速递”内容板块,包括“全国热门话题”“热点地区排行”“实时热点话题排行”“最近三天热点排行”“官方发布消息”“关于热点话题的热点信息”等具体模块,提供全面及时、内容丰富、权威快捷的资讯服务。

例如,“全国热门速递”内容板块是基于国家及各省市卫生健康委员会与多家权威官方媒体平台上公开发布的新闻,结合公众资讯兴趣,实时更新全网最近一天与最近三天的TOP10疫情话题热榜,从而多维度动态展示公众关注的热门话题与舆论趋势。

“在这场没有硝烟的战争中,我们每个人、每个组织都无法独善其身。”田天说,“我们希望以自身算法、优势技术为依托,从内容侧打造防疫战线,发挥信息战‘疫’价值,为抗击疫情贡献力所能及的力量。”