全国测绘法宣传日|茫茫网海,锁定“问题地图”

核心阅读

地图无小事。地图是国家版图的主要表现形式,具有严肃的政治性、严密的科学性、严格的法定性,正确的国家版图不容有误。

随着互联网、移动通信设备和自媒体的兴起,网络地图大量涌现并被广泛使用,相较于纸质地图,其传播速度更快、影响面更广、监管难度更大。

“失之毫厘,谬以千里”。对互联网地图而言,虽然其表现形态发生了变化,但同样“寸土必争”,一点一线都不能错。然而,从互联网海量数据中“揪”出“问题地图”,并持续跟踪监控并非易事。

近年来,自然资源部组织“问题地图”监控单位和科研单位加强技术顶层设计,开展技术攻关,研发互联网地图监管系统,运用新技术提升互联网“问题地图”快速精准发现和锁定能力,实现了对互联网“问题地图”的持续监控。

从“大海捞针”到“有的放矢”

互联网“问题地图”监控单位自然资源部地图技术审查中心副主任李媛媛介绍,我国的互联网地图监控自2005年以来历经起步探索、地图图片监控、兴趣点监控、全面监控4个阶段,工作过程中积累的经验,对互联网地图监控信息化建设起到了十分重要的作用。

随着监控种类的不断丰富,“互联网‘问题地图’的发现也存在若干难点。”中国测绘科学研究院研究员王勇告诉记者,一是互联网地图来源多,数量大;二是随时发布和更新,传统手段难以持续主动发现和掌握;三是互联网地图的形态、模式、风格、主题多样,很多情况下无法直接与标准地图比对,难以采用类似“人脸识别”等方法去解决,导致“问题地图”发现难。

因此,向技术要效率、向算法要出路成为必然选择。

2012年以来,自然资源部地图技术审查中心与中国测绘科学研究院共同研发了互联网地图监管系统,陆续建成国家级互联网地图监管主节点和31个省级分节点,采用大数据搜索、地图AI识别、语义分析等关键技术,实现了对各类网站中登载地图的日常监控、快速判定和及时处理,为自然资源部开展常态化“问题地图”治理提供了保障和技术支撑。

“经查,此次共发现41家网站登载了166幅存在‘错将我国藏南、阿克赛钦绘入印度,漏绘台湾岛、钓鱼岛、赤尾屿、南海诸岛等重要岛屿,漏绘南海断续线和中日海上岛屿归属范围线,海南岛底色表示错误’等问题的‘问题地图’。”这是一份对有关企业互联网网站登载地图情况排查的报告,其中所列数据,正是来自监控专业技术人员对互联网地图监管系统推送的信息准确判定。

据统计,2021年自然资源部地图技术审查中心依托监管系统,重点对273个中央国家机关政府网站、重要新闻媒体网站、大型商业门户网站、重要大型国企央企网站等进行日常监控,分析的网页和图片分别达1.7亿个和1.1亿张,推送地图29.22万条,发现大量“问题地图”,涉及近百家网站。

随着版本不断更新,互联网地图监管系统如今建成了包含产品名录库、运营主体库在内的监管数据库,支持处置整改全流程贯通。监管者可通过系统中的工商注册信息,确定出现互联网“问题地图”的运营主体。

据专业技术人员介绍,使用该系统之前,互联网地图监控主要依靠自行研发的搜索工具和人工搜索,监控效率不高。建立互联网地图监控系统的初衷,就是通过信息化手段和先进技术搜索、抓取网页中的地图,从“大海捞针”变成“有的放矢”,降低人工工作量,提高工作效率。

从“认出地图”到“读懂地图”

从无到有,互联网地图监管系统历经了6个版本的更新换代。

从2010年的单机版到2012年的网络版,监测网站数量从3家增加到50家;2014版重点优化提升了搜索性能,并新增了在线检定、截图取证等功能;2016版继续扩展网站监管数量,新增了POI(兴趣点)内容安全检查功能、工作报告生成等业务功能,并重新设计和改造了底层架构,支持各省(区、市)节点独立安全部署并同步监测信息。

2018年,系统重点升级了底层架构,全国总监控网站数量不低于3000家。同时,自主开发了搜索功能,支持可控深度搜索;新增微博关键词搜索、敏感POI处置、多维可视分析等功能。随着监控数量的增加,原有的Windows框架已不能满足海量网站监管的大数据存储和高性能处理需求。为此,2021年以来,科研团队重新设计了平台底层,形成了基于云计算服务能力,监管对象重点扩展到微信公众号、微博账号等新媒体,全国主节点和各省(区、市)分节点监测总网站数量超过1万家,在智能化处理分析算法方面形成了基于深度学习的智能化地图识别能力。

在王勇看来,技术团队多年的艰辛探索主要是围绕解决两个问题——“认出地图”和“读懂地图”。

互联网地图监管系统建立之初,技术团队要解决的首要问题是让系统“认出地图”,即从互联网的海量图片中辨认出地图。具体来说,就是要通过技术平台,用软件自动扫描所监控的网站,从上亿个网页的大量图片中,提取出地图和地理标注,并自动推送给监管人员进行处理。2018年以前,系统采用的是像素统计等传统技术,抓取的图片中只有10%是地图,准确率较低。

“现有的人工智能就像一个孩子,要让他明白什么是地图,其中包括各种各样‘正确’的地图和‘错误’的地图。”王勇介绍,要提高地图识别的准确率,必须先建立样本库。为此,技术团队建立了200个分类体系,包括人像、风景、动物、楼宇等,选取1万多张典型图片并进行分析处理,逐步实现标准和模型优化。“目前,地图分类准确率提升至90%,每天推送的信息基本都是地图。”王勇说。

解决了“认出地图”的问题之后,随之而来的目标是让系统“读懂地图”。

地图里有什么?包含什么信息?如何让机器和软件能够辅助发现问题、智能识别“问题地图”?

“这需要优化与地图内容理解相关的智能分析模型和技术,例如样本优化和典型目标小样本训练方法。基于自然资源部地图技术审查中心提供的大量‘问题地图’样本和判定出的问题,系统对台湾、藏南、阿克赛钦等重点目标初步形成自动发现能力,目前系统识别准确率为60%~70%,今年预计还将提高10%,进一步减少检定人员的工作量。”王勇说。

由于互联网地图复杂多变,短期内很难实现图形自动比对,从信息化到智能化,用机器替代人工,仍有较长一段路要走。

在广东省自然资源厅地理信息管理处副处长魏巍看来,“按图索骥”是最终目标。他认为,利用计算机实现互联网地图自动比对是未来的发展方向,现阶段必须不断完善知识库,提高AI学习能力,不断降低人工干预度。

下一步,自然资源部也将聚焦重点问题开展技术攻关和研发,围绕人工智能地图判别审查等,深化技术储备、突破技术瓶颈。

从多级联动到个性化定制

依托互联网地图监管系统,北京、黑龙江、江苏、广东、福建、广西、安徽、湖北、湖南、山东等13个省(区、市)建立了省级独立节点,实现了“国家—省市—地县”多级联动与业务协同。

“2021年,北京充分利用互联网地理信息监管系统,共识别地图图片365.8万幅,推送并检定8818幅,发现‘问题地图’688幅,涉及9家网站。”北京市规划和自然资源委员会地名与地理信息管理处副处长陈泉介绍,北京市针对互联网“问题地图”多发频发的情况,加大监督力度,完善相关配套政策、制定裁量标准,强化执法流程,推动互联网地图监管提质增效。

具体来说,一是利用技术手段不断强化监管,发挥信息化平台作用,健全互联网地图常态化监管机制。建立月报机制,每月报送互联网地理信息监管系统检查情况,及时掌握互联网地图情况。二是持续强化多部门协同机制,依法处理互联网“问题地图”线索。将北京市12家重点商业网站作为重点检查对象,纳入互联网地理信息监管系统监控目录。三是畅通“问题地图”线索移交查办机制,加强执法体系衔接。目前,北京已建立“处室受理—技术鉴定—移交执法部门”的监督执法流程。

2020年10月起,北京市规划和自然资源委员会将地理信息执法权限下放至各分局,明确测绘和地理信息领域行政处罚市区两级权限分工,市级负责自然资源部交办、督办案件,各分局负责单位注册地或违法行为表现地在辖区内的案件,完善地理信息领域执法体系建设。此外,为进一步规范地图类行政处罚裁量权的行使,北京市规划和自然资源委员会还研究制定了《北京市地图类违法案件行政处罚裁量标准》,并纳入规划和自然资源行政处罚裁量基准体系。

为更好地满足省内需求,在互联网地图监管国家主节点的基础上,广东省尝试了“个性化定制”。魏巍介绍,由广东省自然资源厅地理信息管理处和测绘产品质量监督检验中心组织实施的省自然资源厅测绘产品质量监督检验管理系统项目,作为广东自主研发、自主运行的监管系统,通过技术迭代升级,极大提高了现有核心职责信息化支撑能力,目前互联网地图自动识别准确率达到95%以上。该系统包含广东省互联网地理信息监管子系统、广东省地图审查技术辅助子系统两个子系统,开发了网络地图搜索、地图图片识别、地图技术辅助审查等相关功能模块,实现了多节点协同的地图信息可控聚焦搜索、基于主动学习和卷积神经网络的地图图片自动识别和知识库驱动的向导式地图技术审查方法等技术创新。

此外,广东省还向下构建“省—地—市”协同的一体化互联网地图服务监管,增强地图技术审查技术支撑能力,依靠该系统支撑“放管服”改革过程中的业务审批调整,提高接入互联数字化政府其他模块的业务协调效率,有力提升广东地理信息化处理能力。近日,广东省自然资源厅联合广东省委网信办等八部门出台意见严防“问题地图”,积极构建政府统一领导、各部门协同管理的工作机制。

黑龙江测绘地理信息局相关负责人表示,黑龙江将互联网地图审核纳入省级预算,配备了专门的管理人员和审核人员负责相关工作,并购置专门的服务器确保系统运行。自2020年黑龙江省互联网地图监管省级节点上线以来,黑龙江测绘地理信息局对黑龙江各级政府、主要媒体和门户网站等755家网站进行动态监管,截至2022年7月,共抓取图片近3万张,人工审核17867张,发现“问题地图”300余张,对20余家单位提出整改意见、对6家单位下达整改通知书,及时对全部“问题地图”下架整改。

李媛媛介绍,从今年上半年互联网地图监控的总体情况来看,目标网站登载“问题地图”数量较前几年有所下降,成绩来之不易。下一步,自然资源部地图技术审查中心将继续开展相关工作:一是加强对重点网站监控,进一步提高效率和准确度;二是进一步加快公益性标准地图的编制与发布,从源头上杜绝“问题地图”的产生;三是进一步加强国家版图意识宣传教育,强化地图服务保障能力。

随着技术升级和应用深化,新一轮互联网地图监管技术攻关仍将继续。

原标题:全国测绘法宣传日|茫茫网海,锁定“问题地图”