每日“上新“40万条以上 记者实地探访加工数据的神秘“工厂”
2019年7月采集的重庆的遥感影像数据分布范围。市规划自然资源局供图 华龙网发
华龙网-新重庆客户端10月12日13时讯(记者 王玮)在信息爆炸的大数据时代,“数据多跑路”成了大家的口头禅,而重庆市规划和自然资源局不仅践行着让数据替群众跑腿,更为这些数据建成了一个“加工厂”。近日,记者实地探访了由该局打造重庆市时空大数据展示中心,一探“时空大数据加工厂”是如何实现每日上新40万条以上、如何进行数据加工的。
重庆市时空大数据展示中心以“数聚千里,智惠广大”为主题,分为“时空序厅”、“数聚千里”、“智惠广大”、“未来城市”四个区域,是重庆市规划自然资源局利用云计算、大数据和空间地理信息技术,建成集空间数据采集、治理、应用于一体的“时空大数据加工厂”,实现了对时空数据采集自动化、治理流程化、应用智能化的成果展示。
数据有哪些?
据重庆市地理信息和遥感应用中心信息所所长梁星介绍,时空大数据加工厂的生产线流程包含数据采集——数据治理——数据产品——数据应用四个阶段。
“加工厂”首先要采集原材料。在这里,要采集广泛多源的各类大数据作为时空大数据“加工厂”的原材料,主要包括了地理空间数据、政务共享数据、网络公开数据、物联网数据等,“整个采集体系自去年开始运行以来总采集量接近40亿条,平均每日更新数据量达到40万以上,形成了我们海量的原始数据资源池。”梁星介绍称。
地理空间数据主要覆盖了重庆市基础地理、自然资源、遥感影像、房屋建筑、道路、水系等地理相关数据。“我们将这里称为‘时空大数据工厂’,最重要的是将这些信息附以时空的概念。”梁星介绍,时空大数据的发展,是经历了地上测、天上看到三维建模,再到集成城市运行信息模拟数字城市的过程。
政务共享数据,得益于重庆打通了各个部门间的信息“孤岛”,截至目前已实现60多个市级部门数据的自动化共享,打破了各部门间的信息壁垒,实现政务资源互联互通。此外,网络公开数据主要通过互联网信息获取技术,实时采集网络公开数据,丰富时空数据来源。而物联网数据则来自于各种传感设备采集的数据,如出租车、公交车的GPS信息、空气质量检测数据等。
时空大数据工厂。市规划自然资源局供图 华龙网发
数据怎么用?
由于“原材料”采集来源不一,在数据质量上就会出现参差不齐的情况,因此首要的就是对数据原材料进行治理。
“对数据的治理,就如同打造一颗颗钻石的过程,首先我们要按一定标准进行筛选,选出符合要求的、可用的原石(原始数据),然后我们会利用各种工具去清理掉原石中含有的各种杂质(有问题、有错误的数据),最后再通过精心打磨加工(时空融合)形成完美的钻石(高质量时空大数据资源)。”
经过数据治理后形成的时空融合数据,在这个工厂内会根据不同应用领域,进一步加工形成了自然资源、交通出行等31个数据产品,为数据应用提供服务。
数据有何用?
时空大数据原材料如此丰富、“加工”过程如此精细化,产出的产品会用在哪儿、如何用呢?梁星指着屏幕上实时跳动的数字,他说,这一个又一个的数字是老百姓生活更美好、政府办事效率更高的缩影,时空大数据每天都在发挥着实实在在的作用。
例如地质灾害防治工作中,通过时空大数据的实时展示,相关部门可以掌握到地质风险点的动态情况,具体地理位置、周围环境、人口、建筑形态等这些信息都可以一目了然,也可以让地质灾害防治更精准、更高效。
哪里的矿山已经关停、关停的矿山是否开展修复、修复的矿山情况怎么样……在人民对美好生活的向往越来越突出的时候,生态环境保护的一系列问题也摆在至关重要的地位,在这个时空大数据展示中心,这些情况可以在一张图上直观地看到。
梁星介绍:“目前,时空大数据工厂所形成的数据产品支撑了全市80多个单位、200多个应用,比如渝快办、生态修复、精准扶贫大数据平台、两江新区市场综合监管平台等应用。数据平均每天调用接近700万条。”