logo

科普 | 想了解地址解析聚合服务?看这一篇就够了

作者:技术蓝猫2022.04.01 18:56浏览量:32

简介:科普 | 想了解地址解析聚合服务?看这一篇就够了

最后一公里配送是整个物流业务链路中的重要环节,为了提高配送效率,企业通常会将物流运单地址聚合。目前传统企业面临诸多不便,一个是传统逐一配送的方式会造成重复运输、运力浪费的情况;另一个是人工划分区域聚合的方式不仅效率低下,当碰到一些奇怪的地址时还很难确定其真实位置。

地址解析聚合是一种高度集成化的服务, 根据用户输入的运单地址,解析该地址真实坐标;并结合多类地图数据,从空间关系和文本结构两个角度,将运单分类聚合至最小派送单位。地址解析聚合服务支持多维度的聚合功能,可根据POI、路段、道路、行政区划(省、市、区、镇)等维度来进行聚合,满足不同的需求。

图片.jpg

地址解析聚合最为基础的能力是地址解析,这个能力类似于地理编码服务,但优于地理编码服务,优势主要体现在两个方面:

一、地址解析聚合的准确率更高

这得益于多方面的能力的集成。数据方面,地址解析聚合充分使用全国五级行政区划的数据、路网数据和地图底层数据(如POI数据),并进行聚合数据挖掘,可以解决全国绝大多数地区包括偏远地区的地址解析精度问题;语意理解方面,地址解析聚合借助于强大的NLP分词能力,可切出行政区划、POI、主体和手机号等多类型信息,为后续的解析提供良好的基础;自学习能力方面,地址解析聚合并非一成不变,解析聚合拥有学习优化能力,在原始解析精度较好的基础上,不断提升解析结果的准确率。

二、地址解析聚合的输出信息更多

其结果不仅仅包括经纬度坐标,还包括标准化地址信息信息,如姓名、电话、行政区划、道路、路段、POI等。坐标仅仅只是解析的结果之一,在很多的应用场景中,行政区划、道路、路段、POI等信息的使用率完全不低于经纬度坐标信息。

举例说明地址解析,现有地址为“李白1351111上海市金科路百度上海研发中心F6A000”,最终可以解析出来姓名为“李白”,联系方式为“1351111”,行政区划信息为“上海市上海市浦东新区张江镇”,其中“浦东新区”和“张江镇”为解析服务补全的信息;另外,原地址文本中的“金科路”被纠正为“中科路”,并且解析出路段信息为“中科路(百业路到纳贤路)”。解析结果中,还包括POI点的信息“百度上海研发中心”,以及其他内容“F6A000”。

图片.jpg

地址解析聚合服务充分发挥了百度地图的“AI+地图“能力。在架构设计中,底层对物流行业的地图基础数据进行针对性挖掘,得到聚合场景下所需要的数据。相对于基础数据,聚合数据的粒度会更细,同时聚合结果可加快数据搜索速度。

中间层结合了文本理解和空间结构分析两大能力。空间结构分析主要是一个地理编码与逆地理编码的过程,当地址中的POI信息可以精准匹配的时候,该地址的解析结果会非常准确,但是当地址中存在无效POI或者错别字等误导信息的时候,解析结果的误差比较大。而文本理解主要包含文本分词、消歧、补全的过程,并在最终通过标准地址库得出标准化地址,这种方式可以充分利用原地址中的行政区划、道路、POI等信息,不依赖于地址的空间关系进行地址补全和消歧,但是这种方式完全脱离了位置坐标信息,可靠性也较为依赖地址文本质量。地址解析基于这两大能力,可以得出比单独一种更好的解析效果,同时也具备了一些额外的能力:对于文本较为精准的地址具备部分地址信息补全能力,对于异常地址具备识别的能力,对于道路等信息具备部分纠错能力。

最上层由机器学习算法进行最终优化和确定解析结果,机器学习算法会根据地址文本的特征以及文本理解和空间结构分析得出的结果判断如何对结果进行优化和选择,除此之外,机器学习算法具有成长性,基于下层的可靠解析结果,在不断的进行学习后,准确率会持续提升。

图片.jpg

地址解析聚合提供多维度地址分级聚合能力,可简单归纳为七级——省、市、区、镇、道路、路段、POI。前述的省、市、区、镇聚合能力,特别是前两级,可以用于干线运输的运单地址聚合,而后几级则可以用于最后一公里配送过程中运单地址聚合。在传统末端配送中,运单聚合通常只通过POI聚合的,但是很多POI(小区、园区、商场等)配送点我们并不知道它们的具体大小和形状,即使是同一类型的POI,它们的情况也可能会迥异,这就是为什么地址解析聚合提供更多维度聚合:比如按照道路、路段进行聚合,一条道路或者路段可能会横跨过多个POI、AOI甚至是乡镇街道行政区划。基于地址解析聚合服务,你可以选择:

1.区域面聚合:有些POI(小区、写字楼、园区、风景区等)有具体的边界坐标,通过空间位置关系计算可以确定哪些运单地址位于这个区域,从而将相同区域的运单聚合到一起。这种聚合方式较为常见。

2.关联关系聚合:有些POI(如“百度上海研发中心-东门”)有父POI(如“百度上海研发中心”),可以将其关联到父POI上。

3.挖掘聚集区:从历史运单地址中用数据挖掘算法找出运单相对集中的区域,将这些挖掘出的区域面作为以后的聚合区。

4.地标建筑聚合: 地图中大多数POI(住宅小区、写字楼、园区、商场、景点等)只有一个坐标位置,并不知道具体的大小、形状,无法判断运单地址跟这个POI的关系,但是很多地标性建筑(小区、大厦、商场、酒店、地铁站、政府机构等)常常用来粗略标志一个小区域,因此可以选取大量的地标性建筑将附近一定范围内运单全部关联起来。

5.路段聚合:大多数运单地址都可以关联到附近的一条道路上,但是道路一般很长,不适合直接作为聚合点。将道路沿路口切开,分成路段,给每个路段赋予一个名字来标识,如“百度上海研发中心所在的中科路路段”命名为“中科路(百业路到纳贤路)”,用路段将沿线的POI关联起来。这种方式可以既有实用道路聚合的灵活性,又可以避免道路过长导致的聚合量级过大的问题。

图片.jpg

三、百度地图智能物流解决方案

百度地图智能物流解决方案是为物流行业量身打造的一整套核心场景应用体系,基于自身超级时空数据体、物流地图和强大的智能调度服务, 目前我们已在业界推广,帮助合作伙伴大幅降低运输成本,已成为物流全域行业降本增效的利器。同时,百度地图智能物流解决方案已覆盖快递快运、货运平台、同城配送、快消、能源、冷链等众多物流行业垂直领域,并与双汇物流、中国建材、日日顺供应链、古茗科技、叮咚买菜、步步高商超等行业标杆企业达成深入合作,成为物流行业的新基建底座及降本增效利器。

图片.jpg

发表评论