geocoding
geocoding copied to clipboard
:globe_with_meridians: 地理编码技术,提供地址标准化和相似度计算。
去除后期出现的更高级的信息. 会大幅提升相似度, 作者大大能优化一些这种情况吗? ```java String t1 = "海南省海口市灵山镇海榆大道4号绿地城.润园海口市灵山西片去旧改项目A-32地块11#楼(栋)2(单元)2(层)203(号)"; String t2 = "海南省海口市灵山镇海榆大道4号绿地城.润园11#楼2单元203"; ``` 结果: ```java 海南省海口市灵山镇海榆大道4号绿地城.润园海口市灵山西片去旧改项目A-32地块11#楼(栋)2(单元)2(层)203(号) addr1 >>>> Address( provinceId=460000000000, province=海南省, cityId=460100000000, city=海口市, districtId=460108000000, district=美兰区, streetId=460108101000, street=灵山镇, townId=460108101000, town=灵山镇, villageId=null,...
无法精确到五级
大佬好,按照说明方法导入了五级地址库至mysql中,重新生成了dat文件,发现地址标准返回无法精确五级,这个怎么处理? 省/直辖市 市/州 县/区 乡/镇 村/社区
## 实现思路 ### 工具类输入 #### 1. 地址数据网址 比如:`http://www.stats.gov.cn/sj/tjbz/tjyqhdmhcxhfdm/2023/`,或者类参数固定死2022、2023等等的输入。 如果有接口直接调用更好,没有的话可以用jsoup对页面进行爬虫 #### 2. 地址层级 由于层级越深,生成的最终文件肯定越大。所以需要限制下地址的层级,比如1:省,2:市,3:区,4:街道/镇,5:居委会 #### 3. 文件格式 json/pb...
Bumps [guava](https://github.com/google/guava) from 31.1-jre to 32.0.0-jre. Release notes Sourced from guava's releases. 32.0.0 Maven <dependency> <groupId>com.google.guava</groupId> <artifactId>guava</artifactId> <version>32.0.0-jre</version> <!-- or, for Android: --> <version>32.0.0-android</version> </dependency> Jar files 32.0.0-jre.jar 32.0.0-android.jar Guava...
使用 normalizing: 标准化方法,输入地址:北京市海淀区西北旺东路10号院东区323102,发现返回数字323102 没有了 麻烦帮忙看看
输入:四川省成都市郫都区西源大道1311号3栋4单元1楼102号 segment方法,seg_type = 'ik', 分词结果list为:['四川省', '成都市', '郫', '都', '西源大道', '1311号', '3栋', '4', '单元', '1楼', '102号'] 期望结果list为:['四川省', '成都市', '郫都区', '西源大道', '1311号', '3栋', '4', '单元', '1楼', '102号'] 请问有啥办法修正结果吗?感谢!