modood / administrative-divisions-of-china Goto Github PK
View Code? Open in Web Editor NEW中华人民共和国行政区划:省级(省份)、 地级(城市)、 县级(区县)、 乡级(乡镇街道)、 村级(村委会居委会) ,**省市区镇村二级三级四级五级联动地址数据。
License: Do What The F*ck You Want To Public License
中华人民共和国行政区划:省级(省份)、 地级(城市)、 县级(区县)、 乡级(乡镇街道)、 村级(村委会居委会) ,**省市区镇村二级三级四级五级联动地址数据。
License: Do What The F*ck You Want To Public License
国家统计局上,非直辖市包含市辖区行政编码
eg:130101 河北省 石家庄市 市辖区
但是抓取下来的数据没有
没有**省这些?
获取福建金门县时,由于不存在而停止。
建议特殊处理
你这爬出来的数据已经跟真实的不一样了;有些县升级成地市了;没有特殊处理;有些地市code、名字都变化了;那个统计的网站没更新;不过发了通知;导致没同步到最新的行政信息
数据中未抓取各个市辖区。
ERROR in .//china-division/index.js/china-division/index.js 3:9-22
Module not found: Error: Cannot resolve module 'fs' in /Users/xxx/Code/xxx/node_modules/china-division
@ ./
弱弱的问下,这些文件是什么文件啊?
pc-code.json
pc.json
pca-code.json
pca.json
pcas-code.json ago
pcas.json
打开看了,貌似压缩版的省市县区文件?
能不能带上地理位置信息?有需求根据当前GPS坐标判断在哪个省市区位置。
var path = require('path')
, 需要在 package.json 里面依赖 path 模块
模块安装好以后 跑完fetch脚本后 不知道最新的数据是存在哪里了 希望解答一下 谢谢。
如:
if (err.message !== 'timeout') console.log(
抓取地级(${cCode})的县级数据失败(${err}),正在重试...
)
return exports.fetchAreas(cCode)
可考虑改为
if (err.message !== 'timeout') {
console.log(抓取地级(${cCode})的县级数据失败(${err}),正在重试...
)
retry += 1
}
if (retry < retryLimit) {
return exports.fetchAreas(cCode)
} else {
retry = 0
}
我只需要用“省份、城市” 二级联动数据 pc.json
来选择省份和城市,但是里面没有省直辖县级行政区。
比如如果我生活在河南省济源市,用pc.json就找不到这个地方。
地区可能重名,但行政区划代码不会,数据库也好存
想试着运行一下这个爬虫,也装了node.js但是不知道咋运行。。。求大佬带带弱鸡。。
在pca-code.json三级数据中,部分数据有误,出现了乡级地区的数据,如code为4604的儋州市,它的children为乡级行政区,看了一下国家民政部的网站,它没有县(区)级行政区,所以我认为把三级的children改为460400儋州市会更合理。
同理类似的还有4419东莞等其他没有县级行政区的市级行政区
Python 版本轮子地址如下:
https://github.com/snakejordan/administrative-divisions-of-China-on-Python
欢迎围观。
因为数据需要不断抓取,建议在抓取文件里加入抓取时间等信息,方便了解数据的新旧程度,鉴于json没有comment,建议将日期直接以属性值的方式加入,譬如这种
{ "_comment" : "comment text goes here...", "address":[.......] }
东莞市 441900
中山市 442000
儋州市 460400
三项数据都有重复的结点,对于数据库导入是个问题
http://www.mca.gov.cn/article/sj/tjbz/a/
但mca又没有完整的县以下的数据,有人能以大公司的名义请求mca 公开县以下的数据么
cities.csv 中239行数据不理解:“5002 '县' 50” 。
应该是重庆下面的一个区县。是什么呢?
联动没带code。。。呃。貌似还得多文件之间查。。。
原来的结构:
{"code":"11","name":"北京市","childs":[{"code":"1101","name":"市辖区",......}]}
应调整为:
[
11=>{name:"北京市", "childs":[1101":{"name":"市辖区",'childs'......}}
这样的结构会更易于使用,能够很方便地进行数据查询
感谢感谢。
湖北省邮编 43 开头不是42开头
你好,可以加入“华东、华中”以及南方、北方这种大的区域吗?
如题,我觉得这个挺有意思的。但是目前找不到类似的库
整个河北省的市辖区几乎全部没有。
像东营市的区列表里, 市辖区没有超链接,就不会被抓取到。这种正常吗?
http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/37/3705.html
请问有什么办法吗?
你好,请问怎样能拿到国际化的数据?
对比民政部最新数据 http://www.mca.gov.cn/article/sj/xzqh/2018/201804-12/20180608021501.html
有几个地方需要更新:
福建福州市:
长乐市 -> 长乐区
西藏拉萨:
达孜县 -> 达孜区
西藏:
那曲地区 -> 那曲市
那曲县 -> 色尼区
陕西咸阳:
彬县 -> 彬州市
**新增:
北屯市
双河市
可克达拉市
昆玉市
我下载的是CSV格式的数据,大部分都没有市辖区这个层级,但是国家统计局网站上是有的。
没有港澳台相关城市等信息。
require(..)是请求的哪里的包?
2017年统计用区划代码和城乡划分代码(截止2017年10月31日)
http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/index.html
只能抓取到四级,能否提供抓到乡村的功能,可能抓取时间会比较长。
成都 高新区 天府新区没有啊?
610121 陕西省西安市长安县
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.