利用Python抓取行政区划码的方法

脚本专栏 2024/11/8 佚名

3 2 1

圆月山庄资源网 Design By www.vgjia.com

前言

国家统计局网站上有相对比较齐的行政区划码，对于一些网站来说这是非常基础的数据，所以写了个Python程序将这部分数据抓取下来。

注意：抓取下来以后还要进行简单的人工的整理

示例代码：

# -*- coding:utf-8 -*-
'''
获取国家统计局上的行政区划码
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*"><span lang="EN-US" style=".*">(\d+)<span>.*".*">(.*"code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u'　',''),area[1].decode('utf-8').count(u'　')
 
if __name__=='__main__':
 get_xzqh()

注意事项：

另外，关于国家地区表的信息，还有另外一种获取渠道，那就是QQ软件自带的国家地区信息表。（文件名为LocList.xml），一般的存储位置为：C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安装中文版QQ即可获取，如需英文版则安装英文版QQ。国际版在1033目录。

code都是按照ISO3166标准写的，极易导入数据库。

总结

以上就是利用Python获取行政区划码的全部内容，希望本文的内容对大家学习或者使用python能有所帮助，如果有疑问大家可以留言交流。

python抓取网页数据,python爬虫抓取数据,python,抓取网页内容

标签：

python抓取网页数据,python爬虫抓取数据,python,抓取网页内容

圆月山庄资源网 Design By www.vgjia.com

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

圆月山庄资源网 Design By www.vgjia.com

评论“利用Python抓取行政区划码的方法”

暂无评论...

www.vgjia.com 圆月山庄资源网

139,976互联网资源

144,792高清电影

21,817无损音乐

631,128技术资源

更新日志

2024年11月08日

利用Python抓取行政区划码的方法

python抓取网页数据,python爬虫抓取数据,python,抓取网页内容

Python中 Lambda表达式全面解析

Python抓取手机号归属地信息示例代码

评论“利用Python抓取行政区划码的方法”

更新日志

友情链接