圆月山庄资源网 Design By www.vgjia.com
假设.json文件中存储的数据为:
{"type": "Point", "link": "http://www.dianping.com/newhotel/22416995", "coordinates": [116.37256372996957, 40.39798447055443], "category": "经济型", "name": "北京荷塘山庄", "count": "278", "address": "北京市怀柔区黄花城村安四路", "price": "380"} {"type": "Point", "link": "http://www.dianping.com/newhotel/19717653", "coordinates": [116.56881588256466, 40.43310967948417], "category": "经济型", "name": "慕田峪长城鱼师傅乡村酒店", "count": "89", "address": "北京市怀柔区渤海镇苇店村(慕田峪长城下3公里处,近怀黄路)", "price": "258"} {"type": "Point", "link": "http://www.dianping.com/newhotel/58365289", "coordinates": [116.62874974822378, 40.45610264855833], "category": "经济型", "name": "北京蜜桃儿亲子客栈", "count": "119", "address": "北京市怀柔区神堂峪风景区下官地11号", "price": "549"}
现在需要将上面的这些数据存为csv格式,其中字典的keys为csv中的属性名称,字典的values为csv中属性对应的值。
如果只需要按照json的keys来生成csv,那么操作比较简单,直接按照下面的方法即可:
#-*-coding:utf-8-*- import csv import json import sys import codecs def trans(path): jsonData = codecs.open(path+'.json', 'r', 'utf-8') # csvfile = open(path+'.csv', 'w') # 此处这样写会导致写出来的文件会有空行 # csvfile = open(path+'.csv', 'wb') # python2下 csvfile = open(path+'.csv', 'w', newline='') # python3下 writer = csv.writer(csvfile, delimiter='\t') flag = True for line in jsonData: dic = json.loads(line[0:-1]) if flag: # 获取属性列表 keys = list(dic.keys()) print (keys) writer.writerow(keys) # 将属性列表写入csv中 flag = False else: # 读取json数据的每一行,将values数据一次一行的写入csv中 writer.writerow(list(dic.values())) jsonData.close() csvfile.close() if __name__ == '__main__': path=str(sys.argv[1]) # 获取path参数 print (path) trans(path)
在python3下运行,命令行输入
python C:\Users\MaMQ\Documents\jsonToCsv.py C:\Users\MaMQ\Documents\data\geoFood
其中第三个参数为需要转换的文件的路径和其名称,将其后缀删除。运行文件后即可得到转换后的csv文件。
如果需要对json文件中每个字典的key字段进行修改,比如需要将上面dict中的coordinate中的经纬度数据取出来存为x、y数据,则可以按照下面的方法(此方法还可以调整每个属性显示的顺序,效果更好一点):
import csv import json import sys import codecs def trans(path): jsonData = codecs.open(path+'.json', 'r', 'utf-8') # csvfile = open(path+'.csv', 'w') # 此处这样写会导致写出来的文件会有空行 # csvfile = open(path+'.csv', 'wb') # python2下 csvfile = open(path+'.csv', 'w', newline='') # python3下 writer = csv.writer(csvfile, delimiter='\t') keys=['id', 'name', 'category', 'price', 'count', 'type', 'address', 'link', 'x', 'y'] writer.writerow(keys) i = 1 for dic in jsonData: dic = json.loads(dic[0:-1]) x = dic['coordinates'][0] y = dic['coordinates'][1] writer.writerow([str(i),dic['name'],dic['category'],dic['price'],dic['count'],dic['type'],dic['address'],dic['link'],x,y]) i += 1 jsonData.close() csvfile.close() if __name__ == '__main__': path = str(sys.argv[1]) print (path) trans(path)
运行方法同上。
json文件是我在大众点评抓取的数据,存储格式为utf-8。建议使用codecs包来读取json数据,可指定编码方式。
jsonData = codecs.open(path + '.json', 'r', encoding='utf-8')
欢迎交流讨论。
以上这篇利用python将json数据转换为csv格式的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
标签:
python,json转csv
圆月山庄资源网 Design By www.vgjia.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
圆月山庄资源网 Design By www.vgjia.com
暂无评论...
P70系列延期,华为新旗舰将在下月发布
3月20日消息,近期博主@数码闲聊站 透露,原定三月份发布的华为新旗舰P70系列延期发布,预计4月份上市。
而博主@定焦数码 爆料,华为的P70系列在定位上已经超过了Mate60,成为了重要的旗舰系列之一。它肩负着重返影像领域顶尖的使命。那么这次P70会带来哪些令人惊艳的创新呢?
根据目前爆料的消息来看,华为P70系列将推出三个版本,其中P70和P70 Pro采用了三角形的摄像头模组设计,而P70 Art则采用了与上一代P60 Art相似的不规则形状设计。这样的外观是否好看见仁见智,但辨识度绝对拉满。
更新日志
2024年11月07日
2024年11月07日
- 雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
- 罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
- 草蜢.1993-宝贝对不起(国)【宝丽金】【WAV+CUE】
- 杨培安.2009-抒·情(EP)【擎天娱乐】【WAV+CUE】
- 周慧敏《EndlessDream》[WAV+CUE]
- 彭芳《纯色角3》2007[WAV+CUE]
- 江志丰2008-今生为你[豪记][WAV+CUE]
- 罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
- 群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
- 群星《网易云英文歌曲播放量TOP100》[MP3][1G]
- 方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
- 李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
- 王大文.2019-国际太空站【环球】【FLAC分轨】
- 群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
- 童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]