根据教程实现了读取csv文件前面的几行数据,一下就想到了是不是可以实现前面几列的数据。经过多番尝试总算试出来了一种方法。
之所以想实现读取前面的几列是因为我手头的一个csv文件恰好有后面几列没有可用数据,但是却一直存在着。原来的数据如下:
GreydeMac-mini:chapter06 greyzhang$ cat data.csv
1,name_01,coment_01,,,, 2,name_02,coment_02,,,, 3,name_03,coment_03,,,, 4,name_04,coment_04,,,, 5,name_05,coment_05,,,, 6,name_06,coment_06,,,, 7,name_07,coment_07,,,, 8,name_08,coment_08,,,, 9,name_09,coment_09,,,, 10,name_10,coment_10,,,, 11,name_11,coment_11,,,, 12,name_12,coment_12,,,, 13,name_13,coment_13,,,, 14,name_14,coment_14,,,, 15,name_15,coment_15,,,, 16,name_16,coment_16,,,, 17,name_17,coment_17,,,, 18,name_18,coment_18,,,, 19,name_19,coment_19,,,, 20,name_20,coment_20,,,, 21,name_21,coment_21,,,,
如果使用pandas读取出全部的数据,打印的时候会出现以下结果:
In [41]: data = pd.read_csv('data.csv')
In [42]: data Out[42]: 1 name_01 coment_01 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6 0 2 name_02 coment_02 NaN NaN NaN NaN 1 3 name_03 coment_03 NaN NaN NaN NaN 2 4 name_04 coment_04 NaN NaN NaN NaN 3 5 name_05 coment_05 NaN NaN NaN NaN 4 6 name_06 coment_06 NaN NaN NaN NaN 5 7 name_07 coment_07 NaN NaN NaN NaN 6 8 name_08 coment_08 NaN NaN NaN NaN 7 9 name_09 coment_09 NaN NaN NaN NaN 8 10 name_10 coment_10 NaN NaN NaN NaN 9 11 name_11 coment_11 NaN NaN NaN NaN 10 12 name_12 coment_12 NaN NaN NaN NaN 11 13 name_13 coment_13 NaN NaN NaN NaN 12 14 name_14 coment_14 NaN NaN NaN NaN 13 15 name_15 coment_15 NaN NaN NaN NaN 14 16 name_16 coment_16 NaN NaN NaN NaN 15 17 name_17 coment_17 NaN NaN NaN NaN 16 18 name_18 coment_18 NaN NaN NaN NaN 17 19 name_19 coment_19 NaN NaN NaN NaN 18 20 name_20 coment_20 NaN NaN NaN NaN 19 21 name_21 coment_21 NaN NaN NaN NaN
所说在学习的过程中这并不会给我带来什么障碍,但是在命令行终端界面呆久了总喜欢稍微清爽一点的风格。使用read_csv的参数usecols能够在一定程度上减少这种混乱感。
In [45]: data = pd.read_csv('data.csv',usecols=[0,1,2,3])
In [46]: data Out[46]: 1 name_01 coment_01 Unnamed: 3 0 2 name_02 coment_02 NaN 1 3 name_03 coment_03 NaN 2 4 name_04 coment_04 NaN 3 5 name_05 coment_05 NaN 4 6 name_06 coment_06 NaN 5 7 name_07 coment_07 NaN 6 8 name_08 coment_08 NaN 7 9 name_09 coment_09 NaN 8 10 name_10 coment_10 NaN 9 11 name_11 coment_11 NaN 10 12 name_12 coment_12 NaN 11 13 name_13 coment_13 NaN 12 14 name_14 coment_14 NaN 13 15 name_15 coment_15 NaN 14 16 name_16 coment_16 NaN 15 17 name_17 coment_17 NaN 16 18 name_18 coment_18 NaN 17 19 name_19 coment_19 NaN 18 20 name_20 coment_20 NaN 19 21 name_21 coment_21 NaN
为了能够看到数据的“边界”,读取的时候显示了第一列无效的数据。正常的使用中,或许我们是想连上面结果中最后一列的信息也去掉的,那只需要在参数重去掉最后一列的列号。
In [47]: data = pd.read_csv('data.csv',usecols=[0,1,2])
In [48]: data Out[48]: 1 name_01 coment_01 0 2 name_02 coment_02 1 3 name_03 coment_03 2 4 name_04 coment_04 3 5 name_05 coment_05 4 6 name_06 coment_06 5 7 name_07 coment_07 6 8 name_08 coment_08 7 9 name_09 coment_09 8 10 name_10 coment_10 9 11 name_11 coment_11 10 12 name_12 coment_12 11 13 name_13 coment_13 12 14 name_14 coment_14 13 15 name_15 coment_15 14 16 name_16 coment_16 15 17 name_17 coment_17 16 18 name_18 coment_18 17 19 name_19 coment_19 18 20 name_20 coment_20 19 21 name_21 coment_21
以上这篇使用pandas读取csv文件的指定列方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
pandas读取csv指定列
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
P70系列延期,华为新旗舰将在下月发布
3月20日消息,近期博主@数码闲聊站 透露,原定三月份发布的华为新旗舰P70系列延期发布,预计4月份上市。
而博主@定焦数码 爆料,华为的P70系列在定位上已经超过了Mate60,成为了重要的旗舰系列之一。它肩负着重返影像领域顶尖的使命。那么这次P70会带来哪些令人惊艳的创新呢?
根据目前爆料的消息来看,华为P70系列将推出三个版本,其中P70和P70 Pro采用了三角形的摄像头模组设计,而P70 Art则采用了与上一代P60 Art相似的不规则形状设计。这样的外观是否好看见仁见智,但辨识度绝对拉满。
更新日志
- 雨林唱片《赏》新曲+精选集SACD版[ISO][2.3G]
- 罗大佑与OK男女合唱团.1995-再会吧!素兰【音乐工厂】【WAV+CUE】
- 草蜢.1993-宝贝对不起(国)【宝丽金】【WAV+CUE】
- 杨培安.2009-抒·情(EP)【擎天娱乐】【WAV+CUE】
- 周慧敏《EndlessDream》[WAV+CUE]
- 彭芳《纯色角3》2007[WAV+CUE]
- 江志丰2008-今生为你[豪记][WAV+CUE]
- 罗大佑1994《恋曲2000》音乐工厂[WAV+CUE][1G]
- 群星《一首歌一个故事》赵英俊某些作品重唱企划[FLAC分轨][1G]
- 群星《网易云英文歌曲播放量TOP100》[MP3][1G]
- 方大同.2024-梦想家TheDreamer【赋音乐】【FLAC分轨】
- 李慧珍.2007-爱死了【华谊兄弟】【WAV+CUE】
- 王大文.2019-国际太空站【环球】【FLAC分轨】
- 群星《2022超好听的十倍音质网络歌曲(163)》U盘音乐[WAV分轨][1.1G]
- 童丽《啼笑姻缘》头版限量编号24K金碟[低速原抓WAV+CUE][1.1G]