在绘制正负样本在各个特征维度上的CDF(累积分布)图时出现了以下问题:
问题具体表现为:
1.几个负样本的数据点位置倒错
2.X轴刻度变成了乱七八糟一团鬼东西
最终解决办法
造成上述情况的原因其实是由于输入matplotlib.plot()函数的数据x_data和y_data从CSV文件中直接导入后格式为string,因此才会导致所有数据点的x坐标都被直接刻在了x轴上,且由于坐标数据格式错误,部分点也就表现为“乱点”。解决办法就是导入x,y数据后先将其转化为float型数据,然后输入plot()函数,问题即解决。
补充知识:matplotlib如何在绘制时间序列时跳过无数据的区间
其实官方文档里就提供了方法,这里简单的翻译并记录一下.
11.1.9 Skip dates where there is no data
When plotting time series, e.g., financial time series, one often wants to leave out days on which there is no data, e.g., weekends.
By passing in dates on the x-xaxis, you get large horizontal gaps on periods when there is not data.The solution is to pass in some proxy x-data, e.g., evenly sampled indices, and then use a custom formatter to format these as dates.
The example below shows how to use an ‘index formatter' to achieve the desired plot:
解决方案是通过传递x轴数据的代理,比如下标,
然后通过自定义的'formatter'去取到相对应的时间信息
manual内示例代码:
import numpy as np import matplotlib.pyplot as plt import matplotlib.mlab as mlab import matplotlib.ticker as ticker #读数据 r = mlab.csv2rec('../data/aapl.csv') r.sort() r = r[-30:] # get the last 30 days N = len(r) ind = np.arange(N) # the evenly spaced plot indices def format_date(x, pos=None): #保证下标不越界,很重要,越界会导致最终plot坐标轴label无显示 thisind = np.clip(int(x+0.5), 0, N-1) return r.date[thisind].strftime('%Y-%m-%d') fig = plt.figure() ax = fig.add_subplot(1,1,1) ax.plot(ind, r.adj_close, 'o-') ax.xaxis.set_major_formatter(ticker.FuncFormatter(format_date)) fig.autofmt_xdate() plt.show()
示例:
同样一段数据上为原始,下为去掉无数据间隔区间
import pandas as PD import numpy as NP import matplotlib.pyplot as PLT import matplotlib.ticker as MTK file = r'vix_series.csv' df = PD.read_csv(file, parse_dates=[0, 2]) #用下标代理原始时间戳数据 idx_pxy = NP.arange(df.shape[0]) #下标-时间转换func def x_fmt_func(x, pos=None): idx = NP.clip(int(x+0.5), 0, df.shape[0]-1) return df['datetime'].iat[idx] #绘图流程 def decorateAx(ax, xs, ys, x_func): ax.plot(xs, ys, color="green", linewidth=1, linestyle="-") ax.plot(ax.get_xlim(), [0,0], color="blue", linewidth=0.5, linestyle="--") if x_func: #set数据代理func ax.xaxis.set_major_formatter(MTK.FuncFormatter(x_func)) ax.grid(True) return fig = PLT.figure() ax1 = fig.add_subplot(2,1,1) ax2 = fig.add_subplot(2,1,2) decorateAx(ax1, df['datetime'], df['vix_all'], None) decorateAx(ax2, idx_pxy, df['vix_all'], x_fmt_func) #优化label显示,非必须 fig.autofmt_xdate() PLT.show()
很多时候乱翻google还不如好好通读官方manual…
以上这篇解决Python Matplotlib绘图数据点位置错乱问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新日志
- 群星.2003-存为爱2CD【环球】【WAV+CUE】
- 韩磊《试音天碟》高清音频[WAV+CUE]
- 邓涛《寂寞蒲公英(黑胶CD)》[WAV]
- 江志丰.2011-爱你的理由【豪记】【WAV+CUE
- 群星《传承-太平洋影音45周年纪念版 (CD2)》[320K/MP3][140.01MB]
- 群星《传承-太平洋影音45周年纪念版 (CD2)》[FLAC/分轨][293.29MB]
- 首首经典《滚石红人堂I 一人一首成名曲 4CD》[WAV+CUE][2.5G]
- s14上单t0梯度怎么排名 s14世界赛上单t0梯度排行榜
- tes目前进了几次s赛 LPL队伍tes参加全球总决赛次数总览
- 英雄联盟巅峰礼赠什么时候开始 2024巅峰礼赠活动时间介绍
- 冯骥发文谈睡觉重要性 网友打趣:求求你先做DLC
- 博主惊叹《少女前线2》万圣节大雷皮肤:这真能过审吗?
- 《生化危机8》夫人比基尼Mod再引骂战:夸张身材有错吗?
- 江蕙.1994-悲情歌声【点将】【WAV+CUE】
- 戴娆.2006-绽放【易柏文化】【WAV+CUE】