您有两种选择:
1:您可以先对数据进行装箱。使用以下numpy.histogram
函数可以轻松完成此操作:
将numpy导入为np
导入matplotlib.pyplot作为plt
数据= np.loadtxt('Filename.txt')
#在这里选择你想要多少个垃圾箱
num_bins = 20
#使用直方图功能对数据进行分箱
计数,bin_edges = np.histogram(数据,bins = num_bins,normed = True)
#现在找到CDF
cdf = np.cumsum(counts)
#最后绘制CDF
plt.plot(bin_edges [1:],cdf)
plt.show()
2:而不是使用numpy.cumsum
,只需sorted_data
针对小于数组中每个元素的项目数绘制数组(请参阅此答案以获取更多详细信息:
将numpy导入为np
导入matplotlib.pyplot作为plt
数据= np.loadtxt('Filename.txt')
sorted_data = np.sort(数据)
yvals = np.arange(len(sorted_data))/ float(len(sorted_data)-1)
plt.plot(sorted_data,yvals)
plt.show()