小编给大家分享一下Pandas如何实现数据可视化基础绘图,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!
创新互联公司2013年成立,是专业互联网技术服务公司,拥有项目网站建设、成都做网站网站策划,项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命,1280元同德做网站,已为上家服务,为同德各地企业和个人服务,联系电话:13518219792
1、环境
IDE : jupyter notebook
Anaconda 3.X
2、基于matplotlib
import matplotlib.pyplot as plt
注:导入matplotlib.pyplot
import matplotlib
matplotlib.style.use('ggplot')
%matplotlib inline
注:使用ggplot样式,并且将图画在jupyter notebook中
import pandas as pd
import numpy as np
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
ts.plot()
注:使用pandas创建一个Series(序列),序列值是随机生成的1000个标准正态分布值,索引是从2000-1-1开始的1000个时间序列值。
然后使用plot默认画图。可以看出,下图非常不规则,因为相邻的两个值也是随机大小。
import pandas as pd
import numpy as np
ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000))
ts = ts.cumsum()
ts.plot()
注:这里加上了ts = ts.cumsum(),意思是返回累积值,在时间序列分析中,经常观察累积值曲线观察走势
这个累积值就看起来规则多了。
df = pd.DataFrame(np.random.randn(1000, 4), index=ts.index, columns=list('ABCD'))
df = df.cumsum()
plt.figure()
df.plot()
注:这里使用pandas创建了一个DataFrame(数据框,有点像excel表格那种),为什么不用刚才的Series呢?因为这里DataFrame中创建了4组数据,这4组数据都是随机生成的1000个标准正态分布值,索引是从2000-1-1开始的1000个时间序列值,并且也是求他们各自的累积值并且画图。
df3 = pd.DataFrame(np.random.randn(1000, 2), columns=['B', 'C']).cumsum()
df3['A'] = pd.Series(list(range(len(df))))
df3.plot(x='A', y='B')
注:使用DataFrame创建了2组数据,也是1000个标准正态分布,分别命名为B、C(就行excel中列名)。并且求累积值,再在原来的df(DataFrame的简称)(这里名字是df3)上加上一列名为A,A的值是0-999(使用df3的长度为1000,然后range被套列表生成一列数,作为x轴),y轴是B列数据(累积值),c列数据最后绘图没有用上。
最后Pandas基础绘图plot就完成了!
看完了这篇文章,相信你对“Pandas如何实现数据可视化基础绘图”有了一定的了解,如果想了解更多相关知识,欢迎关注创新互联行业资讯频道,感谢各位的阅读!