Python怎么处理杂乱无序的数据

这篇文章主要讲解了“Python怎么处理杂乱无序的数据”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python怎么处理杂乱无序的数据”吧!

创新互联建站-专业网站定制、快速模板网站建设、高性价比于田网站开发、企业建站全套包干低至880元,成熟完善的模板库,直接使用。一站式于田网站制作公司更省心,省钱,快速模板网站建设找我们,业务覆盖于田地区。费用合理售后完善,10多年实体公司更值得信赖。

问题抽丝剥茧

这个问题算是群友答疑。如果说同事或者老板给你一堆这样的数据,你估计会抓狂,该怎么处理呢?

Python怎么处理杂乱无序的数据  

仔细观察上面数据可以发现,该数据有如下2个主要特点

  • ① 每一行的数据长度不同。第一行和第三行有4个属性,第二行有5个属性。
  • ② 不同行的属性值,并不是对应排列。
 

解题思路剖析

你可能会想,直接用Excel分裂。其实并不可行,因为不同行的属性值,并不是对应排列。Excel分列导致的结果就是:不同的属性,存在于相同的行。

Python怎么处理杂乱无序的数据  

放弃Excel那条路之后,我就只能寻求Python的帮助了。我们要根据数据的特点,选择合适的数据存储方法。最终问题就转化为:构造数据源,然后创建DataFrame即可。

然后根据我们这个数据的特点,我选择构造字典组成的列表这样一个数据,并利用它来创建DataFrame。

Python怎么处理杂乱无序的数据  

观察我提供的这个案例和待解决的问题,简直异曲同工。我们同样可以将上述数据的每一行,都变成一个个键值对组成的字典。然后最外层用一个大列表,将所有的字典包含起来。

 

完整代码

 1)首先需要构造练习数据
import pandas as pd
x = {"信息":["年龄:12;性别:女;身高:22;爱好:打球",
             "年龄:12;说明:历史数据;性别:女;身高:22;爱好:打球",
             "生日:2月3日;年龄:12;性别:女;爱好:打球"]
    }
df = pd.DataFrame(x)
df
 

结果如下:

Python怎么处理杂乱无序的数据  
 2)构造字典组成的列表
tmps_list = []
for data in df["信息"].values:
    tmp_dict = {}
    for kv in data.split(";"):
        k, v = kv.split(":")
        tmp_dict[k] = v
    tmps_list.append(tmp_dict)
tmps
 

结果如下:

Python怎么处理杂乱无序的数据  
 3)创建DataFrame
df = pd.DataFrame(tmps)
df
 

结果如下:

Python怎么处理杂乱无序的数据  

感谢各位的阅读,以上就是“Python怎么处理杂乱无序的数据”的内容了,经过本文的学习后,相信大家对Python怎么处理杂乱无序的数据这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!


本文名称:Python怎么处理杂乱无序的数据
文章链接:http://bzwzjz.com/article/ppcdsg.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 成都网站建设 定制网站设计 定制网站建设多少钱 H5网站制作 成都网站建设 成都网站制作 高端品牌网站建设 成都网站设计 成都响应式网站建设 网站建设方案 上市集团网站建设 成都网站建设 成都网站建设 成都网站设计公司 成都网站设计制作公司 成都网站制作 高端网站建设 响应式网站设计 网站制作 LED网站设计方案 app网站建设 成都网站设计