pyspark如何给dataframe增加新的一列-创新互联

这篇文章主要讲解了pyspark如何给dataframe增加新的一列,内容清晰明了,对此有兴趣的小伙伴可以学习一下,相信大家阅读完之后会有帮助。

为子长等地区用户提供了全套网页设计制作服务,及子长网站建设行业解决方案。主营业务为成都网站设计、成都做网站、子长网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!

熟悉pandas的pythoner 应该知道给dataframe增加一列很容易,直接以字典形式指定就好了,pyspark中就不同了,摸索了一下,可以使用如下方式增加

from pyspark import SparkContext
from pyspark import SparkConf
from pypsark.sql import SparkSession
from pyspark.sql import functions

spark = SparkSession.builder.config(conf=SparkConf()).getOrCreate()

data =   [['Alice', 19, 'blue', '["Alice", 19, "blue"]'],
  ['Jane', 20, 'green', '["Jane", 20, "green"]'],
   ['Mary', 21, 'blue', '["Mary", 21, "blue"]'], ]
frame = spark.createDataFrame(data, schema=["name", "age", "eye_color", "detail"])

frame.cache()
frame.show()

文章名称:pyspark如何给dataframe增加新的一列-创新互联
转载来源:http://bzwzjz.com/article/coijjh.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 成都网站制作 成都网站设计 定制级高端网站建设 手机网站建设 广安网站设计 成都网站建设公司 网站制作报价 响应式网站设计 手机网站制作 公司网站建设 成都网站建设 成都响应式网站建设 营销型网站建设 成都网站建设 网站制作公司 成都网站制作 成都网站制作 成都网站制作 成都网站建设公司 成都网站制作 成都网站设计 成都定制网站建设