pyspark如何给dataframe增加新的一列-创新互联

这篇文章主要讲解了pyspark如何给dataframe增加新的一列,内容清晰明了,对此有兴趣的小伙伴可以学习一下,相信大家阅读完之后会有帮助。

为子长等地区用户提供了全套网页设计制作服务,及子长网站建设行业解决方案。主营业务为成都网站设计、成都做网站、子长网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!

熟悉pandas的pythoner 应该知道给dataframe增加一列很容易,直接以字典形式指定就好了,pyspark中就不同了,摸索了一下,可以使用如下方式增加

from pyspark import SparkContext
from pyspark import SparkConf
from pypsark.sql import SparkSession
from pyspark.sql import functions

spark = SparkSession.builder.config(conf=SparkConf()).getOrCreate()

data =   [['Alice', 19, 'blue', '["Alice", 19, "blue"]'],
  ['Jane', 20, 'green', '["Jane", 20, "green"]'],
   ['Mary', 21, 'blue', '["Mary", 21, "blue"]'], ]
frame = spark.createDataFrame(data, schema=["name", "age", "eye_color", "detail"])

frame.cache()
frame.show()

本文标题:pyspark如何给dataframe增加新的一列-创新互联
文章URL:http://bzwzjz.com/article/coijjh.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 营销型网站建设 达州网站设计 成都网站建设公司 自适应网站建设 成都网站建设 成都网站设计 定制级高端网站建设 成都网站建设 成都网站建设 成都网站设计公司 企业网站制作 品牌网站建设 LED网站设计方案 高端定制网站设计 品牌网站建设 成都企业网站制作 高端网站设计推广 成都网站设计 成都网站设计 成都企业网站建设 移动网站建设 手机网站制作