返回

python-连接数据帧并合并/替换列值

发布时间:2022-06-18 21:53:22 303
# node.js
from delta.tables import *

vals1 = [(1, "a"), 
        (2, "b"), 
        (3, "c"), 
        (4, "d") 
      ]
columns1 = ["id","name"]
df1 = spark.createDataFrame(data=vals1, schema=columns1)
# df1.show()

vals2 = [(1, "k"), 
        (2, "l"), 
        (3, "m")
      ]
columns2 = ["id","name"]
df2 = spark.createDataFrame(data=vals2, schema=columns2)
# df2.show()

df1 = df1.join(df2, 'id', 'full')
df1.show()

给出以下结果:

+---+----+----+
| id|name|name|
+---+----+----+
|  1|   a|   k|
|  3|   c|   m|
|  2|   b|   l|
|  4|   d|null|
+---+----+----+

d"E;价值观
(它必须始终使用来自df2的值,但有一个例外-当df1中有一行在df2中没有匹配行时,在这种情况下,它需要使用来自df1的值)。

特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报
评论区(2)
按点赞数排序
用户头像