python-连接数据帧并合并/替换列值
发布时间:2022-06-18 21:53:22 303
相关标签: # node.js
from delta.tables import *
vals1 = [(1, "a"),
(2, "b"),
(3, "c"),
(4, "d")
]
columns1 = ["id","name"]
df1 = spark.createDataFrame(data=vals1, schema=columns1)
# df1.show()
vals2 = [(1, "k"),
(2, "l"),
(3, "m")
]
columns2 = ["id","name"]
df2 = spark.createDataFrame(data=vals2, schema=columns2)
# df2.show()
df1 = df1.join(df2, 'id', 'full')
df1.show()
给出以下结果:
+---+----+----+
| id|name|name|
+---+----+----+
| 1| a| k|
| 3| c| m|
| 2| b| l|
| 4| d|null|
+---+----+----+
d"E;价值观
(它必须始终使用来自df2的值,但有一个例外-当df1中有一行在df2中没有匹配行时,在这种情况下,它需要使用来自df1的值)。
特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报