有没有pyspark方法来对具有交集元素的groupby列表进行分组?
发布时间:2022-09-08 04:56:13 296
相关标签:
我想找到一种方法来分组有交集元素的列表。
(前)
user | list(el)
-- | --
A | el_1, el_2
B | el_2, el_3
C | el_1, el_4
D | el_6, el_7
因为用户A、B、C在列表(el)中有中间层,所以我想对它们进行分组。
预期结果)
user | list(el)
-- | --
A,B,C | el_1,el_2,el_3,el_4
D | el_6,el_7
Pyspark有什么解决方案吗?谢谢你的回答,
特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报