返回

r-按组(dplyr)变异新变量时删除NAs

发布时间:2022-05-24 13:39:54 263
# 数据

我正在使用EU-SILC数据进行uni项目。我想创建一个新变量,将所有家庭分配到相应的住房成本组,以创建一个叠加密度图,其中收入分配与住房成本相关。

我遇到了两个问题:

  1. 我无法创建变量hcost\U组,因为我的住房成本变量(将住户分配到这些组的基础)有47个NAs(在近70000个观察值中)。在创建新变量时,我尝试了许多不同的方法来删除NAs,但始终收到一条错误消息。
  2. 由于我不想一般删除我没有住房成本的家庭,hcost\u组变量将比我的收入变量短-我如何仅针对地块排除我没有住房成本的家庭的收入?

提前多谢!

以下是我创建变量和绘图的代码(inkl错误消息):

data <- data %>% filter(!is.na(hcost)) %>% group_by(country) %>% 
+   mutate(hcost_group = quantcut(hcost, q=c(0.1, 0.2, 0.3, 0.4)))
Error: Problem with `mutate()` column `hcost_group`.
i `hcost_group = quantcut(hcost, q = c(0.1, 0.2, 0.3, 0.4))`.
x missing value where TRUE/FALSE needed
i The error occurred in group 6: country = "UK".
Run `rlang::last_error()` to see where the error occurred.

> 
> ggplot(data=data, aes(x=decile, group=hcost_group, fill=hcost_group)) +
+   geom_density(adjust=1.5, position="fill") +
+   facet_wrap(~country)+
+   xlab("Einkommensdezil")+
+   ylab("Anteil der Gruppen nach Wohnkostenbelastung")+
+   scale_fill_discrete(name = "Wohnkostenbelastung (Anteil der Wohnkosten am EK)",
+                       labels = 
+                         c("0-10%", "10-20%","20-30%",
+                           "30-40%", "40-100%"))
Error in FUN(X[[i]], ...) : object 'hcost_group' not found

我还尝试了“na.rm = TRUE”、“na.omit()”和“complete.cases”。

特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报
评论区(2)
按点赞数排序
用户头像
下一篇
android-通过ADB打开飞机模式 2022-05-24 11:31:15