dplyr – 使用较早/先前的行值更新行
💡一则或许对你有用的小广告
欢迎加入小哈的星球 ,你将获得:专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论
- 新项目:《从零手撸:仿小红书(微服务架构)》 正在持续爆肝中,基于
Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...
,点击查看项目介绍 ;- 《从零手撸:前后端分离博客项目(全栈开发)》 2 期已完结,演示链接: http://116.62.199.48/ ;
截止目前, 星球 内专栏累计输出 82w+ 字,讲解图 3441+ 张,还在持续爆肝中.. 后续还会上新更多项目,目标是将 Java 领域典型的项目都整一波,如秒杀系统, 在线商城, IM 即时通讯,权限管理,Spring Cloud Alibaba 微服务等等,已有 2800+ 小伙伴加入学习 ,欢迎点击围观
最近我有一个数据框,其中包含一个大部分为空值的列:
> data.frame(col1 = c(1,2,3,4,5), col2 = c("a", NA, NA , "b", NA))
col1 col2
1 1 a
2 2 <NA>
3 3 <NA>
4 4 b
5 5 <NA>
我想用该列中的最后一个非 NA 值填充 NA 值。所以我希望数据框看起来像这样:
> data.frame(col1 = c(1,2,3,4,5), col2 = c("a", NA, NA , "b", NA))
col1 col2
1 1 a
2 2 <NA>
3 3 <NA>
4 4 b
5 5 <NA>
在 遇到动物园库中的 na.locf 函数 之前,我花了很长时间四处寻找:
> data.frame(col1 = c(1,2,3,4,5), col2 = c("a", NA, NA , "b", NA))
col1 col2
1 1 a
2 2 <NA>
3 3 <NA>
4 4 b
5 5 <NA>
这将填充每一列的缺失值,因此如果我们有第三列缺失值,它也会填充这些值:
> data.frame(col1 = c(1,2,3,4,5), col2 = c("a", NA, NA , "b", NA))
col1 col2
1 1 a
2 2 <NA>
3 3 <NA>
4 4 b
5 5 <NA>
如果我们只想填充“col2”并保留“col3”,我们可以将该函数专门应用于该列:
> data.frame(col1 = c(1,2,3,4,5), col2 = c("a", NA, NA , "b", NA))
col1 col2
1 1 a
2 2 <NA>
3 3 <NA>
4 4 b
5 5 <NA>
这是一个非常简洁的功能,在清理不像您希望的那样统一的数据集时肯定会很有帮助!