最近我有一个数据框,其中包含一个大部分为空值的列:
> data.frame(col1 = c(1,2,3,4,5), col2 = c("a", NA, NA , "b", NA))
col1 col2
1 1 a
2 2 <NA>
3 3 <NA>
4 4 b
5 5 <NA>
我想用该列中的最后一个非 NA 值填充 NA 值。所以我希望数据框看起来像这样:
> data.frame(col1 = c(1,2,3,4,5), col2 = c("a", NA, NA , "b", NA))
col1 col2
1 1 a
2 2 <NA>
3 3 <NA>
4 4 b
5 5 <NA>
在 遇到动物园库中的 na.locf 函数 之前,我花了很长时间四处寻找:
> data.frame(col1 = c(1,2,3,4,5), col2 = c("a", NA, NA , "b", NA))
col1 col2
1 1 a
2 2 <NA>
3 3 <NA>
4 4 b
5 5 <NA>
这将填充每一列的缺失值,因此如果我们有第三列缺失值,它也会填充这些值:
> data.frame(col1 = c(1,2,3,4,5), col2 = c("a", NA, NA , "b", NA))
col1 col2
1 1 a
2 2 <NA>
3 3 <NA>
4 4 b
5 5 <NA>
如果我们只想填充“col2”并保留“col3”,我们可以将该函数专门应用于该列:
> data.frame(col1 = c(1,2,3,4,5), col2 = c("a", NA, NA , "b", NA))
col1 col2
1 1 a
2 2 <NA>
3 3 <NA>
4 4 b
5 5 <NA>
这是一个非常简洁的功能,在清理不像您希望的那样统一的数据集时肯定会很有帮助!