可以使用dplyr和tidyr库来实现这个任务。假设我们有一个数据框df,其中包含日期(ID)和值。
示例数据:
library(dplyr)
library(tidyr)
df <- data.frame(ID = c("20210501", "20210501", "20210502", "20210502", "20210503", "20210503"),
Value = c(10, 20, 30, 40, 50, 60))
我们可以首先按ID进行分组,然后使用mutate和row_number函数为每个组分配新的组名和组值。最后,使用pivot_wider函数将这些新的变量转换为新的列。
df %>%
group_by(ID) %>%
mutate(VarName = paste0("Var", row_number()),
VarValue = Value,
GroupName = ID) %>%
pivot_wider(names_from = VarName, values_from = VarValue) %>%
select(-GroupName)
输出:
# A tibble: 3 x 4
# Groups: ID [3]
ID Var1 Var2 Var3
1 20210501 10 20 NA
2 20210502 30 40 NA
3 20210503 50 60 NA
这里我们使用了paste0创建了新的变量名Var1, Var2, Var3,然后将Value放置到了这些新变量中。注:如果你的数据有多个变量需要处理,则需要使用gather函数将它们压成一列,然后再进行操作。具体类似代码如下:
df <- data.frame(ID = c("20210501", "20210501", "20210502", "20210502", "20210503", "20210503"),
Var1 = c(10, 20, 30, 40, 50, 60),
Var2 = c(1, 2, 3, 4, 5, 6))
df %>%
gather(VarName, VarValue, -ID) %>%
group_by(ID) %>%
mutate(GroupName = ID,
VarName = paste0("NewVar", row_number())) %>%
pivot_wider(names_from = VarName, values_from = VarValue) %>%
select(-GroupName)
``