按日期（ID）进行分组，并在R中从组值和组名中创建3个新列。 _编程开发

按日期（ID）进行分组，并在R中从组值和组名中创建3个新列。

创始人

2024-11-05 09:30:26

0次

可以使用dplyr和tidyr库来实现这个任务。假设我们有一个数据框df，其中包含日期（ID）和值。

示例数据：

library(dplyr)
library(tidyr)

df <- data.frame(ID = c("20210501", "20210501", "20210502", "20210502", "20210503", "20210503"),
                 Value = c(10, 20, 30, 40, 50, 60))

我们可以首先按ID进行分组，然后使用mutate和row_number函数为每个组分配新的组名和组值。最后，使用pivot_wider函数将这些新的变量转换为新的列。

df %>%
  group_by(ID) %>%
  mutate(VarName = paste0("Var", row_number()),
         VarValue = Value,
         GroupName = ID) %>%
  pivot_wider(names_from = VarName, values_from = VarValue) %>%
  select(-GroupName)

输出：

# A tibble: 3 x 4
# Groups:   ID [3]
  ID        Var1  Var2  Var3
        
1 20210501    10    20    NA
2 20210502    30    40    NA
3 20210503    50    60    NA

这里我们使用了paste0创建了新的变量名Var1, Var2, Var3，然后将Value放置到了这些新变量中。注：如果你的数据有多个变量需要处理，则需要使用gather函数将它们压成一列，然后再进行操作。具体类似代码如下：

df <- data.frame(ID = c("20210501", "20210501", "20210502", "20210502", "20210503", "20210503"),
                 Var1 = c(10, 20, 30, 40, 50, 60),
                 Var2 = c(1, 2, 3, 4, 5, 6))

df %>%
  gather(VarName, VarValue, -ID) %>%
  group_by(ID) %>%
  mutate(GroupName = ID,
         VarName = paste0("NewVar", row_number())) %>%
  pivot_wider(names_from = VarName, values_from = VarValue) %>%
  select(-GroupName)
``

上一篇：按日期（dd/mm/yyyy）对多列列表框进行排序

下一篇：按日期（月/日格式）排序数据

按日期（ID）进行分组，并在R中从组值和组名中创建3个新列。

相关内容

热门资讯