在arrow表格中使用separate函数需要使用arrow包中的as_tibble函数将数据框转换为tibble格式,然后再使用tidyr包中的separate函数进行分离操作。以下是代码示例:
library(arrow)
library(tidyr)
# 创建arrow表格
df_arrow <- arrow::ArrowDataFrame(data.frame(x = c("A_B", "C_D_E"), y = 1:2))
# 转换为tibble格式
df_tibble <- as_tibble(df_arrow)
# 分离x列
df_tibble %>% separate(x, into = c("first", "second"), sep = "_")
此代码将把列“x”分成两列“first”和“second”,每个值将使用“_”分隔符进行分离。