当前,在Arrow和dplyr中使用full_join可能会产生不同的结果。一个通常的方法是在dplyr中执行full_join,然后将结果转换为Arrow表,这样可以保证结果的准确性。
以下是一个例子,其中我们首先在dplyr中执行full_join,然后将结果转换为Arrow表:
library(dplyr)
library(arrow)
# example data frames
df1 <- data.frame(x = 1:4, y = letters[1:4])
df2 <- data.frame(x = c(1, 2, 5), z = c("foo", "bar", "baz"))
# full join using dplyr
join_result <- full_join(df1, df2, by = "x")
# convert result to Arrow table
join_arrow <- arrow::py_to_r(join_result)
转换为Arrow表来执行full_join可能需要一些额外的时间,但这可以确保结果的正确性。
上一篇:Arrowfunctionvsfunctionvsconst
下一篇:ArrowInvalid:Column4namedinput_idsexpectedlength1000butgotlength328