当我们使用BigQuery的WRITE_APPEND模式写入数据时,会将新的数据追加到现有表格的末尾,而不是替换或覆盖原有数据。这意味着如果我们使用同样的表名和模式插入新数据,那么新数据会被追加到现有表格的末尾并保存。下面是一个Python样例代码,展示如何使用WRITE_APPEND模式将新数据添加到现有表格:
from google.cloud import bigquery
# 初始化客户端
client = bigquery.Client()
# 定义要追加数据的目标表格
table_id = "project.dataset.table"
# 定义新数据
rows_to_insert = [(1, "John"), (2, "Jane"), (3, "Bob")]
# 定义目标表格的模式
schema = [
bigquery.SchemaField("id", "INTEGER"),
bigquery.SchemaField("name", "STRING"),
]
# 进行数据写入操作
# WriteDisposition.WRITE_APPEND表示追加模式
table = client.get_table(table_id)
errors = client.insert_rows(table, rows_to_insert, selected_fields=schema,
overwrite=False, write_disposition='WRITE_APPEND')
if errors == []:
print("Data inserted successfully.")
这个代码示例使用BigQuery的Python客户端库来追加新数据到现有表格中。我们首先定义了目标表格的名称,并创建了一个Python列表,其中包含了我们要插入的新数据。我们还需定义目标表格的模式,这样BigQuery就能自动解析新数据的类型。最后,我们使用BigQuery的insert_rows方法向目标表格中写入新数据。注意,我们在这个方法中指定了WRITE_APPEND模式,以确保新数据被追加到现有表格的末尾而不是替换原数据。