在BigQuery中,View和Materialized views是两种SQL查询结果缓存的方式,它们有着不同的用途和性能。
View是一个虚拟的表,它存储了SQL查询的定义。每次查询View时,实际上是执行了这个定义对应的SQL语句,然后返回结果。因此,View只保存了查询的定义,而没有实际存储查询结果。这意味着每次查询View时,都会重新计算结果,即使查询的结果没有发生变化。View适用于经常需要查询的数据,而且查询结果很少会改变的场景。
例如,我们可以创建一个View来查询BigQuery中的样例数据集shakespeare中出现频率最高的单词:
CREATE VIEW top_words AS
SELECT word, SUM(word_count) as count
FROM `bigquery-public-data.samples.shakespeare`
GROUP BY word
ORDER BY count DESC
LIMIT 1000
Materialized view则是通过实际存储查询结果来避免重复计算的。它会在第一次查询时执行查询定义,并保存查询结果到物理表中。之后,每次查询Materialized view时,实际上是查询物理表而不是重新计算查询定义对应的SQL语句。这可以大大加快查询速度,但也会占用存储空间,因为Materialized view可能需要存储大量的数据。Materialized view适用于需要频繁查询的数据,而且查询结果改变的频率较低的场景。
例如,我们可以创建一个Materialized view来保存shakespeare数据集中每个单词每日出现次数的情况:
CREATE MATERIALIZED VIEW daily_word_counts AS
SELECT
DATE(timestamp) AS date,
word,
SUM(word_count) AS count
FROM
`bigquery-public-data.samples