尝试使用pyarrow库而非fastparquet库来读取Parquet文件。以下是使用pyarrow库来读取Parquet文件的示例代码:
import awswrangler as wr
import pyarrow.parquet as pq
s3_path = "s3://my-bucket/my-file.parquet"
dataset = pq.ParquetDataset(s3_path, filesystem=wr.s3.get_fs())
table = dataset.read()
这将使用pyarrow库来读取Parquet文件并将数据加载到pyarrow表中,而无需使用AWS Wrangler库。
如果您需要使用AWS Wrangler库来读取Parquet文件,则可以尝试升级到最新版本以查看是否解决了该问题。您还可以尝试使用不同的数据类型来表示布尔值,例如使用整数(0或1)来表示布尔值,并在读取数据时将其转换为布尔类型。
import awswrangler as wr
s3_path = "s3://my-bucket/my-file.parquet"
df = wr.s3.read_parquet(s3_path, dataset=True, use_threads=True)
df["my_boolean_column"] = df["my_boolean_column"].astype(bool)