您可以使用以下代码示例来逐行读取和写入文件的 AWS Lambda 函数:
import boto3
def lambda_handler(event, context):
# 创建 s3 客户端
s3_client = boto3.client('s3')
# 指定要读取和写入的文件名称和桶
input_bucket = 'your-input-bucket'
input_file = 'your-input-file.txt'
output_bucket = 'your-output-bucket'
output_file = 'your-output-file.txt'
# 从 S3 下载文件
response = s3_client.get_object(Bucket=input_bucket, Key=input_file)
lines = response['Body'].read().decode().split('\n')
# 逐行处理文件内容
processed_lines = []
for line in lines:
# 在这里可以添加自定义的处理逻辑
# 例如,将每一行转换为大写
processed_line = line.upper()
processed_lines.append(processed_line)
# 将处理后的内容写入新的文件
processed_content = '\n'.join(processed_lines)
s3_client.put_object(Body=processed_content.encode(), Bucket=output_bucket, Key=output_file)
return {
'statusCode': 200,
'body': 'File processed successfully'
}
请确保您已经安装了 boto3
库,并正确配置了 AWS Lambda 的执行角色,使其具有读取和写入 S3 的权限。
在上述示例中,我们首先使用 boto3
创建了一个 S3 客户端。然后,我们指定要读取和写入的文件的桶名和文件名。接下来,我们使用 s3_client.get_object
从 S3 下载文件,并将其读取为字符串,然后使用换行符 \n
将其拆分为行。然后,我们使用一个循环遍历每一行,并在此处添加自定义的处理逻辑。在本示例中,我们将每一行转换为大写,并将其添加到 processed_lines
列表中。最后,我们使用 s3_client.put_object
将处理后的内容写入新的文件。
请根据您的具体需求和文件格式进行适当的修改和调整。