AWS MSK S3 Sink Connector在没有模式注册表的情况下反序列化AVRO
创始人
2024-11-17 10:00:29
0

要在没有模式注册表的情况下反序列化AVRO,可以使用Confluent的Schema Registry客户端库进行手动解析和反序列化AVRO消息。下面是一个示例代码,演示了如何使用AWS MSK S3 Sink Connector将AVRO消息写入S3,并在不使用模式注册表的情况下进行反序列化:

import com.amazonaws.services.s3.AmazonS3;
import com.amazonaws.services.s3.AmazonS3ClientBuilder;
import com.amazonaws.services.s3.model.ObjectMetadata;
import io.confluent.kafka.serializers.AbstractKafkaAvroDeserializer;
import org.apache.avro.generic.GenericRecord;
import org.apache.commons.io.IOUtils;
import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.TopicPartition;
import org.apache.kafka.common.serialization.StringDeserializer;

import java.io.ByteArrayInputStream;
import java.io.InputStream;
import java.nio.charset.StandardCharsets;
import java.util.Collections;
import java.util.Properties;

public class AvroDeserializerWithoutRegistry {

    public static void main(String[] args) {
        String topic = "your-topic";
        String bootstrapServers = "your-bootstrap-servers";
        String s3Bucket = "your-s3-bucket";
        String s3KeyPrefix = "your-s3-key-prefix";

        Properties props = new Properties();
        props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, bootstrapServers);
        props.put(ConsumerConfig.GROUP_ID_CONFIG, "avro-consumer");
        props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);
        props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class);

        KafkaConsumer consumer = new KafkaConsumer<>(props);
        consumer.subscribe(Collections.singletonList(topic));

        AmazonS3 s3Client = AmazonS3ClientBuilder.defaultClient();

        while (true) {
            ConsumerRecords records = consumer.poll(100);
            for (ConsumerRecord record : records) {
                String key = record.key();
                String avroPayload = record.value();

                // Deserialize AVRO payload
                byte[] avroBytes = avroPayload.getBytes(StandardCharsets.ISO_8859_1);
                GenericRecord genericRecord = deserializeAvro(avroBytes);

                // Upload AVRO payload to S3
                String s3Key = s3KeyPrefix + key + ".avro";
                ObjectMetadata metadata = new ObjectMetadata();
                metadata.setContentLength(avroBytes.length);
                InputStream inputStream = new ByteArrayInputStream(avroBytes);
                s3Client.putObject(s3Bucket, s3Key, inputStream, metadata);
                IOUtils.closeQuietly(inputStream);
            }
            consumer.commitSync();
        }
    }

    private static GenericRecord deserializeAvro(byte[] avroBytes) {
        // Replace "your-schema" with your actual AVRO schema
        String schema = "your-schema";
        AbstractKafkaAvroDeserializer deserializer = new AbstractKafkaAvroDeserializer() {
            @Override
            protected Object deserialize(String topic, Boolean isKey, byte[] payload) {
                return null;
            }
        };
        deserializer.configure(Collections.singletonMap("schema.registry.url", ""), false);
        return (GenericRecord) deserializer.deserialize("", avroBytes, schema);
    }
}

请确保替换代码中的以下值:

  • your-topic:要消费的Kafka主题
  • your-bootstrap-servers:Kafka集群的引导服务器地址
  • your-s3-bucket:要将AVRO消息写入的S3存储桶
  • your-s3-key-prefix:用于AVRO消息在S3中的键前缀
  • your-schema:用于AVRO消息的实际模式

在上述代码中,我们使用了AbstractKafkaAvroDeserializer类来手动反序列化AVRO消息,替代了通常使用的模式注册表。然后,我们使用AWS SDK将AVRO消息上传到S3存储桶中。

请注意,由于没有使用模式注册表,我们需要手动提供AVRO模式。在示例代码中,将"your-schema"替换为您的AVRO模式。

相关内容

热门资讯

保存时出现了1个错误,导致这篇... 当保存文章时出现错误时,可以通过以下步骤解决问题:查看错误信息:查看错误提示信息可以帮助我们了解具体...
汇川伺服电机位置控制模式参数配... 1. 基本控制参数设置 1)设置位置控制模式   2)绝对值位置线性模...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
不一致的条件格式 要解决不一致的条件格式问题,可以按照以下步骤进行:确定条件格式的规则:首先,需要明确条件格式的规则是...
本地主机上的图像未显示 问题描述:在本地主机上显示图像时,图像未能正常显示。解决方法:以下是一些可能的解决方法,具体取决于问...
表格列调整大小出现问题 问题描述:表格列调整大小出现问题,无法正常调整列宽。解决方法:检查表格的布局方式是否正确。确保表格使...
表格中数据未显示 当表格中的数据未显示时,可能是由于以下几个原因导致的:HTML代码问题:检查表格的HTML代码是否正...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...