AWS Transcribe不支持matroska和webm音频格式。要解决此问题,您可以使用FFmpeg库将音频文件转换为Transcribe支持的格式,例如WAV或MP3。以下是一个示例代码,演示如何使用FFmpeg转换音频文件格式:
import subprocess
input_file = "input.webm"
output_file = "output.wav"
# 使用FFmpeg将音频文件转换为WAV格式
subprocess.run(["ffmpeg", "-i", input_file, output_file])
# 调用AWS Transcribe API 对转换后的WAV文件进行语音转文本
# (使用AWS SDK或其他方式调用Transcribe API)
# 删除临时生成的WAV文件
subprocess.run(["rm", output_file])
请确保您的系统中安装了FFmpeg,并将其添加到系统的环境变量中。您可以通过运行ffmpeg -version
来验证FFmpeg是否正确安装。
请注意,这只是一个示例代码,您可能需要根据您的具体情况进行适当的调整和错误处理。