可以使用Python SDK调用AWS Sagemaker终端点并计算调用延迟。以下是示例代码:
import boto3
import time
# 设置AWS配置
region = "us-west-2"
sagemaker = boto3.client('sagemaker', region_name=region)
# 设置终端点名称
endpoint_name = 'my-endpoint'
# 准备输入数据
input_data = '{"data": [[1,2,3,4,5]]}'
# 计算调用延迟
start_time = time.time()
response = sagemaker.invoke_endpoint(
EndpointName=endpoint_name,
Body=input_data,
ContentType='application/json'
)
end_time = time.time()
latency = (end_time - start_time) * 1000
print("调用延迟为 {}ms".format(int(latency)))
这个代码片段利用Boto3 Python SDK来调用AWS Sagemaker终端点。它对一个包含输入数据的JSON字符串调用终端点并记录调用的开始和结束时间。最后,计算调用的延迟并把结果打印出来。