在AWS GroundTruth中,置信度“0”的标注可能会产生误导性的影响,影响模型的建立和精度。因此,我们可以通过以下步骤来解决这一问题:
1.使用AWS SDK或命令行工具创建AWS GroundTruth的作业。
2.在创建作业时,设置输出标注任务的标记条件,排除置信度为“0”的标记。
下面是AWS Python SDK的示例代码:
import boto3
sagemaker = boto3.client('sagemaker')
job_name = 'job-name'
s3_output = 's3://output-bucket/results'
def create_groundtruth_job(image, input_manifest, output_manifest):
input_data = {'DataSource': {'S3DataSource': {'ManifestS3Uri': input_manifest}}}
output_data = {'S3OutputPath': s3_output, 'OutputConfig': {'S3OutputPath': output_manifest},
'LabelAttributeName': 'bbox', 'LabelCategoryConfigS3Uri': 's3://config-bucket/categoryConfig.json'}
task_data = {'AnnotationConsolidationConfig': {'AnnotationConsolidationLambdaArn': 'arn:lambda:function'}}
filtering_data = {'HumanTaskConfig': {'HITConfig': {'NumberOfHumanWorkersPerDataObject': 1},
'TaskAvailabilityLifetimeInSeconds': 86400,
'TaskDescription': 'Describe task',
'TaskTitle': 'Task Title'}, 'UiConfig': {'UiTemplateS3Uri': 's3://ui-bucket/template.html'}}
response = sagemaker.create_labeling_job(LabelingJobName=job_name, InputData=input_data,
OutputData=output_data, RoleArn='arn:aws:iam::role', LabelAttributeName='Answer.semantic_segmentation.labels',
HumanTaskConfig=filtering_data, LabelCategoryConfigS3Uri='s3://categoryConfig.json', TaskData=task_data)
return response
在这个示例中,我们使用了LabelAttributeName
参数来设置标注条件,排除掉了置信度为“0”的标记。同时,我们还使用了response
对象来存储API响应和创建的作业的元数据。
通过这种方法,我们就可以有效地解决AWS GroundTruth中置信度“0”的标注对模型建立的影响问题。