不同的图像表示方式:
在计算机视觉领域,图像表示通常使用像素值、特征向量和重建系数三种方式。
像素值表示:直接使用图像中RGB或灰度像素的数值来表示图像。
特征向量表示:使用图像中提取出的特征向量来表示图像。常用的特征向量包括颜色直方图、局部二值模式(LBP)、尺度不变特征变换(SIFT)和速度和边缘方向直方图(HOG)等。
重建系数表示:使用重建系数表示一幅图像。该方法通常使用稀疏表示和压缩感知技术。
论文中评估指标的计算:
计算机视觉领域中常用的评估指标包括精确率、召回率和F1得分。这三个指标通常由混淆矩阵计算得出,混淆矩阵中记录了分类器正确或错误地将测试集中的图像分类的情况。下面是一个示例代码:
from sklearn.metrics import confusion_matrix
# 真实标签
y_true = [0, 1, 0, 0, 1, 1, 0, 1]
# 预测标签
y_pred = [1, 1, 0, 0, 1, 0, 1, 1]
# 混淆矩阵
tn, fp, fn, tp = confusion_matrix(y_true, y_pred).ravel()
# 计算准确率、召回率和F1得分
precision = tp / (tp + fp)
recall = tp / (tp + fn)
f