8.softmax回归

创始人

2024-03-16 16:31:13

0次

1. 关于回归和多类分类

在这里插入图片描述

分类问题从回归的单输出变成了多输出，这个多输出的个数=类别的个数
置信度：置信度一词来自统计学，而统计学的本质是，用抽样的数据去估计整体的真实分布。例如，样本均值估计整体均值；还有，频率近似概率。而置信度的含义就是，你在用样本估计整体的时候，所得到的结论的“可信程度”，或者说，是对自己所的结论的一个量化的概率评价（打分）

2.从回归到多分类–均方损失

在这里插入图片描述

假设有n个类别，那么可以用最简单的一位有效编码来进行编码，标号就是一个长为n的向量。这个向量中，只有一个元素为1，对应的下标是第i个类别，其余元素为0。
如果训练出了一个模型，在做预测的时候，选取i使得最大化Oi的置信度的值作为预测，这个i就是预测的标号

3. 从回归到多类分类–无校验比例

在这里插入图片描述
正确类y的置信度oy要远远大于其他非正确类的oi，写成数学就是希望oy-oi要大于某一个阈值（oi是预测其他类的概率，oy是预测正确类的概率）

4. 从回归到多类分类–校验比例

在这里插入图片描述
希望使得输出是一个概率，现在的输出是o1～on的向量，将softmax作用到o上看，得到一个长为n的向量y_hat，每个元素非负，且相加为1.

5. softmax 和交叉熵损失

在这里插入图片描述
解释：假设标签y将是一个三维向量，其中（1，0，0）对应于“猫”、（0，1，0）对应于“鸡”、（0，0，1）对应于“狗”：

在这里插入图片描述
现在去预测一个样本，假设这个样本是鸡，也就是真实的概率是y=[0，1，0]，而我们经过softmax预测之后得到的预测概率是y_hat= [0.1，0.8，0.1]，那么：

损失函数l（y，y_hat） = -0* 0.1 - 1* 0.8 - 0* 0.1 = -1 * 0.8 ，得到的就是对于真实类别y预测得到的概率y_hat。因为真实样本向量中只有一个为1，其余为0，那么上图中的计算结果中的右下角的y就是表示，这个样本的真实类别y。

对于真实类别的预测值求log，再求负数，所以可以看出，对分类问题来讲，不关心对对于非正确类的预测值，我们只关心对于正确类的预测值，它的置信度要够大

下面对于如何得到梯度的过程进行展开：

在这里插入图片描述

最后，根据计算结果可以发现，梯度就等于预测概率和真实概率的差值。

6. 总结

softmax回归是一个多类分类问题
使用softmax操作值得到每个类的预测置信度（概率，非负，和相加为1）
使用交叉熵来衡量预测和标号的区别（用交叉熵做损失函数）

上一篇：metaRTC新增SRS的WebRTC over TCP和turn的TCP支持

下一篇：大数据项目 --- 电商数仓(一)

相关内容

热门资讯

保存时出现了1个错误，导致这篇... 当保存文章时出现错误时，可以通过以下步骤解决问题：查看错误信息：查看错误提示信息可以帮助我们了解具体...

汇川伺服电机位置控制模式参数配... 1. 基本控制参数设置 1）设置位置控制模式 2）绝对值位置线性模...

不能访问光猫的的管理页面光猫是现代家庭宽带网络的重要组成部分，它可以提供高速稳定的网络连接。但是，有时候我们会遇到不能访问光...

不一致的条件格式要解决不一致的条件格式问题，可以按照以下步骤进行：确定条件格式的规则：首先，需要明确条件格式的规则是...

本地主机上的图像未显示问题描述：在本地主机上显示图像时，图像未能正常显示。解决方法：以下是一些可能的解决方法，具体取决于问...

表格列调整大小出现问题问题描述：表格列调整大小出现问题，无法正常调整列宽。解决方法：检查表格的布局方式是否正确。确保表格使...

表格中数据未显示当表格中的数据未显示时，可能是由于以下几个原因导致的：HTML代码问题：检查表格的HTML代码是否正...

Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限：此外...

【NI Multisim 14... 目录序言一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...

银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介：银河麒麟高级服务器操作系统V10是针对企业级关键业务...