机器学习之单变量线性回归
创始人
2024-03-25 23:46:49
0

1、线性回归基础概念:

  • 回归模型:regression model
  • 数据集:包含feature(输入变量)和与之对应的target(输出变量)
  • 训练集:training set
  • 输入数据:x(feature or input feature)
  • 输出数据:y(“target”variable or output variable)
  • (x,y):signal training example
  • m:number of training examples(训练集当中的训练数据有多少组m就是多少)
  • (xi,yi):ith training example
  • y-hat:y头顶一个^符号,表示y的估计值或预测值
    在这里插入图片描述

2、cost function(代价函数):

  • 1、假设单变量线性回归,其模型可以看成:f=wx+b
  • 2、其中w和b可以称为:parameter(参数)、coefficients(系数)、weight(权重)
  • 3、对应的代价函数如下:注意代价函数除2是为了计算方便
    在这里插入图片描述
  • 4、当代价函数最小的时候,模型和数据的拟合度更高,所以我们的目的是让代价函数最小,下图是通过将模型f=wx+b中的b看成0,最终通过w获取最小代价函数的方法。
    在这里插入图片描述
  • 5、通过控制变量法(让b为0),研究w和代价函数之间的关系:
    在这里插入图片描述
    • 可以看出有一个最适合的w对应最小的代价函数,但是从w开始不论增加还是减少,代价函数都会增大。
  • 5、关于代价函数与w和b之间的关系:
    在这里插入图片描述
  • 通过等高线将3D关系转换为2D关系
    在这里插入图片描述
  • 通过(w,b)来对应出一个模型,可以看出改模型拟合程度较差:
    在这里插入图片描述
  • 2D的等高先当中椭圆的中心点就是对应代价函数最小的w和b,由此得到的模型拟合程度较高:
    在这里插入图片描述

3、梯度下降算法

  • 前言:
    • 在线性回归中,不必手动尝试w和b的最佳等高线图,我们可以用代码编写高效的算法自动查找可以使代价函数最小的w和b,从而获取和数据拟合度最高的模型。
    • 线性回归的代价函数J不一定都是上面介绍的那种方差形式,只不过上面那种形式是较为常见,且效果较好的函数。
  • 梯度下降:gradient descent
  • 梯度下降算法适合所有模型
  • 从J(w,b)过渡到更一般使用的J(w1,w2,…wn,b)
  • 对于J(w,b)模型的梯度下降算法而言:keep changing w,b to reduce J(w,b),Until we settle at or near a minimum
  • 梯度下降步骤:
    • 1、找到最陡的方向(环视一周)
    • 2、走一小步
    • 3、重复1步骤
    • 具体可参考下图:
      在这里插入图片描述
  • 梯度下降算法介绍:
    在这里插入图片描述
    • 注意:其中α代表步长也可以叫学习率,后面的导数正负表示下将方向,导数的值也可以改变下降步长,具体可以参考下面两幅图:
      在这里插入图片描述
      在这里插入图片描述
    • 介绍梯度下降算法的推导过程,以及前面在代价函数中为什么要多除一个2
      在这里插入图片描述
    • 梯度下降算法的伪代码表示
      在这里插入图片描述

总结:上述内容,介绍了线性回归基础概念,又介绍了代价函数和梯度下降算法,线性回归是一种机器学习模型,而代价函数就是为了使模型更加准确而提出的一个评价依据,梯度下降算法就是获取最小代价函数的一种算法。

  • 梯度下降算法执行过程:逐渐逼近或到达代价函数最小的位置
    在这里插入图片描述
  • 注意:在上述所讲的单变量线性回归模型中,每一次下降使用的是所有训练样本,所以这种梯度下降算法叫做”批量梯度下降“(Batch gradient descent)

相关内容

热门资讯

保存时出现了1个错误,导致这篇... 当保存文章时出现错误时,可以通过以下步骤解决问题:查看错误信息:查看错误提示信息可以帮助我们了解具体...
汇川伺服电机位置控制模式参数配... 1. 基本控制参数设置 1)设置位置控制模式   2)绝对值位置线性模...
不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
表格中数据未显示 当表格中的数据未显示时,可能是由于以下几个原因导致的:HTML代码问题:检查表格的HTML代码是否正...
本地主机上的图像未显示 问题描述:在本地主机上显示图像时,图像未能正常显示。解决方法:以下是一些可能的解决方法,具体取决于问...
表格列调整大小出现问题 问题描述:表格列调整大小出现问题,无法正常调整列宽。解决方法:检查表格的布局方式是否正确。确保表格使...
不一致的条件格式 要解决不一致的条件格式问题,可以按照以下步骤进行:确定条件格式的规则:首先,需要明确条件格式的规则是...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...