当前位置 博文首页 > shiyueyue0822的博客:花书笔记1-数学基础1
因为之前学过李航的那本,所以这里了解的比较好。极大似然估计是当变量服从某一分布时,令情况(数据)出现的概率最大时的参数。
设一个变量服从高斯分布。则对n个数据进行似然估计,可以得到如果让这n个数据发生,则这个变量应服从的高斯分布
?
设多元回归的残差服从标准正太分布,则解出来的和最小二乘法得到的是一样的。
?
找到函数的最大值或最小值
即找到令的。有两种方法:梯度下降法和牛顿法。
2.1 梯度下降法
为什么选择负梯度方向为下降方向?
因为在这个方向上值减少的最快,能最快找到最小值。
为森么在这个方向上下降最快?
令下降方向与x坐标轴夹角为,并且下降长度为。
则在单位长度上下降的大小(即下降速度):
做下变换:
当且仅当两个向量同方向时,值为最大。
即下降最快的方向是梯度方向。
2.2 牛顿法
是个啥?
找到即找到令的。
1)在上做切线,逐渐逼近
2) 让二阶泰勒展开等同于原曲线,则其极小点为原极小点。
?
3.1.等式约束
那么,最优解的点应该同时在上,并且其梯度方向应该共线。即
则,根据以上引入拉格朗日函数:
令其偏导等于0,就得到了KKT条件。这样就将等式约束优化问题转化为无约束优化问题,对KKT条件求解方程组即可。是拉格朗日乘子,有多少个等式约束,就有多少个。
3.2. 不等式约束
当只有1个不等式约束时,那么可以当作等式约束去做。
有多个不等式约束时,
可行域在不等式约束和相交的点上。这时:
那么那些值小于等于0的不等式时不起约束作用的。
对于起约束作用的不等式,在最优解上的梯度方向可以用线性表示,并且系数为正。因为的梯度方向是向增加那个方向走,那么是朝向的方向,而是朝向的方向,因此这里用了的负梯度方向。
即:
那么那些不起约束作用的不等式约束怎么办呢?
令他们的线性表示系数为0啊。
则有:
也可以这么表示:
即这样就把不等式约束问题转变为无约束优化问题,通过求解方程即可得到最优解。
这里引入拉格朗日函数:
对函数求偏导即可得到KKT条件。
如何通俗地讲解对偶问题?尤其是拉格朗日对偶lagrangian duality? - 彭一洋的回答 - 知乎 https://www.zhihu.com/question/58584814/answer/159863739
?
?
cs