梯度下降

Coursera Ng 笔记

机器学习

前面我们已经学习了假设函数以及成本函数（一种测量假设函数拟合训练集的好坏程度的方法）。
现在我们需要估计假设函数中的参数，此时，我们常用到梯度下降方法。

对于成本函数，我们可以这样描述：

那么，如何得到这个最优的参数集合呢？

当专门应用于线性回归的情况时，可以推导出一种新的梯度下降方程式。
我们可以用我们的实际成本函数和我们的实际的假设函数来代替，并修改公式：

重复直到收敛: {
$θ_0 := θ_0 $ -$ α\frac{1}{m}\sum_{i=1}^m(h_θ(x_i) - y_i)$
$θ_0 := θ_0 $ -$ α\frac{1}{m}\sum_{i=1}^m((h_θ(x_i) - y_i)x_i)$
}

其中m是训练集的大小，$θ_0$是一个常数，且会和$θ_1$同时改变，而$x_i$和$y_i$是我们的训练集。

可以看到，我们把$θ_j$分成了$θ_0$和$θ_1$两个公式，且由于求导在$θ_1$的最后乘以了$x_i$

所有这一切的关键在于，如果我们从猜测一些假设函数的初始化参数开始，
然后重复应用这些梯度下降方程，我们的假设函数将变得越来越准确。