数据分析与数据挖掘 - 06 线性代数

最编程 2024-05-06 17:08:54

...

一导数的意义

导数是高等数学中非常重要的知识点，也是人工智能的算法应用中比较常用的一个知识，这一章我们的重点就是讲解一下导数和其求导法则。首先我们来看一下导数的基本概念:函数的变化率，即函数的变化速度，叫做函数的导数。设函数y = f(x) 在函数x0的某邻域内有定义，当x在点x0有增量∆x（x0+∆x仍在该邻域内）。这时y=f(x)有增量∆y=f(x0+∆x)-f(x0)，当∆x无限趋近于零时，∆y/∆x存在，则这个极限值就叫做函数y=f(x)在点x0处的导数，公式如下：

导数的公式除了以上的写法，还可以写作下边的这种方式：

此时，我们称函数f(x)在x0处可导，当然我们也可以使用导数的几何意义-斜率来理解，如下图所示：

我们可以把导数理解为函数在几何曲线中某一点处切线的斜率，在这基础上加一个拓展，也很好理解。函数可导一定连续，但连续不一定可导。如果你感兴趣，可以证明一下这个过程，但我们现在记住这个定理就可以。

二导数的求导法则

1 加减运算的求导法则

若函数u = u(x) 和 v = v(x) 在点x处可导，则函数 y = u+v 在点x处也必可导，并且 (u + v)' = u' + v'，其证明过程如下：

2 函数积的求导法则

若函数u = u(x) 和 v = v(x) 在点x处可导，则函数 y = uv 在点x处也必可导，并且 (uv)' = u'v + v'u，其证明过程也是类似的，这里我们不再花费篇幅论证了，有兴趣的同学可以自己验证一下。

3 函数商的求导法则

若函数u = u(x) 和 v = v(x) 在点x处可导，并且v(x)在点x处不为0，则函数 y = u/v 在点x处也必可导，并且 (u/v)' = （u'v - v'u)/v^2，其证明过程也是类似的，这里我们不再花费篇幅论证了，有兴趣的同学可以自己验证一下。

4 导数常见的公式

学习导数时，有一些基本公式需要我们记住的，虽然我们可以推导出其过程，但是这一些公式就相当于定理一样，记住就好，这样就不用每一次都自己去推导了。下面是一些常见的公式：

5 复合函数的求导法则

若函数u = k(x) 在点x处可导，y=f(u) 在点u处可导，则复合函数 f = [k(x)] 在点x处也必可导，并且 f(x)' = y_u'*u_x'，其证明过程稍微你有点麻烦，具体过程如下：

多说一句，虽然我们可以通过Numpy及SciPy这样的科学计算库轻松实现导数计算，并且也可以轻松的实现矩阵、微分、积分等运算，但只有我们掌握其推导过程，才能够真正明白未来要学习的那些算法真正的意义。

三矩阵乘法运算

像下图中，将数列排成m行n列后，然后用括号将它们围起来，我们将这种形式的组合叫做矩阵。

我们将其中的m和n分别叫做行标和列标，由m行和n列数排成的矩阵又称作mn矩阵或m行n列矩阵，就像下边这样。

我们把其中的数字叫做元素，比如有一个矩阵是[1,2]，那么元素就是1和2，当行数和列数相等时，我们把这样的矩阵称之为"n阶方阵"。

这个时候我们把对角线上的元素叫做对角元素。矩阵的出现，简化了方程组的书写方式，比如像下图中的简写方式：

下面让我们来看一下如何进行矩阵运算吧，首先我们来看一下矩阵的"和"运算，矩阵的"和"运算就是其对应位置相加的运算，如下图所示：

矩阵的减法也很简单，就是把上边的加号变成减号，我们下边看一下矩阵的倍数运算吧。

倍数运算也是一种特殊的矩阵的"积"运算，现在我们来学习一下矩阵的"积"运算吧。

另外有一点需要注意，两个矩阵相乘，如果交换位置，那么结果是不一样，我们举一个例子来展示一下：

显然，矩阵的积运算交换位置之后的结果是不同的。现在我们考虑一个问题，这个问题就是两个符合什么形状的矩阵才能够进行相乘的运算？这个问题的答案是只有左边矩阵的列数等于右边矩阵的行数时，两个矩阵才能够进行乘法运算，也就是必须要是mn的矩阵与n*p的矩阵来做运算，因为运算的时候是第一个矩阵的列数与第二个矩阵的行数来做运算的。接下来我们再来一起认识一下一些特殊的矩阵。零矩阵：所有的元素都为0的矩阵。