欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

导数与微分

最编程 2024-07-31 17:33:06
...

导数的含义

在深度学习中,导数的含义为:对于模型中的每一个参数,如果我们对这个参数增加或者减少一个无穷小的量,可以观察到损失函数如何相应地快速增加或减少,从而对该参数对模型性能的影响程度有一个度量的标准。

数学定义

导数的数学定义表述为:
f ′ ( x ) = lim ⁡ h → 0 f ( x + h ) − f ( x ) h f'(x)=\lim_{h \to 0} \frac {f(x+h) - f(x)}{h} f(x)=h0limhf(x+h)f(x)

若函数 f f f 在点 a a a 处的导数存在,我们便称函数 f f f a a a 处可微。这里的导数 f ′ ( x ) f'(x) f(x) 表示函数 f ( x ) f(x) f(x) 关于其变量 x x x 的瞬时变化速率。

常用函数微分

以下是一些常用函数的微分操作描述:

  • C ′ = d C d x = 0 C'=\frac {dC} {dx} = 0 C=dxdC=0 C C C 是常数)
  • x n ′ = d x n d x = n x n − 1 {x^n}'=\frac {dx^n} {dx} = nx^{n-1} xn=dxdxn=nxn1
  • e x ′ = d e x d x = e x {e^x}'=\frac {de^x} {dx} = e^x ex=dxdex=ex
  • l n ( x ) ′ = 1 x ln(x)'= \frac {1} {x} ln(x)=x1

常用微分法则

  • 常数相乘法则:
    d d x [ C f ( x ) ] = C d d x f ( x ) \frac d {dx} [Cf(x)] = C \frac d {dx} f(x) dxd[Cf(x)]=Cdxdf(x)
  • 加法法则:
    d d x [ f ( x ) + g ( x ) ] = d d x f ( x ) + d d x g ( x ) \frac d {dx} [f(x)+g(x)] = \frac d {dx} f(x) + \frac d {dx} g(x) dxd[f(x)+g(x)]=dxdf(x)+dxdg(x)
  • 乘法法则:
    d d x [ f ( x ) g ( x ) ] = f ( x ) d d x [ g ( x ) ] + g ( x ) d d x [ f ( x ) ] \frac d {dx} [f(x)g(x)] = f(x) \frac d {dx} [g(x)] + g(x) \frac d {dx} [f(x)] dxd[f(x)g(x)]=f(x)dxd[g(x)]+g(x)dxd[f(x)]
  • 除法法则:
    d d x [ f ( x ) g ( x ) ] = g ( x ) d d x [ f ( x ) ] − f ( x ) d d x [ g ( x ) ] [ g ( x ) ] 2 \frac d {dx} [\frac {f(x)} {g(x)}] = \frac {g(x) \frac d {dx} [f(x)] - f(x) \frac d {dx} [g(x)]} {[g(x)]^2} dxd[g(x)f(x)]=[g(x)]2g(x)dxd[f(x)]f(x)dxd[g(x)]

Python 实现

e . g . e.g. e.g. 定义一个函数 u = f ( x ) = 3 x 2 − 4 x u=f(x)=3x^2-4x u=f(x)=3x24x 以及其导数;

# 函数表达式
def f(x):
    return 3 * x ** 2 - 4 * x

# 导数表达式
def numerical_lim(f, x, h):
    return (f(x + h) - f(x)) / h

深度学习三大数学基础 - 微积分(上)导数与微分;
下一节博文内容:深度学习数学基础 - 微积分(下),包含偏导数、梯度和链式法则。

2024.2.14