代码

最编程 2024-06-30 15:14:30

...

# 本书链接https://tangshusen.me/Dive-into-DL-PyTorch/#/
# 7.2 梯度下降和随机梯度下降
# 注释：黄文俊
# E-mail：hurri_cane@qq.com

from matplotlib import pyplot as plt
import numpy as np
import torch
import math
import sys
sys.path.append("..")
import d2lzh_pytorch as d2l

def gd(eta):
    x = 10
    results = [x]
    for i in range(10):
        x -= eta * 2 * x  # f(x) = x * x的导数为f'(x) = 2 * x
        results.append(x)
    print('epoch 10, x:', x)
    return results


def show_trace(res):
    n = max(abs(min(res)), abs(max(res)), 10)
    f_line = np.arange(-n, n, 0.1)
    d2l.set_figsize()
    d2l.plt.plot(f_line, [x * x for x in f_line])
    d2l.plt.plot(res, [x * x for x in res], '-o')
    d2l.plt.xlabel('x')
    d2l.plt.ylabel('f(x)')
    plt.show()

# 学习率适中
show_trace(gd(0.2))

# 学习率过小
show_trace(gd(0.05))

# 学习率过大
show_trace(gd(1.1))


# 7.2.3 多维梯度下降
def train_2d(trainer):  # 本函数将保存在d2lzh_pytorch包中方便以后使用
    x1, x2, s1, s2 = -5, -2, 0, 0  # s1和s2是自变量状态，本章后续几节会使用
    results = [(x1, x2)]
    for i in range(20):
        x1, x2, s1, s2 = trainer(x1, x2, s1, s2)
        results.append((x1, x2))
    print('epoch %d, x1 %f, x2 %f' % (i + 1, x1, x2))
    return results

def show_trace_2d(f, results):  # 本函数将保存在d2lzh_pytorch包中方便以后使用
    d2l.plt.plot(*zip(*results), '-o', color='#ff7f0e')
    x1, x2 = np.meshgrid(np.arange(-5.5, 1.0, 0.1), np.arange(-3.0, 1.0, 0.1))
    d2l.plt.contour(x1, x2, f(x1, x2), colors='#1f77b4')
    d2l.plt.xlabel('x1')
    d2l.plt.ylabel('x2')
    plt.show()

eta = 0.1

def f_2d(x1, x2):  # 目标函数
    return x1 ** 2 + 2 * x2 ** 2

def gd_2d(x1, x2, s1, s2):
    return (x1 - eta * 2 * x1, x2 - eta * 4 * x2, 0, 0)



show_trace_2d(f_2d, train_2d(gd_2d))


# 随机梯度下降
def sgd_2d(x1, x2, s1, s2):
    return (x1 - eta * (2 * x1 + np.random.normal(0.1)),
            x2 - eta * (4 * x2 + np.random.normal(0.1)), 0, 0)

show_trace_2d(f_2d, train_2d(sgd_2d))



print("*"*50)

上一篇：云计算】从Serverless谈边缘计算的未来；从物理机到Kubernetes的那些坑与启示

下一篇： qq_71055578 的博客

代码

C++ 源代码生成 - 序言

桥接模式的解释和代码实现

令人震惊！原来，贡献开放源代码如此简单，几分钟就能上手！

微服务开源框架 TARS RPC 源代码初识 TARS C++ 服务器端

[Flutter] 基本入门：基本代码结构

机器学习捷径：自动特征工程综合分析（附代码示例）

[wpf] 07 后台身份验证和令牌代码获取第 2 步数据获取

峰值筹码"，巧妙利用筹码峰值捕捉底部启动买入信号！源代码

基于 SpringBoot+Vue+uniapp 微信小程序的婚纱摄影小程序的详细设计与实现（源代码+lw+部署文档+说明等）

海洋基地离线开发和代码承诺实践分享

代码

C++ 源代码生成 - 序言

桥接模式的解释和代码实现

令人震惊！原来，贡献开放源代码如此简单，几分钟就能上手！

微服务开源框架 TARS RPC 源代码初识 TARS C++ 服务器端

[Flutter] 基本入门：基本代码结构

机器学习捷径：自动特征工程综合分析（附代码示例）

[wpf] 07 后台身份验证和令牌代码获取 第 2 步 数据获取

峰值筹码"，巧妙利用筹码峰值捕捉底部启动买入信号！源代码

基于 SpringBoot+Vue+uniapp 微信小程序的婚纱摄影小程序的详细设计与实现（源代码+lw+部署文档+说明等）

海洋基地离线开发和代码承诺实践分享

[wpf] 07 后台身份验证和令牌代码获取第 2 步数据获取