使用 LSTM 预测正弦波
最编程
2024-04-22 09:49:25
...
之前介绍过用LSTM预测天气的例子,该例子中数据集的处理和曲线绘制函数稍微有点复杂。这篇我们使用标准正弦函数做数据集,让代码更简单,来加深我们对LSTM的理解。
首先导入必要的库,并对matplotlib 库做些设置使之能正确显示中文:
# -*- coding: utf-8 -*-
"""
Created on Sun Jan 5 21:08:46 2020
@author: Administrator
"""
from __future__ import absolute_import, division, print_function, unicode_literals
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
准备数据集:
(数据量太大,仅显示最后若干个周期)
def univariate_data(dataset, start_index, end_index, history_size, target_size):
#一段连续数据做data(长度为history_size),紧邻的一个数据做label
#连续滚动,我们就得到了一系列数据和相应的labels
data = []
labels = []
start_index = start_index + history_size
if end_index is None:
end_index = len(dataset) - target_size
for i in range(start_index, end_index):
indices = range(i-history_size, i)
# Reshape data from (history_size,) to (history_size, 1)
data.append(np.reshape(dataset[indices], (history_size, 1)))
labels.append(dataset[i+target_size])
return np.array(data), np.array(labels)
periods = 1000
points_pp = 16 #sine曲线一个周期取多少个点
X = np.arange(0,periods*2*np.pi-2.0*np.pi/points_pp,2.0*np.pi/points_pp)
Y = np.sin(X)
uni_data = Y
#头12k条数据作为训练集,剩下的4k作为验证集
TRAIN_SPLIT = 12000
#数据标准化(减去均值,再除以标准差)
uni_train_mean = uni_data[:TRAIN_SPLIT].mean()
uni_train_std = uni_data[:TRAIN_SPLIT].std()
uni_data = (uni_data-uni_train_mean)/uni_train_std
univariate_past_history = 48 #用48个历史数据点
univariate_future_target = 16 #预测接下来的16个数据点
x_train_uni, y_train_uni = univariate_data(uni_data, 0, TRAIN_SPLIT,
univariate_past_history,
univariate_future_target)
x_val_uni, y_val_uni = univariate_data(uni_data, TRAIN_SPLIT, None,
univariate_past_history,
univariate_future_target)
BATCH_SIZE = 128 # 128 段 数据
BUFFER_SIZE = 1000
#训练集
tf.random.set_seed(666)
train_univariate = tf.data.Dataset.from_tensor_slices((x_train_uni, y_train_uni))
train_univariate = train_univariate.cache().shuffle(BUFFER_SIZE).batch(BATCH_SIZE).repeat()#打乱训练集
#验证集
val_univariate = tf.data.Dataset.from_tensor_slices((x_val_uni, y_val_uni))
val_univariate = val_univariate.batch(BATCH_SIZE).repeat()
创建LSTM模型,并拟合/训练模型:
#创建一个简单的LSTM网络模型
simple_lstm_model = tf.keras.models.Sequential([
tf.keras.layers.LSTM(units=8, input_shape=x_train_uni.shape[-2:],activation="tanh"),#units:输出空间的维度
tf.keras.layers.Dense(1)
])
simple_lstm_model.compile(optimizer='adam', loss='mae')#模型编译,设定优化器和损失类型
#因为数据集很大,为了节省时间,每个EPOCH仅跑400步,没有跑完所有训练数据
EVALUATION_INTERVAL = 400
EPOCHS = 10
simple_lstm_model.fit(train_univariate, epochs=EPOCHS,
steps_per_epoch=EVALUATION_INTERVAL,
validation_data=val_univariate, validation_steps=50)
利用训练好的模型做预测,绘制最后的历史数据并预测未来:
plt.plot(X[-univariate_past_history:],Y[-univariate_past_history:],marker ="o",label ="最后的历史值")
X1 = np.arange(periods*2*np.pi,(periods+1)*2*np.pi - np.pi/8.0 ,np.pi/8.0)
#Y1 = np.sin(X1)
data0 = Y[-univariate_past_history:].copy()
data1 = data0.reshape((1,univariate_past_history,1))
predicts = []
for i in range(univariate_future_target):
predict = simple_lstm_model.predict(data1)
predict = float(predict)
predicts.append(predict)
#依次将最新的预测值(单个点)作为添加到用于预测的数据的末端,首端弹出最旧的值
data1[0, 0:-1] = data1[0, 1:]
data1[0, -1] = predict
plt.plot(X1,predicts,linestyle="--",marker="o",label ="预测值(未来)")
plt.legend(loc="upper right")
plt.title("LSTM sine曲线 预测",fontsize =18)
plt.xlabel('Time')
我们可以看到,预测的数据点很好的反映了正弦曲线的变化趋势。
注意,除了首个预测点以外,对其它点进行预测时,除了用到历史数据外,也会用到一些预测值,所以预测多个点时,误差会积累 (图中预测的幅值大过1)。
下一篇: c# 绘制正弦曲线__简单实现
推荐阅读
-
机器学习:基于 Sklearn 和 XGBoost 框架,使用逻辑回归、支持向量机和 XGBClassifier 诊断和预测一个人是否患有自闭症-4。模型训练
-
使用 LSTM 预测正弦波
-
使用着色器绘制直线、正弦波和余弦波
-
python-pytorch 实现 lstm 模型预测中文文本输出 0.1.02-拆分为数组
-
matlab 使用长短期记忆(LSTM)神经网络对序列数据和代码数据进行分类
-
教您建立多元时间序列预测模型 LSTM(含代码和数据集)
-
NeurIPS 2022 | 最强斗地主AI!网易互娱AI Lab提出基于完美信息蒸馏的方法-完美信息蒸馏(PTIE) 在斗地主游戏中,非完美信息的引入主要是由于三位玩家均不能看到别人的手牌,对于任意一位玩家而言,仅可知道其余两位玩家当前手牌的并集,而难于精准判断每位玩家当前手牌。完美信息蒸馏的思路是针对这种非完美问题,构建一个第三方角色,该角色可以看到三位玩家的手牌,该角色在不告知每位玩家完美信息的情况下通过信息蒸馏的方式引导玩家打出当前情况下合理的出牌。 以强化学习常用的 Actor-Critic 算法为例,PTIE 在 Actor-Critic 算法的应用中可以利用 Critic 的 Value 输出作为蒸馏手段来提升 Actor 的表现。具体而言即在训练中 Critic 的输入为完美信息(包含所有玩家的手牌信息),Actor 的输入为非完美信息(仅包含自己手牌信息),此种情况下 Critic 给予的 Value 值包含了完美信息,可以更好地帮助 Actor 学习到更好的策略。 从更新公式上来看,正常的 Actor-Critic 算法 Actor 更新的方式如下: 在 PTIE 模式下,对于每个非完美信息状态 h,我们可以在 Critic 中构建对应的完美信息状态 D(h),并用 Critic 的输出来更新 Actor 的策略梯度,从而达到完美信息蒸馏的效果。 PTIE 框架的整体结构如下图所示: 无论是训练还是执行过程中智能体都不会直接使用完美信息,在训练中通过蒸馏将完美信息用于提升策略,从而帮助智能体达到一个更高的强度。 PTIE 的另一种蒸馏方式是将完美信息奖励引入到奖励值函数的训练中,PerfectDou 提出了基于阵营设计的完美信息奖励 node reward,以引导智能体学习到斗地主游戏中的合作策略,其定义如下: 如上所示,完美信息部分 代表 t 时刻地主手牌最少几步可以出完,在斗地主游戏中可以近似理解为是距游戏获胜的距离, 代表 t 时刻地主阵营和农民阵营距游戏获胜的距离之差, 为调节系数。通过此种奖励设计,在训练时既可以一定程度地引入各玩家的手牌信息(出完的步数需要知道具体手牌才能计算),同时也鼓励农民以阵营的角度做出决策,提升农民的合作性。 特征构建: PerfectDou 针对牌类游戏的特点主要构建了两部分特征:牌局状态特征和动作特征。其中牌局状态特征主要包括当前玩家手牌牌型特征、当前玩家打出的卡牌牌型特征、玩家角色、玩家手牌数目等常用特征,动作特征主要用于刻画当前状态下玩家的所有可能出牌,包括了每种出牌动作的牌型特征、动作的卡牌数目、是否为最大动作等特征。 牌型特征为 12 * 15 的矩阵,如下图所示: 该矩阵前 4 行代表对应每种卡牌的张数,5-12 行代表该种卡牌的种类和对应位置。 网络结构和动作空间设计 针对斗地主游戏出牌组合数较多的问题,PerfectDou 基于 RLCard 的工作上对动作空间进行了简化,对占比最大的两个出牌牌型:飞机带翅膀和四带二进行了动作压缩,将整体动作空间由 27472 种缩减到 621 种。 PerfectDou 策略网络结构如下图所示: 策略网络结构同样分为两部分:状态特征部分和动作特征部分。 在状态特征部分,LSTM 网络用于提取玩家的历史行为特征,当前牌局状态特征和提取后的行为特征会再通过多层的 MLP 网络输出当前的状态信息 embedding。 在动作特征部分,每个可行动作同样会经过多层 MLP 网络进行编码,编码后的动作特征会与其对应的状态信息 embedding 经过一层 MLP 网络计算两者间的相似度,并经由 softmax 函数输出对应的动作概率。 实验结果
-
股票价格预测 | Python 使用 GAN 预测股票价格 - 文章概述
-
基于双向长短期神经网络的风力预测、基于格鲁的风力预测 - LSTM 的基本定义
-
PyTorch 深度学习项目 100 例】--基于 pytorch 使用 LSTM 实现本篇新闻的分类任务 | 例 9