时间序列预测 (VI) - 循环神经网络 (RNN)
目录
一、RNN的基本原理
1、正向传播(Forward Pass):
2、计算损失(Loss Calculation)
3、反向传播——反向传播通过时间(Backpropagation Through Time,BPTT)
4、梯度更新:
二、RNN的常用结构
1、N——N结构
2、N——1结构
3、1——N结构
4、N——M结构(Encoder-Decoder,也称Seq2Seq)
三、RNN的优缺点
四、梯度消失与梯度爆炸
五、RNN的改进模型
六、代码实现
往期文章:
时间序列预测(一)——线性回归(linear regression)-****博客
时间序列预测(二)——前馈神经网络(Feedforward Neural Network, FNN)-****博客
前面有提到前馈神经网络,下图是两者的区别对比
特性 | 前馈神经网络(FNN) | 循环神经网络(RNN) |
结构 | 无循环连接,数据单向流动 | 有循环连接,数据可流过多个时间步 |
适用任务 | 静态任务,无时间依赖 | 动态任务,包含时间依赖 |
记忆能力 | 无法记忆前一时刻信息 | 通过隐藏状态记忆前一时刻信息 |
梯度计算 | 反向传播(BP) | 反向传播通过时间(BPTT) |
常见问题 | 无梯度消失或爆炸问题 | 易出现梯度消失或爆炸问题 |
适用场景 | 图像分类、静态预测 | 时间序列预测、文本生成、语音识别 |
循环神经网络(Recurrent Neural Network,RNN)是一种专门用于处理序列数据的神经网络结构,它能够处理时间序列数据,并预测未来的数据变化趋势。RNN能够处理序列中的时间依赖性,因而非常适合时间序列预测。以下是对RNN在时间序列预测中的详细分析:
一、RNN的基本原理
RNN的基本原理是在神经网络中引入时间的概念,使得网络可以处理序列数据。RNN的基本结构是一个循环单元,它包含一个输入层、一个隐藏层和一个输出层。在每一个时间步上,网络接收一个输入向量和一个隐藏状态向量,通过一个非线性函数对它们进行组合,然后产生一个输出向量和一个新的隐藏状态向量,作为下一个时间步的输入和隐藏状态。这种反馈机制可以使得网络记忆之前的信息,并在处理序列数据时考虑到历史信息。
1、正向传播(Forward Pass):
-
输入层:
- RNN的输入是一个序列,表示为 X=[x1,x2,…,xT],其中 T 是序列长度,xt 表示在时间 t 的输入值。
-
隐藏层:
- RNN 的特殊之处在于隐藏层具有循环连接,使得每个时刻的隐藏层状态都能从前一时刻的状态(隐状态)中获得信息。具体来说,RNN 会在每个时间步更新隐藏状态 ht:
-
输出层:
RNN 的输出 yt依赖于当前隐藏状态 ht:
2、计算损失(Loss Calculation)
选择合适的损失函数,计算每个时间步 ttt 的损失值 Lt,将所有时间步上的损失求和,得到整个序列的总损失 L:
3、反向传播——反向传播通过时间(Backpropagation Through Time,BPTT)
在计算总损失后,通过BPTT算法沿时间维度反向传播误差,计算每个时间步上的梯度。
因为隐藏状态在每个时间步都传递到下一个时间步,所以需要在时间上展开 RNN,形成一个“展开的计算图”,并在这个图上逐步反向传播。对于每个时间步的参数(如 Wh和 Wx),需要计算梯度:
(注意:由于隐藏状态 hth_tht 依赖于所有之前的状态,所以当前时间步的梯度受多个时间步的误差影响。)
4、梯度更新:
计算出参数的梯度后,通常使用优化器(如 SGD、Adam 等)来更新模型参数。随着每个时间步梯度的反向传播,BPTT算法会依次更新所有权重,以最小化损失。
为了减小计算量,提出了截断 BPTT,它 是一种优化的 BPTT 方法,通过限制反向传播的时间步数来减少计算量。它按固定长度(如 10 或 20 步)的窗口,将长序列分成若干个较短的子序列,每个子序列独立进行正向和反向传播。在每个子序列结束时,重置梯度,但隐藏状态在各子序列间保持连续,以保留长程依赖信息。
最后,需要注意在PyTorch中,RNN的输入数据通常是一个形状为(batch_size, sequence_length, input_size)
的张量,输出数据通常是一个二维张量,其形状为(batch_size, output_size)
或是三维张量(batch_size, sequence_length, output_size)
(对于序列输出)。
其中,
-
batch_size
:表示批次中样本的数量。 -
sequence_length
:表示序列的长度。 -
input_size和
output_size
:表示每个时间步骤的输入和输出的特征数量
所以要将数据进行转化。这里是与FNN是不一样的,多了一个序列长度,所以RNN 可以一次性输入和输出多个时间步的特征和目标,RNN 才是真正可以处理序列数据的,而 FNN 处理的是单个独立样本。
因此,当 sequence_length=1
时,RNN 变得和 FNN 类似,但仍保持了 RNN 的结构。在这种情况下,使用 RNN 可能会显得有些多余,因为 FNN 可以实现相同的功能,而不需要引入 RNN 的复杂性。
二、RNN的常用结构
1、N——N结构
输入与输出:输入是x1,x2,.....xn,输出为y1,y2,...yn。输入和输出序列是等长的。
应用场景:由于这种结构的输入输出长度一致,因此它适用于生成等长度的序列,如合辙的诗句等。此外,它还可用于计算视频中每一帧的分类标签,因为要对每一帧进行计算,所以输入和输出序列等长。
2、N——1结构
输入与输出:输入是一个序列,而输出是一个单独的值,不是序列。
处理方式:这种结构通常在最后一个隐层输出h上进行线性变换,以得到所需的输出值。为了更明确地表示结果,还可以使用sigmoid或softmax函数进行处理。
应用场景:这种结构经常被应用在文本分类问题上,如输入一段文字判别它所属的类别,或输入一个句子判断其情感倾向等。
3、1——N结构
输入与输出:输入不是序列,而输出为序列。
应用场景:这种结构可以处理从非序列数据生成序列数据的问题,如从图像生成文字(image caption)。此时,输入X是图像的特征,而输出的y序列就是一段句子,就像看图说话一样。 或是
4、N——M结构(Encoder-Decoder,也称Seq2Seq)
输入与输出:输入和输出为不等长的序列。
结构组成:这种结构由编码器和解码器两部分组成,两者的内部结构都是某类RNN。输入数据首先通过编码器,最终输出一个隐含变量c(上下文语义向量)。之后,使用这个隐含变量c作用在解码器解码的每一步上,以保证输入信息被有效利用。
应用场景:这是RNN的一个重要变种,也是应用最广的RNN模型结构。由于其输入输出不受限制,它被广泛应用于机器翻译、阅读理解、文本摘要等众多领域。在机器翻译中,源语言和目标语言的句子往往没有相同的长度,因此N——M结构特别适用于此类任务。 或是
局限性:编码和解码之间的唯一联系是固定长度的语义向量c。编码时,整个序列的信息需要被压缩进一个固定长度的语义向量c中,这可能导致信息丢失或覆盖。因此,对于较长的输入序列,解码效果可能会受到影响。
改进:为了弥补N——M结构的局限性,提出了注意力(Attention)机制。注意力机制通过在每个时间输入不同的c来解决问题,它允许解码器在解码时能够关注输入序列的不同部分,从而提高了解码的准确性和灵活性。
三、RNN的优缺点
优点:RNN具有记忆功能,能够处理变长的序列数据,并捕捉到序列中的时序信息。同时,RNN的权重参数是共享的,这有助于减少模型的参数数量并提高计算效率。RNN可以根据输入和输出的不同结构进行灵活调整。
缺点:在长序列任务中,RNN容易出现梯度消失或梯度爆炸的问题,导致模型难以训练。RNN的计算效率相对较低,因为需要在每个时间步都进行前向传播和反向传播的计算。
四、在Python中的代码解释
1、模型定义
class RNNModel(nn.Module):
def __init__(self, input_size, hidden_size, num_layers):
super(RNNModel, self).__init__()
self.hidden_size = hidden_size
self.num_layers = num_layers
self.rnn = nn.RNN(input_size, hidden_size, num_layers, batch_first=True) # 使用RNN
self.fc = nn.Linear(hidden_size, 1) # 输出层
def forward(self, x):
# 初始化隐藏状态
h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
# 前向传播
out, _ = self.rnn(x, h0) # RNN输出形状为 (batch_size, seq_length, hidden_size)
out = self.fc(out[:, -1, :]) # 只取最后一个时间步的输出
return out
# 实例化模型
input_size = window_size + 2 # 输入特征维度
hidden_size = 64 # 隐藏层大小
num_layers = 2 # RNN层数
model = RNNModel(input_size, hidden_size, num_layers)
(1)类定义:RNNModel
RNNModel
类继承自nn.Module
,这是PyTorch中所有神经网络模块的基类。
a、初始化__init__
调用父类的__init__
方法外,还定义了模型的一些关键属性:
-
input_size
:输入特征的大小(维度)。 -
hidden_size
:RNN隐藏层的大小(即隐藏层中神经元的数量)。 -
num_layers
:RNN的层数(即堆叠的RNN单元的数量)。 -
self.rnn
:这是模型中的RNN层,batch_first=True
意味着输入张量的第一个维度是批次大小(batch size)。 -
self.fc
:这是一个全连接层(也称为线性层),将RNN的最后一个时间步的输出映射到模型的最终输出。这里,输出层的大小被设置为1,这意味着模型将输出一个标量值。
b、前向传播forward
首先初始化隐藏状态h0
。隐藏状态是一个零张量,其形状为(num_layers, batch_size, hidden_size)
,并且被发送到与输入x
相同的设备上(CPU或GPU)。
接着,使用RNN层处理输入x
和初始隐藏状态h0
。RNN层的输出out
是一个形状为(batch_size, seq_length, hidden_size)
的张量,其中seq_length
是序列的长度。
然后,只取RNN输出的最后一个时间步(out[:, -1, :]
),并通过全连接层self.fc
进行处理,得到模型的最终输出。
(2)实例化模型
指定输入特征维度input_size
,隐藏层大小hidden_size
,和RNN层数num_layers
来实例化RNNModel
类。用于训练、验证和测试,以处理序列数据并预测目标值。
2、参数形状转化(注意)
x_train、
x_test
、y_train
和 y_test本身是从excel表格读取的
一维数组,但在PyTorch中,RNN的输入数据形状为(batch_size, sequence_length, input_size)
的张量,输出数据形状为(batch_size, output_size)
或(batch_size, sequence_length, output_size)
(对于序列输出)。因此x_train
和 x_test
被转换为形状为 [batch_size, 1, window_size + 2]
的三维张量,而 y_train
和 y_test
被转换为形状为 [batch_size, 1]
的二维张量。
(1)数据类型转换:
使用 torch.tensor()
将数据转换为 PyTorch 张量,并指定数据类型为 torch.float32
。这是为了确保数据格式与 PyTorch 模型兼容。
(2)形状重塑:
.view(-1, 1, window_size + 2)
和 .view(-1, 1)
是用于重塑张量的方法。
-1
在 .view()
方法中是一个特殊值,表示该维度的大小将自动计算,以确保总元素数量保持不变。
对于 x_train
和 x_test
,重塑后的形状为 [batch_size, seq_len, input_size]
。其中:
batch_size
是自动计算的,基于原始数据的总元素数量和后面两个维度的大小。
seq_len
是 1
,表示每个样本被视为一个序列,表示每个样本只包含一个时间步的数据
input_size
是 window_size + 2
,表示每个时间步的输入特征数量。
对于 y_train
和 y_test
,重塑后的形状为 [batch_size, 1]
,其中 batch_size
是自动计算的,1表示每个样本目标值被视为一个序列,只包含一个时间步的数据。具体如下:
五、梯度消失与梯度爆炸
时间序列预测(七)——梯度消失(Vanishing Gradient)与梯度爆炸-****博客
六、RNN的改进模型
为了克服RNN的缺点并提高其性能,研究人员提出了多种改进模型,其中最具代表性的是长短期记忆(LSTM)和门控循环单元(GRU)。
具体看下面这两篇文章:
后面补齐
七、具体代码实现
同之前的文章一样,根据一个包含道路曲率(Curvature)、车速(Velocity)、侧向加速度(Ay)和方向盘转角(Steering_Angle)真实的数据集,去预测未来的方向盘转角。
1、选择道路曲率、车速和历史方向盘转角(这里取了五个时刻的历史方向盘转角)这三个(7个)作为特征,采用RNN训练
(但这样其实就如上文所说的,会显得有些多余,正常应该直接输入多个时间步的特征,按下一种方法,这一个可以直接跳过)。
# RNN网络
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error as mae, r2_score
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler
import numpy as np
# 1. 数据预处理
# 读取数据
data = pd.read_excel('input_data_20241010160240.xlsx') # 替换为你的数据文件路径
# 提取特征和标签
labels = data['Steering_Angle'].values
features = data[['Curvature', 'Velocity']].values # 使用 NumPy 数组
# 添加历史方向盘转角作为特征 (假设历史窗口长度为5)
window_size = 5
history_features = []
for i in range(window_size, len(data)):
past_angles = labels[i - window_size:i]
history_features.append(list(past_angles))
features = features[window_size:]
labels = labels[window_size:]
# 合并特征
features = np.hstack((features, history_features))
# 归一化
scaler_x = StandardScaler()
scaler_y = StandardScaler()
features = scaler_x.fit_transform(features)
labels = scaler_y.fit_transform(labels.reshape(-1, 1))
# 划分训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(features, labels, test_size=0.2)
# 将特征转换为三维张量,形状为 [样本数, 时间序列长度, 特征数]
x_train_tensor = torch.tensor(x_train, dtype=torch.float32).view(-1, 1, window_size + 2) # [batch_size, seq_len, input_size]
y_train_tensor = torch.tensor(y_train, dtype=torch.float32).view(-1, 1)
x_test_tensor = torch.tensor(x_test, dtype=torch.float32).view(-1, 1, window_size + 2)
y_test_tensor = torch.tensor(y_test, dtype=torch.float32).view(-1, 1)
# 2. 创建RNN模型
class RNNModel(nn.Module):
def __init__(self, input_size, hidden_size, num_layers):
super(RNNModel, self).__init__()
self.hidden_size = hidden_size
self.num_layers = num_layers
self.rnn = nn.RNN(input_size, hidden_size, num_layers, batch_first=True) # 使用RNN
self.fc = nn.Linear(hidden_size, 1) # 输出层
def forward(self, x):
# 初始化隐藏状态
h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
# 前向传播
out, _ = self.rnn(x, h0) # RNN输出形状为 (batch_size, seq_length, hidden_size)
out = self.fc(out[:, -1, :]) # 只取最后一个时间步的输出
return out
# 实例化模型
input_size = window_size + 2 # 输入特征维度
hidden_size = 64 # 隐藏层大小
num_layers = 2 # RNN层数
model = RNNModel(input_size, hidden_size, num_layers)
# 3. 设置损失函数和优化器
criterion = nn.MSELoss() # 均方误差损失
optimizer = optim.Adam(model.parameters(), lr=0.001) # Adam优化器
# 4. 训练模型
num_epochs = 1000
for epoch in range(num_epochs):
model.train()
# 前向传播
outputs = model(x_train_tensor)
loss = criterion(outputs, y_train_tensor)
# 后向传播和优化
optimizer.zero_grad()
loss.backward()
optimizer.step()
if (epoch + 1) % 100 == 0:
print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')
# 5. 预测
model.eval()
with torch.no_grad():
y_pred_tensor = model(x_test_tensor)
y_pred = scaler_y.inverse_transform(y_pred_tensor.numpy()) # 将预测值逆归一化
y_test = scaler_y.inverse_transform(y_test_tensor.numpy()) # 逆归一化真实值
# 评估指标
r2 = r2_score(y_test, y_pred)
mae_score = mae(y_test, y_pred)
print(f"R^2 score: {r2:.4f}")
print(f"MAE: {mae_score:.4f}")
# 支持中文
plt.rcParams['font.sans-serif'] = ['SimSun'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
# 绘制实际值和预测值的对比图
plt.figure(figsize=(10, 6))
plt.plot(range(len(y_test)), y_test, label='实际值', color='blue')
plt.plot(range(len(y_pred)), y_pred, label='预测值', color='red')
plt.xlabel('样本索引')
plt.ylabel('Steering Angle')
plt.title('实际值与预测值对比图')
plt.legend()
plt.grid(True)
plt.show()
结果;
2、
使用更长的序列来捕捉历史信息,而不需要手动构造历史特征
关键点
- 特征构造:现在自动从历史的曲率、速度和方向盘转角构造特征。
-
输入形状:最终的输入形状为
(batch_size, window_size, 3)
,其中3
表示三个特征(曲率、速度和方向盘转角)。
具体代码如下:
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error as mae, r2_score
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler
import numpy as np
# 1. 数据预处理
# 读取数据
data = pd.read_excel('input_data_20241010160240.xlsx') # 替换为你的数据文件路径
# 提取特征和标签
labels = data['Steering_Angle'].values
curvature = data['Curvature'].values
velocity = data['Velocity'].values
# 添加历史特征,包括方向盘转角 (假设历史窗口长度为5)
window_size = 5
features = []
for i in range(window_size, len(data)):
history_curvature = curvature[i - window_size:i]
history_velocity = velocity[i - window_size:i]
history_steering = labels[i - window_size:i] # 添加历史方向盘转角
features.append(np.hstack((history_curvature, history_velocity, history_steering)))
# 转换为 NumPy 数组并形成标签
features = np.array(features)
labels = labels[window_size:]
# 归一化
scaler_x = StandardScaler()
scaler_y = StandardScaler()
features = scaler_x.fit_transform(features)
labels = scaler_y.fit_transform(labels.reshape(-1, 1))
# 划分训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(features, labels, test_size=0.2)
# 将特征转换为三维张量,形状为 [样本数, 时间序列长度, 特征数]
x_train_tensor = torch.tensor(x_train, dtype=torch.float32).view(-1, window_size, 3) # [batch_size, seq_len, input_size]
y_train_tensor = torch.tensor(y_train, dtype=torch.float32).view(-1, 1)
x_test_tensor = torch.tensor(x_test, dtype=torch.float32).view(-1, window_size, 3)
y_test_tensor = torch.tensor(y_test, dtype=torch.float32).view(-1, 1)
# 2. 创建RNN模型
class RNNModel(nn.Module):
def __init__(self, input_size, hidden_size, num_layers):
super(RNNModel, self).__init__()
self.hidden_size = hidden_size
self.num_layers = num_layers
self.rnn = nn.RNN(input_size, hidden_size, num_layers, batch_first=True) # 使用RNN
self.fc = nn.Linear(hidden_size, 1) # 输出层
def forward(self, x):
# 初始化隐藏状态
h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(x.device)
# 前向传播
out, _ = self.rnn(x, h0) # RNN输出形状为 (batch_size, seq_length, hidden_size)
out = self.fc(out[:, -1, :]) # 只取最后一个时间步的输出
return out
# 实例化模型
input_size = 3 # 每个时间步的输入特征数(曲率、速度和方向盘转角)
hidden_size = 64 # 隐藏层大小
num_layers = 2 # RNN层数
model = RNNModel(input_size, hidden_size, num_layers)
# 3. 设置损失函数和优化器
criterion = nn.MSELoss() # 均方误差损失
optimizer = optim.Adam(model.parameters(), lr=0.001) # Adam优化器
# 4. 训练模型
num_epochs = 1000
for epoch in range(num_epochs):
model.train()
# 前向传播
outputs = model(x_train_tensor)
loss = criterion(outputs, y_train_tensor)
# 后向传播和优化
optimizer.zero_grad()
loss.backward()
optimizer.step()
if (epoch + 1) % 100 == 0:
print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')
# 5. 预测
model.eval()
with torch.no_grad():
y_pred_tensor = model(x_test_tensor)
y_pred = scaler_y.inverse_transform(y_pred_tensor.numpy()) # 将预测值逆归一化
y_test = scaler_y.inverse_transform(y_test_tensor.numpy()) # 逆归一化真实值
# 评估指标
r2 = r2_score(y_test, y_pred)
mae_score = mae(y_test, y_pred)
print(f"R^2 score: {r2:.4f}")
print(f"MAE: {mae_score:.4f}")
# 支持中文
plt.rcParams['font.sans-serif'] = ['SimSun'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
# 绘制实际值和预测值的对比图
plt.figure(figsize=(10, 6))
plt.plot(range(len(y_test)), y_test, label='实际值', color='blue')
plt.plot(range(len(y_pred)), y_pred, label='预测值', color='red')
plt.xlabel('样本索引')
plt.ylabel('Steering Angle')
plt.title('实际值与预测值对比图')
plt.legend()
plt.grid(True)
plt.show()
结果:
参考文献:
《动手学深度学习》 — 动手学深度学习 2.0.0 documentation (d2l.ai)
神经网络算法 - 一文搞懂RNN(循环神经网络)-****博客
完全图解RNN、RNN变体、Seq2Seq、Attention机制 - 知乎 (zhihu.com)
别忘了给这篇文章点个赞哦,非常感谢。我也正处于学习的过程,如果有问题,欢迎在评论区留言讨论,一起学习!
上一篇: C语言_通讯录
推荐阅读
-
时间序列预测 (VI) - 循环神经网络 (RNN)
-
【视频】Python用LSTM长短期记忆神经网络对不稳定降雨量时间序列进行预测分析|数据分享|附代码数据
-
神经网络、拉索回归、线性回归、随机森林、ARIMA 股票价格时间序列预测|使用代码数据
-
[论文阅读](StemGNN)用于多变量时间序列预测的频谱时间图神经网络
-
包婷婷 (201550484)作业一 统计软件简介与数据操作-SPSS(Statistical Product and Service Solutions),"统计产品与服务解决方案"软件。最初软件全称为"(SolutionsStatistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为"统计产品与服务解决方案",标志着SPSS的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。 1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。 R统计软件介绍 R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。 与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。 该语言的语法表面上类似 C,但在语义上是函数设计语言(functional programming language)的变种并且和Lisp 以及 APL有很强的兼容性。特别的是,它允许在"语言上计算"(computing on the language)。这使得它可以把表达式作为函数的输入参数,而这种做法对统计模拟和绘图非常有用。 R是一个免费的*软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的。在R主页那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。 二、R语言 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个*、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。 R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R还有以下特点: 1.R是*软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。[2] 2.R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如,SPSS,SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。[2] 3. 所有R的函数和数据集是保存在程序包里面的。只有当一个包被载入时,它的内容才可以被访问。一些常用、基本的程序包已经被收入了标准安装文件中,随着新的统计分析方法的出现,标准安装文件中所包含的程序包也随着版本的更新而不断变化。在另外版安装文件中,已经包含的程序包有:base一R的基础模块、mle一极大似然估计模块、ts一时间序列分析模块、mva一多元统计分析模块、survival一生存分析模块等等.[2] 4.R具有很强的互动性。除了图形输出是在另外的窗口处,它的输入输出窗口都是在同一个窗口进行的,输入语法中如果出现错误会马上在窗口口中得到提示,对以前输入过的命令有记忆功能,可以随时再现、编辑修改以满足用户的需要。输出的图形可以直接保存为JPG,BMP,PNG等图片格式,还可以直接保存为PDF文件。另外,和其他编程语言和数据库之间有很好的接口。[2] 5.如果加入R的帮助邮件列表一,每天都可能会收到几十份关于R的邮件资讯。可以和全球一流的统计计算方面的专家讨论各种问题,可以说是全世界最大、最前沿的统计学家思维的聚集地.[2] R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。 R的语法是来自Scheme。R的使用与S-PLUS有很多类似之处,这两种语言有一定的兼容性。S-PLUS的使用手册,只要稍加修改就可作为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。 但是请不要忘了:R是免费的(R is free)。R语言源代码托管在github,具体地址可以看参考资料。[3] 。 R语言的下载可以通过CRAN的镜像来查找。 R语言有域名为.cn的下载地址,有六个,其中两个由Datagurn,由 中国科学技术大学提供的。R语言Windows版,其中由两个下载地点是Datagurn和 USTC提供的。 三、stata Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。 新版本的STATA采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。Stata提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。 除此之外,Stata软件可以透过网络实时更新每天的最新功能,更可以得知世界各地的使用者对于STATA公司提出的问题与解决之道。使用者也可以透过Stata. Journal获得许许多多的相关讯息以及书籍介绍等。另外一个获取庞大资源的管道就是Statalist,它是一个独立的listserver,每月交替提供使用者超过1000个讯息以及50个程序。 四、PYTHON
-
采用 RNN 循环神经网络、LSTM 长短期记忆网络的* tecdat|R 语言实现时间序列长期利率预测
-
RNN 循环神经网络,用于时间序列长期利率预测的 LSTM 长期短期记忆网络|含代码数据
-
RNN 循环神经网络,用于时间序列长期利率预测的 LSTM 长期短期记忆网络|含代码数据
-
Topend tecdat:PYTHON利用LSTM长短期记忆神经网络的参数优化方法预测时间序列洗发水销售数据
-
bp 神经网络时间序列预测 python 代码