当前位置: 首页 > news >正文

(PyTorch)TCN和RNN/LSTM/GRU结合实现时间序列预测

目录

  • I. 前言
  • II. TCN
  • III. TCN-RNN/LSTM/GRU
    • 3.1 TCN-RNN
    • 3.2 TCN-LSTM
    • 3.3 TCN-GRU
  • IV. 实验结果

I. 前言

前面已经写了一系列有关LSTM时间序列预测的文章:

  1. 深入理解PyTorch中LSTM的输入和输出(从input输入到Linear输出)
  2. PyTorch搭建LSTM实现时间序列预测(负荷预测)
  3. PyTorch中利用LSTMCell搭建多层LSTM实现时间序列预测
  4. PyTorch搭建LSTM实现多变量时间序列预测(负荷预测)
  5. PyTorch搭建双向LSTM实现时间序列预测(负荷预测)
  6. PyTorch搭建LSTM实现多变量多步长时间序列预测(一):直接多输出
  7. PyTorch搭建LSTM实现多变量多步长时间序列预测(二):单步滚动预测
  8. PyTorch搭建LSTM实现多变量多步长时间序列预测(三):多模型单步预测
  9. PyTorch搭建LSTM实现多变量多步长时间序列预测(四):多模型滚动预测
  10. PyTorch搭建LSTM实现多变量多步长时间序列预测(五):seq2seq
  11. PyTorch中实现LSTM多步长时间序列预测的几种方法总结(负荷预测)
  12. PyTorch-LSTM时间序列预测中如何预测真正的未来值
  13. PyTorch搭建LSTM实现多变量输入多变量输出时间序列预测(多任务学习)
  14. PyTorch搭建ANN实现时间序列预测(风速预测)
  15. PyTorch搭建CNN实现时间序列预测(风速预测)
  16. PyTorch搭建CNN-LSTM混合模型实现多变量多步长时间序列预测(负荷预测)
  17. PyTorch搭建Transformer实现多变量多步长时间序列预测(负荷预测)
  18. PyTorch时间序列预测系列文章总结(代码使用方法)
  19. TensorFlow搭建LSTM实现时间序列预测(负荷预测)
  20. TensorFlow搭建LSTM实现多变量时间序列预测(负荷预测)
  21. TensorFlow搭建双向LSTM实现时间序列预测(负荷预测)
  22. TensorFlow搭建LSTM实现多变量多步长时间序列预测(一):直接多输出
  23. TensorFlow搭建LSTM实现多变量多步长时间序列预测(二):单步滚动预测
  24. TensorFlow搭建LSTM实现多变量多步长时间序列预测(三):多模型单步预测
  25. TensorFlow搭建LSTM实现多变量多步长时间序列预测(四):多模型滚动预测
  26. TensorFlow搭建LSTM实现多变量多步长时间序列预测(五):seq2seq
  27. TensorFlow搭建LSTM实现多变量输入多变量输出时间序列预测(多任务学习)
  28. TensorFlow搭建ANN实现时间序列预测(风速预测)
  29. TensorFlow搭建CNN实现时间序列预测(风速预测)
  30. TensorFlow搭建CNN-LSTM混合模型实现多变量多步长时间序列预测(负荷预测)
  31. PyG搭建图神经网络实现多变量输入多变量输出时间序列预测
  32. PyTorch搭建GNN-LSTM和LSTM-GNN模型实现多变量输入多变量输出时间序列预测
  33. PyG Temporal搭建STGCN实现多变量输入多变量输出时间序列预测
  34. 时序预测中Attention机制是否真的有效?盘点LSTM/RNN中24种Attention机制+效果对比
  35. 详解Transformer在时序预测中的Encoder和Decoder过程:以负荷预测为例
  36. (PyTorch)TCN和RNN/LSTM/GRU结合实现时间序列预测

时间卷积网络TCN和CNN都是一种利用卷积操作提取特征的模型,CNN是通过卷积层来提取图像中的特征,而TCN则通过时序卷积层来处理时间序列数据。TCN强调如何使用非常深的网络(residual)和膨胀卷积的组合来扩大感受野进而捕捉更广泛的上下文信息。

有关TCN的原理部分不做过多讲解,原理比较简单,下面直接讲解代码。

II. TCN

class Chomp1d(nn.Module):def __init__(self, chomp_size):super(Chomp1d, self).__init__()self.chomp_size = chomp_sizedef forward(self, x):"""裁剪的模块,裁剪多出来的padding"""return x[:, :, :-self.chomp_size].contiguous()class TemporalBlock(nn.Module):def __init__(self, n_inputs, n_outputs, kernel_size, stride, dilation, padding, dropout=0.2):"""相当于一个Residual block:param n_inputs: int, 输入通道数:param n_outputs: int, 输出通道数:param kernel_size: int, 卷积核尺寸:param stride: int, 步长,一般为1:param dilation: int, 膨胀系数:param padding: int, 填充系数:param dropout: float, dropout比率"""super(TemporalBlock, self).__init__()self.conv1 = weight_norm(nn.Conv1d(n_inputs, n_outputs, kernel_size,stride=stride, padding=padding, dilation=dilation))# 经过conv1,输出的size其实是(Batch, input_channel, seq_len + padding)self.chomp1 = Chomp1d(padding)  # 裁剪掉多出来的padding部分,维持输出时间步为seq_lenself.relu1 = nn.ReLU()self.dropout1 = nn.Dropout(dropout)self.conv2 = weight_norm(nn.Conv1d(n_outputs, n_outputs, kernel_size,stride=stride, padding=padding, dilation=dilation))self.chomp2 = Chomp1d(padding)  # 裁剪掉多出来的padding部分,维持输出时间步为seq_lenself.relu2 = nn.ReLU()self.dropout2 = nn.Dropout(dropout)self.net = nn.Sequential(self.conv1, self.chomp1, self.relu1, self.dropout1,self.conv2, self.chomp2, self.relu2, self.dropout2)self.downsample = nn.Conv1d(n_inputs, n_outputs, 1) if n_inputs != n_outputs else Noneself.relu = nn.ReLU()self.init_weights()def init_weights(self):"""参数初始化:return:"""self.conv1.weight.data.normal_(0, 0.01)self.conv2.weight.data.normal_(0, 0.01)if self.downsample is not None:self.downsample.weight.data.normal_(0, 0.01)def forward(self, x):""":param x: size of (Batch, input_channel, seq_len):return:"""out = self.net(x)res = x if self.downsample is None else self.downsample(x)return self.relu(out + res)class TCN(nn.Module):def __init__(self, num_inputs, channels, kernel_size=2, dropout=0.2):""":param num_inputs: int, 输入通道数:param channels: list,每层的hidden_channel数,例如[25,25,25,25]表示有4个隐层,每层hidden_channel数为25:param kernel_size: int, 卷积核尺寸:param dropout: float, drop_out比率"""super(TCN, self).__init__()super().__init__()layers = []num_levels = len(channels)for i in range(num_levels):dilation_size = 2 ** i  # 膨胀系数:1,2,4,8……in_channels = num_inputs if i == 0 else channels[i - 1]  # 确定每一层的输入通道数out_channels = channels[i]  # 确定每一层的输出通道数layers += [TemporalBlock(in_channels, out_channels, kernel_size, stride=1, dilation=dilation_size,padding=(kernel_size - 1) * dilation_size, dropout=dropout)]self.network = nn.Sequential(*layers)def forward(self, x):""":param x: size of (Batch, input_channel, seq_len):return: size of (Batch, output_channel, seq_len)"""x = self.network(x)return x

可以看到这里TCN输入的尺寸是(batch_size, input_channel, seq_len),输出尺寸是(batch_size, output_channel, seq_len)。这与前面讲的文章大致类似,如果需要直接利用TCN得到输出,可以取输出的最后一个时间步,然后经过一个nn.Linear即可得到预测结果,即:

self.fc = nn.Linear(channels[-1], output_size)
x = x[:, :, -1]
x = self.fc(x)

III. TCN-RNN/LSTM/GRU

TCN的输出尺寸为(batch_size, output_channel, seq_len),这天然满足了RNN类模型的输入要求,因此将时序数据先经过TCN再经过RNN等模型是很自然的想法。

3.1 TCN-RNN

TCN-RNN模型搭建如下:

class TCN_RNN(nn.Module):def __init__(self):super(TCN_RNN, self).__init__()self.tcn = TCN(num_inputs=7, channels=[32, 32, 32])self.rnn = nn.RNN(input_size=32, hidden_size=64,num_layers=2, batch_first=True)self.fc = nn.Linear(64, 1)def forward(self, x):x = x.permute(0, 2, 1)  # b i sx = self.tcn(x)  # b h sx = x.permute(0, 2, 1)  # b s hx, _ = self.rnn(x)  # b, s, hx = x[:, -1, :]x = self.fc(x)  # b output_sizereturn x

由于我们构建的输入为(batch_size, seq_len, input_size),而TCN要求的输入为(batch_size, input_channel, seq_len),因此首先需要进行一个permute操作。经过TCN后,输出为(batch_size, output_channel, seq_len),其中output_channelchannels=[32, 32, 32]中最后一个数,即32。

接着RNN的输入应该为(batch_size, seq_len, output_channel),因此还需要经过一个permute。最后利用一个nn.Linear得到这个batch的预测结果。

3.2 TCN-LSTM

相比TCN-RNN,TCN-LSTM只是进行了简单替换:

class TCN_LSTM(nn.Module):def __init__(self):super(TCN_LSTM, self).__init__()self.tcn = TCN(num_inputs=7, channels=[32, 32, 32])self.lstm = nn.LSTM(input_size=32, hidden_size=64,num_layers=2, batch_first=True)self.fc = nn.Linear(64, 1)def forward(self, x):x = x.permute(0, 2, 1)  # b i sx = self.tcn(x)  # b h sx = x.permute(0, 2, 1)  # b s hx, _ = self.lstm(x)  # b, s, hx = x[:, -1, :]x = self.fc(x)  # b output_sizereturn x

3.3 TCN-GRU

TCN-GRU类似:

class TCN_GRU(nn.Module):def __init__(self):super(TCN_GRU, self).__init__()self.tcn = TCN(num_inputs=7, channels=[32, 32, 32])self.gru = nn.GRU(input_size=32, hidden_size=64,num_layers=2, batch_first=True)self.fc = nn.Linear(64, 1)def forward(self, x):x = x.permute(0, 2, 1)  # b i sx = self.tcn(x)  # b h sx = x.permute(0, 2, 1)  # b s hx, _ = self.gru(x)  # b, s, hx = x[:, -1, :]x = self.fc(x)  # b output_sizereturn x

IV. 实验结果

数据集依然选择前边的负荷预测数据集,前24小时的负荷+其余6个变量,预测未来1小时的负荷。由于TCN耗时较长,这里只使用了前5000条数据。

模型效果比较:

模型TCNTCN-RNNTCN-LSTMTCN-GRU
MAPE / %6.915.607.796.75

可以发现TCN-RNN的效果稍好一点,不过以上结果只针对本实验的数据集,并且没有经过调参,因此不具备太多参考性。

相关文章:

  • 避免重复扣款:分布式支付系统的幂等性原理与实践
  • astadmin安装querylist插件Puppeteer
  • 图像分类任务的可视化脚本,生成类别json字典文件
  • Hotspot源码解析-第十七章-虚拟机万物创建(三)
  • 如何使用PHP开发缓存优化图片加载速度
  • Python pip 常用指令
  • 安达发|APS智能排产软件有哪些条件约束功能
  • 2024年AIGC趋势展望:视频生成的“百模大战”
  • 每日一篇英语文章分享-----主目录-----持续更新
  • 蓝凌EIS智慧协同平台 ShowUserInfo.aspx SQL注入漏洞复现
  • vue中常用的指令修饰符
  • JAVA毕业设计118—基于Java+Springboot的宠物寄养管理系统(源代码+数据库)
  • hadoop自动获取时间
  • 通过 Elastic Stack 充分利用电信领域生成式 AI 的力量
  • 年轻人2023消费图鉴,媒介盒子为你揭秘
  • 【347天】每日项目总结系列085(2018.01.18)
  • Angular4 模板式表单用法以及验证
  • Babel配置的不完全指南
  • C++类中的特殊成员函数
  • ES10 特性的完整指南
  • hadoop集群管理系统搭建规划说明
  • iOS 系统授权开发
  • JavaScript 基础知识 - 入门篇(一)
  • Leetcode 27 Remove Element
  • Nodejs和JavaWeb协助开发
  • 电商搜索引擎的架构设计和性能优化
  • 高度不固定时垂直居中
  • 后端_MYSQL
  • 来,膜拜下android roadmap,强大的执行力
  • 力扣(LeetCode)22
  • 巧用 TypeScript (一)
  • 区块链技术特点之去中心化特性
  • 微信公众号开发小记——5.python微信红包
  • 小程序开发之路(一)
  • 用element的upload组件实现多图片上传和压缩
  • RDS-Mysql 物理备份恢复到本地数据库上
  • 翻译 | The Principles of OOD 面向对象设计原则
  • ### Error querying database. Cause: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException
  • (02)vite环境变量配置
  • (3)选择元素——(14)接触DOM元素(Accessing DOM elements)
  • (第一天)包装对象、作用域、创建对象
  • (全部习题答案)研究生英语读写教程基础级教师用书PDF|| 研究生英语读写教程提高级教师用书PDF
  • * 论文笔记 【Wide Deep Learning for Recommender Systems】
  • .net 4.0发布后不能正常显示图片问题
  • .NET 4.0中的泛型协变和反变
  • .NET Core使用NPOI导出复杂,美观的Excel详解
  • .net 反编译_.net反编译的相关问题
  • /etc/apt/sources.list 和 /etc/apt/sources.list.d
  • [ 常用工具篇 ] AntSword 蚁剑安装及使用详解
  • [AIGC] SQL中的数据添加和操作:数据类型介绍
  • [BZOJ1060][ZJOI2007]时态同步 树形dp
  • [C#]winform制作圆形进度条好用的圆环圆形进度条控件和使用方法
  • [CF]Codeforces Round #551 (Div. 2)
  • [C语言]编译和链接
  • [linux] git lfs install 安装lfs