如何理解 3D 卷积神经网络核中的参数?-请从以下方面理解:
最编程
2024-04-14 13:26:46
...
[pytorch] torch.nn.Conv3D 的使用介绍_一点也不可爱的王同学的博客-****博客
#构建网络前,首先需要把数据集的张量,整理成input = torch.randn(N, C, D, W, H) #N个小视频;每一帧的通道数为C;视频的时间深度为D;WH代表宽高 #3D卷积核 # m = nn.Conv3d(1, 1, (3, 5, 5), stride=1) # 设计卷积核,时间上的卷积是3,空间上的卷积是5;通道数没变,还是1,可以理解为还是只有一个通道。 #https://pytorch.org/docs/stable/generated/torch.nn.Conv3d.html
对比2D卷积和,多了D,那么D肯定代表时间啊。想什么呢。
-------------------------
stride 本质上就是3D卷积核时间长的大小