rose1sblue

于2017年提出的I3D是由3D卷积+Two-Stream方法的结合形成一个新的网络架构。I3D(Two-Stream Inflated 3D ConvNets)模型是由2DCNN Inception-V1扩张而来,并且可以使用在ImageNet上预训练的参数,实验结果表明这个模型在各个标准数据集上都取得了当时最好的结果。另外论文中还公布了新的Human Action Video 数据:Kinetics,它有400个人类动作类以及每个类超过400个片段,收集自现实的、具有挑战性的网络视频。

Updated 6 months ago Python