0glamour
  • Joined on Jun 17, 2020

Transformer架构已广泛应用于自然语言处理领域。本模型的作者发现,Vision Transformer(ViT)模型在计算机视觉领域中对CNN的依赖不是必需的,直接将其应用于图像块序列来进行图像分类时,也能得到和目前卷积网络相媲美的准确率。

Updated 1 year ago Python

Updated 2 years ago Python