JC Blog
  • 分类
  • 标签
  • 关于

Paper

二〇二二

  • Paper: ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision 4 月 29 日