JC Blog
分类
标签
关于
Paper
二〇二二
Paper: ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision
4 月 29 日