New Paper: Masked Autoencoders Are Scalable Vision Learners

carbocation · November 14, 2021, 1:55am

(Meta-comment: I’m actually not sure which forum this would best fit into - seems like it would be useful to have a place where we can discuss new papers.)

This new work by Kaiming He et al seems pretty interesting - they use a very simple setup for masking during pre-training a ViT and it looks like they get very good results across a variety of tasks.

So far, I see an implementation by lucidrains.

Topic		Replies	Views
How to use I-JEPA for image classficiation 🤗Transformers	4	1696	December 6, 2024
Reproducing and Extending BEIT Flax/JAX Projects	4	1197	July 24, 2021
Denoising Autoencoder (DAE) tutorial? Beginners	0	330	November 7, 2023
Inference with VitMAE by providing a mask 🤗Transformers	0	264	January 3, 2024
Fill mask model that supports multiple masks Beginners	1	431	October 20, 2022

New Paper: Masked Autoencoders Are Scalable Vision Learners

Related topics