Intellectual Data Analysis. Lecture 15: Vision Transformer. Connecting Texts and Images

Описание к видео Intellectual Data Analysis. Lecture 15: Vision Transformer. Connecting Texts and Images

Трансформер для опрацювання зображень (ViT). Навчання на контрастах: архітектура CLIP. Генерація зображень за текстовим описом: DALL-Е-1, GLIDE, DALLE-2.

Комментарии

Информация по комментариям в разработке