Explicando o Multi-head Attention no modelo Transformer | Deep Learning e NLP | Leonardo Ribeiro

Описание к видео Explicando o Multi-head Attention no modelo Transformer | Deep Learning e NLP | Leonardo Ribeiro

Transformer 🤖 é uma arquitetura neural 🧠 de extrema importância para os modelos mais recentes de Deep Learning 💻.

O modelo foi desenvolvido em 2017 e revolucionou áreas como Processamento de Linguagem Natural 📚. Várias aplicações modernas em deep learning 🧠 utilizam algum componente do Transformer 🤖 em suas arquiteturas neurais.

Veja a parte 1 antes de assistir a esse vídeo:
Parte 1:    • Modelo Transformer | Mecanismo de ate...  

Neste vídeo entenda como o Transformer 🤖 aprende diferentes relações semânticas entre palavras utilizando o multi-head attention. Também aprenda outros detalhes importantes da arquitetura, como as conexões residuais e normalização de camada.


🚀 Aprendiz do Futuro é um canal para descomplicar Deep Learning / Aprendizado Profundo. A ideia é provocar o pensamento e aguçar o interesse no conhecimento! 🦾

Комментарии

Информация по комментариям в разработке