Как думают LLM?

Описание к видео Как думают LLM?

13 июня в 12:00 по МСК профессор Владимир Крылов, доктор технических наук и научный консультант по применению ИИ в разработке ПО, рассказал о том, как думают LLM. Цель лекции — раскрыть понятие интерпретабельности больших языковых моделей.

В лекции:
- сравнили понятие интерпретации модели в квантовой физике и в задаче вывода LLM;
- увидели, как LLM выполняет сложные рассуждения на основе внутреннего устройства больших языковых моделей и их функционирования с точки зрения программиста;
- рассмотрели иллюстрации на простейшей модели nano-gpt и выводы на основе этого представления;
- познакомились с последними результатами интерпретации LLM с использованием карт активности нейронов.

«В конечном итоге мы могли бы даже запретить такие комбинации нейронов, как ложь, обман, стремление к власти или агрессивные реакции, чтобы модель никогда не генерировала такого рода данные независимо от того, насколько настаивает пользователь. И, может быть, перенести эти возможности на мозг живых существ», – рассказал Владимир Крылов.

Если вы хотите работать в ИТ и в Artezio, отправляйте своё резюме по ссылке https://artezio.ru/openings

Подписывайтесь на телеграм-канал AI4Dev: https://t.me/LLM4dev

00:00 Введение.
00:55 Лекция.
45:05 Вопросы.

Комментарии

Информация по комментариям в разработке