Синергия раннего опыта и агентной контекстной инженерии (ACE) создаёт мощную двухконтурную архитектуру для автономного самосовершенствования ИИ. Парадигма раннего опыта действует как тактическая сенсорная система агента, генерируя непрерывный поток необработанных, обоснованных обучающих сигналов посредством исследования альтернативных действий и наблюдения за их немедленными, не приносящими вознаграждения последствиями.
Эти необработанные эмпирические данные затем поступают в фреймворк агентной контекстной инженерии, который функционирует как стратегический когнитивный мозг агента. Здесь Рефлектор анализирует этот опыт, чтобы выделить высокоуровневые принципы, а Куратор хирургически интегрирует их в развивающуюся, подробную «книгу игр» — постоянную базу знаний стратегий и ловушек, которая позволяет избежать разрушительных ловушек контекстного коллапса и предвзятости краткости.
Это создает эффективный цикл: структурированная мудрость сценария ACE делает будущие исследования агента более интеллектуальными и эффективными, что, в свою очередь, обеспечивает более богатые и детальные данные для дальнейшего совершенствования сценария, позволяя агенту перейти от простого реагирования на окружающую среду к стратегическому накоплению опыта.
@stanford @UCBerkeley
Все права принадлежат авторам:
Инженерия контекста агента: развивающиеся контексты для самосовершенствования
Языковые модели
Цичжэн Чжан 1, Чангран Ху 2, Шубханги Упасани 2, Боюань Ма 2, Фэнлу Хун 2,
Вамсидхар Камануру 2, Джей Рейнтон 2, Чэнь У 2, Мэнмэн Цзи 2, Ханчен Ли 3,
Урмиш Таккер 2, Джеймс Цзоу 1, Кунле Олукотун 1,
из
1 Стэнфордский университет
2 SambaNova Systems, Inc.
3 Калифорнийский университет в Беркли
Препринт №2:
«Обучение агентов на основе раннего опыта»
Кай Чжан 1, 3, ◦, ⋆, Сянчао Чэнь 3, ⋆, Бо Лю 2, ⋆, Тяньцы Сюэ3,⋆, Цзэй Ляо3,⋆, Чжихан Лю1,⋆, Сияо Ван1,⋆,
Юйтин Нин3,⋆, Чжаорунь Чэнь1,⋆, Сяохань Фу1, Цзянь Се3, Юйсюань Сунь3, Бою Гоу3, Ци Ци1, Цзиханг Мэн1,
Цзяньвэй Ян1, Нин Чжан1, Сянь Ли2, Ашиш Шах1, Дат Хуинь1, Хэндуо Ли1, Цзы Ян1, Сара Цао1,
Лоуренс Чан1, Шуян Чжоу1,⋆, Цзячэн Чжу1,⋆, Хуан Сунь3,⋆, Джейсон Уэстон2,⋆, Юй Су3,†, Ифань Ву1,†
от
1 Лаборатория Мета Суперинтеллекта,
2 ЯРМАРКА в Мете,
3 Университет штата Огайо
#объяснениеискусствомаискуства
#машинноеобучение
#объяснениенауки #Стэнфордскийуниверситет
Информация по комментариям в разработке