В этом видео я провожу тест в реальных условиях, используя два сценария путешествий и три режима ИИ, чтобы посмотреть, насколько хорошо современные инструменты ИИ справляются с тем, что многие из нас делают постоянно: бронированием авиабилетов.
Я часто трачу много времени на ручное сравнение вариантов, особенно при планировании поездок на конференции. Поскольку инструменты ИИ становятся все более совершенными, мне хотелось узнать: могут ли они действительно найти рейс, который лучше (и быстрее) соответствует всем моим предпочтениям, чем я сам?
Для проверки этого я разработал два контролируемых эксперимента и провел каждый из них, используя три различные конфигурации ИИ:
(i) режим мышления ChatGPT
(ii) режим агента ChatGPT
(iii) режим агента ChatGPT внутри браузера Atlas
Это позволило провести четкое сравнение на разных уровнях сложности.
---------------------------------------------------------
ЧТО ДЕЛАЕТ ЭТОТ ЭКСПЕРИМЕНТ
Я оценивал каждый инструмент ИИ, используя свой собственный «показатель удобства», который учитывает цену, пересадки, время ожидания, предпочтения альянса и приемлемые временные интервалы прибытия/отправления.
Эксперимент 1: Простой маршрут туда и обратно
Хьюстон → Гонолулу → Хьюстон
Простая, структурированная поездка, с которой большинство инструментов для планирования путешествий должны хорошо справляться.
Эксперимент 2: Маршрут по нескольким городам
Чикаго → Атланта → Даллас → Чикаго
Более сложный маршрут через три крупных хаба американских авиакомпаний, что является более сложной задачей, требующей более интеллектуальной оптимизации.
В каждом эксперименте я просил все три режима ИИ искать рейсы, применять мои конкретные ограничения и возвращать три лучших варианта с оценкой удобства по 10-балльной шкале.
Затем я сравнивал все девять результатов с рейсами, которые я бы выбрал вручную.
---------------------------------------------------------
ЧТО МЫ УЗНАЛИ
Все три режима показали очень хорошие результаты в Эксперименте 1, возвращая надежные, разумные варианты рейсов.
Но Эксперимент 2 выявил существенные различия: Режим агента в браузере Atlas оказался самым эффективным.
Итог:
Для простых задач, связанных с путешествиями, подходит любой режим. Но для сложных маршрутов с несколькими городами режим Agent Mode с браузером Atlas Browser оказался явно наиболее эффективным.
---------------------------------------------------------
РАЗДЕЛЫ
00:00 — Мотивация и введение
02:55 — Экспериментальный дизайн
05:29 — Эксперимент 1
11:01 — Эксперимент 2
17:28 — Итоговое сравнение
19:36 — Итоговый вердикт
-------------------------------------------------------------
ОБО МНЕ
Меня зовут доктор Мим Рахими, и я доцент кафедры экологической инженерии в Университете Хьюстона. Мои исследования сосредоточены на электрохимическом улавливании углерода и инновационных климатических технологиях, но на этом канале я исследую вопросы, которые лично меня интересуют, на стыке искусственного интеллекта и академической жизни. В ходе реальных экспериментов я проверяю, как новые инструменты ИИ ведут себя в исследовательских, преподавательских и научных рабочих процессах, и открыто делюсь результатами, чтобы другие тоже могли извлечь из них пользу.
---------------------------------------------------------
Музыкальное сопровождение
Трек: Rain Over Kyoto Station; Источник: Аудиобиблиотека YouTube; Лицензия: Бесплатная
-------------------------------------------------------------
Информация по комментариям в разработке