Logo video2dn
  • Сохранить видео с ютуба
  • Категории
    • Музыка
    • Кино и Анимация
    • Автомобили
    • Животные
    • Спорт
    • Путешествия
    • Игры
    • Люди и Блоги
    • Юмор
    • Развлечения
    • Новости и Политика
    • Howto и Стиль
    • Diy своими руками
    • Образование
    • Наука и Технологии
    • Некоммерческие Организации
  • О сайте

Скачать или смотреть CITP Seminar Stephan Rabanser - Towards a Science of AI Agent Reliability

  • CITP Princeton
  • 2026-02-12
  • 50
CITP Seminar Stephan Rabanser - Towards a Science of AI Agent Reliability
  • ok logo

Скачать CITP Seminar Stephan Rabanser - Towards a Science of AI Agent Reliability бесплатно в качестве 4к (2к / 1080p)

У нас вы можете скачать бесплатно CITP Seminar Stephan Rabanser - Towards a Science of AI Agent Reliability или посмотреть видео с ютуба в максимальном доступном качестве.

Для скачивания выберите вариант из формы ниже:

  • Информация по загрузке:

Cкачать музыку CITP Seminar Stephan Rabanser - Towards a Science of AI Agent Reliability бесплатно в формате MP3:

Если иконки загрузки не отобразились, ПОЖАЛУЙСТА, НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если у вас возникли трудности с загрузкой, пожалуйста, свяжитесь с нами по контактам, указанным в нижней части страницы.
Спасибо за использование сервиса video2dn.com

Описание к видео CITP Seminar Stephan Rabanser - Towards a Science of AI Agent Reliability

AI agents are increasingly performing consequential tasks autonomously: writing code, making purchases, and providing advice. But how do we know when to trust them? Current evaluation focuses predominantly on success rates: how often does the agent complete the task? This misses critical questions about how agents behave: Do they give the same answer twice? Do they fail gracefully when conditions change? Can they tell us when they’re likely to be wrong? Drawing on decades of practice from aviation, nuclear power, and other safety-critical domains, we propose a framework that decomposes reliability into four dimensions: consistency, robustness, predictability, and safety. Evaluating 12 frontier AI models, we find a striking result: despite rapid capability improvements over 18 months, reliability has barely budged. Agents that are substantially more accurate remain inconsistent across runs and poorly calibrated about their own uncertainty. The implication is clear: building capable AI is not the same as building dependable AI. As agents take on higher-stakes tasks, we need evaluation practices that ask not just “does it work?” but “can we count on it?”

Bio:

Stephan Rabanser works on trustworthy machine learning, with a particular focus on uncertainty quantification, selective prediction, and out-of-distribution generalization/robustness. At a high level, his research aims to improve the reliability of machine learning systems under uncertainty and distribution shift. Rabanser develops principled yet practical methods that help models understand what they know—and crucially, when they should abstain—whether by quantifying predictive uncertainty, deferring to expert models, or rejecting unfamiliar inputs. He also studies how models can generalize reliably under distribution shift, with applications ranging from out-of-distribution detection and time series anomaly detection to robustness in federated learning. A recurring theme of his research is to design intelligent systems that remain trustworthy even under imperfect or adversarial conditions, such as privacy constraints, limited data, or non-stationary environments. His current research explores how uncertainty can be designed and leveraged in large generative models to support more reliable decision-making and safer deployment.

Rabanser holds a Ph.D. in computer science from the University of Toronto, an M.Sc. and a B.Sc. in informatics from the Technical University of Munich (TUM), and an Honours Degree in technology management from the Center for Digital Technology and Management (CDTM). Over the past years, he has held engineering and research positions at Amazon / AWS AI Labs and Google. Previously, Rabanser has also been a research visitor at the Massachusetts Institute of Technology (MIT), Carnegie Mellon University (CMU), and the University of Cambridge.

Rabanser’s Google Scholar webpage

In-person attendance is open to Princeton University faculty, staff and students.

If you need an accommodation for a disability please contact Jean Butcher at [email protected] at least one week prior to the event.

Sponsorship of an event does not constitute institutional endorsement of external speakers or views presented.

Комментарии

Информация по комментариям в разработке

Похожие видео

  • CITP Seminar Hannah Bloch Wehba
    CITP Seminar Hannah Bloch Wehba
    5 месяцев назад
  • CITP Seminar: Jeremy Foote - LLMs are Social Actors: Chatbots in the Social World
    CITP Seminar: Jeremy Foote - LLMs are Social Actors: Chatbots in the Social World
    2 месяца назад
  • CITP Seminar Paul Rottger - Measuring Political Bias in Large Language Models
    CITP Seminar Paul Rottger - Measuring Political Bias in Large Language Models
    10 месяцев назад
  • AI is changing the World Of Theoretical Physics, Fast.
    AI is changing the World Of Theoretical Physics, Fast.
    20 часов назад
  • Альфред Кох – Путин 1990-х, бандиты, НТВ, Навальный / вДудь
    Альфред Кох – Путин 1990-х, бандиты, НТВ, Навальный / вДудь
    2 часа назад
  • Наш Haval h9 - Катастрофа на первом ТО!
    Наш Haval h9 - Катастрофа на первом ТО!
    19 часов назад
  • Лекция от легенды ИИ в Стэнфорде
    Лекция от легенды ИИ в Стэнфорде
    2 недели назад
  • Экономика вошла в зону смерти..⚫ Все ждут ухудшения ситуации || Дмитрий Потапенко*
    Экономика вошла в зону смерти..⚫ Все ждут ухудшения ситуации || Дмитрий Потапенко*
    1 час назад
  • И лучше нельзя, и хуже невозможно // Русские приключения Аненербе. Ответы на
    И лучше нельзя, и хуже невозможно // Русские приключения Аненербе. Ответы на "горячие" вопросы, 137
    2 часа назад
  • Дарио Амодеи — «Мы близки к концу экспоненты»
    Дарио Амодеи — «Мы близки к концу экспоненты»
    11 дней назад
  • Почему доллар не по 120 рублей. Цены на нефть — катастрофа. Экономист Корженевский о 4 годах войны
    Почему доллар не по 120 рублей. Цены на нефть — катастрофа. Экономист Корженевский о 4 годах войны
    1 час назад
  • ЭТИ СТАТУИ БЫЛИ ЛЮДЬМИ — ИСТОРИЮ СКРЫЛИ
    ЭТИ СТАТУИ БЫЛИ ЛЮДЬМИ — ИСТОРИЮ СКРЫЛИ
    21 час назад
  • Обращение к нации, с которого началась война (English subtitles) @Максим Кац
    Обращение к нации, с которого началась война (English subtitles) @Максим Кац
    17 часов назад
  • Путин пошёл на крайние меры / Срочное обращение к силовикам
    Путин пошёл на крайние меры / Срочное обращение к силовикам
    10 часов назад
  • Всем автомат. Статус S09E25
    Всем автомат. Статус S09E25
    Трансляция закончилась 16 часов назад
  • БЕЛКОВСКИЙ: Путин вернул Россию в 1952-й. Вдовы — от «Курска» до СВОшников. Чего боится Кремль
    БЕЛКОВСКИЙ: Путин вернул Россию в 1952-й. Вдовы — от «Курска» до СВОшников. Чего боится Кремль
    3 часа назад
  • OpenAI is Suddenly in Trouble
    OpenAI is Suddenly in Trouble
    3 дня назад
  • Илон Маск (свежее): xAI и SpaceX, прогресс ИИ, Grok, лунная база, другое
    Илон Маск (свежее): xAI и SpaceX, прогресс ИИ, Grok, лунная база, другое
    12 дней назад
  • OpenClaw Creator: Почему 80% приложений исчезнут
    OpenClaw Creator: Почему 80% приложений исчезнут
    2 недели назад
  • Почему Россия тонет в снегу?
    Почему Россия тонет в снегу?
    22 часа назад
  • О нас
  • Контакты
  • Отказ от ответственности - Disclaimer
  • Условия использования сайта - TOS
  • Политика конфиденциальности

video2dn Copyright © 2023 - 2025

Контакты для правообладателей [email protected]