В этом докладе Александр Брыль, ML engineer в Mad Devs, расскажет про 3 ключевых фактора, которые менеджеры должны учитывать при оценке проектов машинного обучения. От количества и качества данных, необходимых для обучения моделей, до перевода бизнес-задачи на формальный язык ML и измерения качества алгоритма — мы разберем все аспекты, которые помогут вам принимать обоснованные решения о целесообразности и эффективности ML-проектов.
-------------------------------------------------------------------------------
In this talk, Alexander Bryl, ML engineer at Mad Devs, will explore 3 essential factors that managers should consider when evaluating machine learning projects. From the quantity and quality of data needed to train models, to translating a business problem into a formal ML language and measuring the quality of the algorithm, he will analyze all aspects that will help you make informed decisions about the feasibility and effectiveness of ML projects.
-------------------------------------------------------------------------------
НАВИГАЦИЯ
0:00 - 1:08 Введение и цель доклада
1:09 - 1:38 Критерии решаемости задачи с помощью ML. Основные аспекты, на которые нужно обратить внимание при оценке возможности решения задачи с помощью ML.
1:39 - 2:15 Неявные критерии нерешаемости задачи с помощью ML. Скрытые факторы, которые могут указывать на то, что задача не подходит для ML, даже если на первый взгляд кажется, что подходит.
2:16 - 4:04 Явные критерии нерешаемости задачи с помощью ML. Очевидные признаки, которые явно указывают на то, что задача не может быть решена с помощью ML.
4:04 - 4:05 Первый кит ML: Данные. Количество и качество данных как ключевой фактор успешного обучения моделей ML.
4:05 - 5:41 Риски, связанные с количеством данных, и их митигация
5:42 - 7:21 Риски, связанные с качеством данных, и их митигация
7:22 - 7:50 Промежуточное резюме. Обобщение основных моментов, связанных с рисками, количеством и качеством данных.
7:51 - 10:41 Случаи, когда много данных не нужно, и методы тюнинга моделей
10:42 - 11:52 Когда необходимо много данных? Cитуации, когда для обучения ML-моделей требуется большой объем данных.
11:53 - 12:28 Готовые ML-решения: учить свою или брать предобученную?
12:29 - 13:18 Дополнительные комментарии и рекомендации, касающиеся важности данных для ML.
13:19 - 13:25 Второй кит ML: Перевод задачи на формальный язык ML
13:26 - 15:45 Формальная постановка задачи в ML. Примеры формальной постановки задач.
15:46 - 18:52 Модели обучения в ML. Обзор различных моделей машинного обучения, которые существуют в ML и принципы их работы.
18:53 - 19:21 Формула перевода задачи с бизнес-языка на формальный язык ML
19:22 - 19:25 Третий кит ML: Измеримость качества алгоритма
19:26 - 20:35 Метрики и их критерии в ML. Описание различных метрик, которые используются для оценки качества ML-моделей. Критерии выбора подходящих метрик.
20:36 - 28:42 Метрики качества моделей ML. Подробный разбор различных метрик, которые используются для оценки качества моделей ML.
28:43 - 29:27 Метрики ML-системы - ML Flow
29:28 - 31:52 Связь метрик продукта с ML-системами. Как связывать метрики, которые важны для бизнеса, с метриками ML-систем.
31:53 - 31:56 Заключение
-------------------------------------------------------------------------------
ССЫЛКИ
Telegram [Mad ML Talks] - https://t.me/MadML_Talks
Telegram [Mad Devs Channel] - https://t.me/maddevsio
Facebook - / maddevsllc
Instagram - / maddevsio
X [ex.Twitter] - https://x.com/MadDevsIO
#machinelearning #ml #artificialintelligence #ai #datascience #dataanalysis #predictivemodeling #algorithm #modeltrains #dataquality #dataquantity #mlmetrics, #mlsystem, #businessproblemsolution #businessprocessautomation #formallanguage #mlapplication #mlsolution #pretrainedmodel #modeltuning #riskmitigation
Информация по комментариям в разработке