CatBoost на больших данных | Вебинар Александра Савченко | karpov.courses

Описание к видео CatBoost на больших данных | Вебинар Александра Савченко | karpov.courses

Курс «Инженер данных»: https://bit.ly/3GclP89

Spark — пожалуй, самый популярный фреймворк для работы с большими данными, предоставляющий инструменты для построения и обучения различных ML-моделей. CatBoost — открытая библиотека для градиентного бустинга от компании Яндекс.

В рамках вебинара мы обсудим, как подружить Spark и CatBoost; рассмотрим процесс обучения моделей на SparkML; научимся обучать CatBoost модели на больших данных; разберём, как встраивать CatBoost в компоненты SparkML.

Google CoLab (Notebook) из видео: https://clck.ru/ZADik
Репозиторий с исходниками: https://clck.ru/ZADjm
Документация по catboost-spark: https://clck.ru/ZADkg
Catboost-spark репозиторий: https://clck.ru/ZADrL
RAPIDS Accelerator for Apache Spark: https://clck.ru/ZADrk

Учитесь Data Science с нами: https://karpov.courses/

Комментарии

Информация по комментариям в разработке