Greenplum: от двух до сотен серверов (Дмитрий Павлов, Аренадата) / @Databases Meetup

Описание к видео Greenplum: от двух до сотен серверов (Дмитрий Павлов, Аренадата) / @Databases Meetup

О внутреннем устройстве мощной СУБД для аналитических задач — на @Databases Meetup by Mail.ru Cloud Solutions https://mcs.mail.ru/yt Анонсы в Telegram: https://t.me/k8s_mail Все видео: https://bit.ly/2U57FAd Ищем спикеров: https://mcs.mail.ru/speak

«Greenplum: от двух до сотен серверов. Строим современную аналитику с ACID, ANSI SQL и целиком на OpenSource»
Дмитрий Павлов, Chief Product Officer, Arenadata

Не секрет, что в успешных бизнесах количество данных, используемых для принятия решений, растет экспоненциально. В таких условиях становится невозможным решать задачи аналитики на традиционных СУБД и на помощь приходят кластерные массивно-параллельные системы.

Greenplum — ведущая массивно-параллельная СУБД с открытым исходным кодом. Горизонтальная расширяемость до десятков петабайт, понятный пользователям синтаксис ANSI SQL, транзакционность, совместимость с PostgreSQL, возможность обучать и применять модели машинного обучения — всё это сделало «зелёную сливу» популярнейшим решением для масштабных аналитических систем и в небольших стартапах, и в огромных корпорациях.

В этом докладе детально расскажем про архитектуру СУБД, внутреннее устройство, вопросы надёжности, а также затронем темы:
— ACID в MPP СУБД — консистентность и/или шардирование?
— Параллельная интеграция с другими кластерными системами: no bottlenecks!
— Использование ML-моделей как SQL-функций в распределенной СУБД
— Работа Keras + TensorFlow + CUDA + Nvidia v100 в условиях транзакционной СУБД
— Разграничение ресурсов в аналитической СУБД
— Компрессия — почему это так важно в аналитике?

Полная программа @Databases Meetup, который прошел 28 февраля 2020 в офисе Mail.ru Group: https://corp.mail.ru/ru/press/events/...

Комментарии

Информация по комментариям в разработке