Junior Data Scientist | Собеседование | karpov.courses

Описание к видео Junior Data Scientist | Собеседование | karpov.courses

Курс Start ML: https://bit.ly/3SdB7Am

Лучший способ подготовиться к собеседованию — пройти его в тестовом режиме.

Мы записали mock-интервью, которое состоит из 4-х секций: Python, ML, работа с данными и А/В Тесты. В независимости от уровня соискателя есть пул обязательных вопросов на знание основ Data Science и пул дополнительных вопросов в зависимости от уровня подготовки и опыта кандидата.

Именно эти секции позволяют оценить широту знаний собеседуемого. Вопросы дают понять, умеет ли он составлять запросы к БД, писать код, строить модели и проверять их работу с помощью А/В-тестов. Все эти знания достаточно быстро проверяются на mock-собеседовании.

Нашего гостя будет собеседовать преподаватель программы Hard ML Станислав Гафаров. Включайте, чтобы узнать, какие вопросы могут встретиться в интервью на позицию junior DS!

Учитесь Data Science с нами: https://karpov.courses/

0:00 Введение.
0:50 О структуре и секциях, которые входят в интервью.

Секция «Python»

2:30 Вопрос на изменяемые и неизменяемые типы данных
6:21 Задача на dict и ответ Дмитрия
8:15 Объяснение первой задачи
10:38 Задача, цель которой — сделать, чтобы дикты были разные, ответ Дмитрия
13:51 Разбор второй задачи
16:10 Вопрос о выделении и очистке памяти в Python, ответ Дмитрия
16:26 Разбор вопроса
19:00 Вопрос о генераторах, декораторах и итераторах

Секция «A/B-тесты»

20:35 Вопрос о моделировании A/B теста
30:57 Вопрос о генерации распределений
31:22 Подводка к критерию стьюдента и вопрос про ограничения его применения
32:26 О необходимости нормальности распределения
33:46 Тесты для проверки на нормальность
34:24 Как сравнить ненормальные распределения
35:02 Подводка к вопросу о нормальности распределения средних при бутстрапе
36:04 Как быть, если нет старых пользователей, и нужно провести тест только на новых
37:53 Какие еще бывают вопросы и общие рассуждения
41:19 Интерпретация Bootstrap

Секция «Работа с данными»

42:04 Вопрос про разницу Where и Having
44:20 вопрос про виды join и задания на join
45:57 подводка к задаче про group by в Python
47:49 Задача на group by в Python

Секция «ML алгоритмы»

1:06:22 Задача о линейных регрессиях
1:09:47 Вопрос о градиентном спуске
1:14:06 Вопрос о переобучении
1:22:20 Вопрос о деревьях и их построении
1:26:04 Вопрос: почему случайный лес работает хорошо и не переобучается?
1:28:20 Последний вопрос со звездочкой: в каких случаях логистическая регрессия на задачах классификации будет работать лучше, чем случайный лес
1:32:18 Конец, обратная связь

Комментарии

Информация по комментариям в разработке