Библиотека собеса по Data Science | вопросы с собеседований

🖤 ЧЕРНАЯ ПЯТНИЦА: СКИДКА 40%

Что общего между Black Friday и подготовкой к собесам? Оба случаются раз в год, и оба нельзя пропустить! 😎

🔥 Курсы со скидкой 40% до конца ноября:

🐍 Python
📐 Математика
🤖 AI
🔢 Алгоритмы и структуры

Пока другие покупают кофемашины и телевизоры, инвестируй в себя📈

569 views15:25

Почему стандартная k-fold кросс-валидация плохо подходит для временных рядов?

Anonymous Quiz

Потому что данные могут быть не IID (независимыми и одинаково распределёнными)

90%

Потому что нарушается временной порядок и происходит утечка данных из будущего

Потому что k слишком маленькое

Потому что нельзя использовать метрику AUC

👍1

157 voters601 views16:38

Библиотека собеса по Data Science | вопросы с собеседований

Если при кросс-валидации модель показывает очень разные результаты на разных фолдах, а на тесте — низкую ошибку, что это может значить?

Anonymous Quiz

12%

Недостаток данных

49%

Сильная зависимость модели от случайных разбиений данных

31%

Модель сильно переобучена на один из фолдов

Модель недообучена

👍2❤1

491 voters1.89K views18:59

Библиотека собеса по Data Science | вопросы с собеседований

Почему комбинация методов калибровки (например, Temperature Scaling + Isotonic Regression) может ухудшить итоговую калибровку?

Anonymous Quiz

Потому что методы несовместимы по математике

47%

Потому что вторая калибровка заново масштабирует логиты

30%

Потому что каждая трансформация может переобучиться на ограниченной валидационной выборке

17%

Потому что избыточная гладкость ухудшает дискретизацию вероятностей

103 voters515 views19:05

Библиотека собеса по Data Science | вопросы с собеседований

📊 Задача с собеседования

Имеются данные о продажах за последние 12 месяцев. Требуется оценить наличие линейной зависимости между количеством заключённых сделок и объёмом выручки, а также построить прогноз выручки при достижении 150 сделок.

Если не понимаете с какой стороны подступиться к задаче, то пора подтянуть математику.

🎓 Именно этому посвящен курс экспресс-курс «Математика для Data Science» от Proglib Academy:

— работа с векторами и матрицами;
— линейная регрессия и метод наименьших квадратов;
— вероятности, распределения, статистика;
— и многое другое.

⏳ Старт: 4 декабря
🔥 Скидка: 40% до конца ноября

👉 Подключиться к курсу

530 views15:01

Библиотека собеса по Data Science | вопросы с собеседований

Почему добавление слишком большого momentum-параметра β в стохастическом градиенте может ухудшить обучение при очень шумных данных?

Anonymous Quiz

66%

Потому что накопленные скорости усиливают шум в направлении обновлений

11%

Потому что momentum уменьшает размер шага

16%

Потому что β влияет на регуляризацию

Потому что градиенты перестают зависеть от потерь

❤1