Data Science | Тесты
2.67K subscribers
28 photos
461 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Можно ли тьюнить только Batch Norm?

1. Да, параметры Batch Norm, такие как скорость обучения, моментум и гамма/бета, могут быть настроены для улучшения обучения.
2. Однако тьюнинг только Batch Norm может быть недостаточен без оптимизации других частей модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
21%
K-means
76%
User-Based Collaborative Filtering
2%
Decision Tree
1%
Naive Bayes
🔥1
🤔 Какой метод уменьшает смещение и дисперсию в нейронных сетях?
Anonymous Quiz
31%
Dropout
49%
Batch Normalization
15%
Ensemble Learning
6%
Gradient Clipping
💊3🔥1
🤔 Что знаешь про early stopping?

Early stopping — это техника регуляризации, которая завершает обучение модели, если метрика качества на валидационном наборе перестаёт улучшаться. Это предотвращает переобучение, позволяя сохранить оптимальные параметры до ухудшения обобщающей способности. Метод основан на мониторинге функции ошибки или качества модели во время каждой итерации обучения.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в модели случайного леса?
Anonymous Quiz
51%
Bagging
22%
Boosting
14%
Pruning
13%
Cross-Validation
🤔 Какой метод машинного обучения используется для прогнозирования категориальных переменных?
Anonymous Quiz
6%
Линейная регрессия
63%
Логистическая регрессия
21%
K-means
9%
PCA
🤔1
🤔 Как систематическая ошибка и дисперсии связаны между собой?

Высокая систематическая ошибка (bias) уменьшает сложность модели, но снижает точность, а высокая дисперсия (variance) приводит к переобучению. Баланс между ними важен для оптимальной работы модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2
🤔 Какой метод помогает бороться с мультиколлинеарностью?
Anonymous Quiz
11%
Ridge Regression
24%
Lasso Regression
20%
Elastic Net
44%
All of the above
🤔 Какой метод машинного обучения используется для обнаружения выбросов?
Anonymous Quiz
6%
Линейная регрессия
73%
Изолирующий лес
4%
Логистическая регрессия
18%
PCA
🔥1
🤔 Что такое Boxplot?

Это статистический график, показывающий распределение данных:
1. Ящик (Box) – показывает межквартильный размах (между Q1 и Q3).
2. Линия внутри ящика – медиана (Q2).
3. "Усы" – представляют диапазон данных без выбросов.
4. Точки за пределами усов – выбросы.
Boxplot полезен для визуализации асимметрии, выбросов и распределения данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод используется для оценки важности признаков в модели?
Anonymous Quiz
54%
Random Forest Feature Importance
15%
LASSO Regression
3%
Gradient Boosting
28%
Principal Component Analysis
🔥1
🤔 Какой метод машинного обучения используется для предсказания непрерывных значений на основе линейных зависимостей между признаками?
Anonymous Quiz
4%
Decision Tree
87%
Линейная регрессия
6%
RNN
3%
Автоэнкодеры
🤔 Где использование линейных моделей целесообразно?

Линейные модели применяются, когда данные линейно разделимы или зависимости между признаками и целевой переменной близки к линейным.
1. Они эффективны на высоких объёмах данных благодаря низкой вычислительной сложности.
2. Хорошо интерпретируемы, что важно в задачах с требованием объяснимости.
3. Используются в случаях, когда признаки предварительно масштабированы и очищены.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает смещение и дисперсию, используя ансамбль моделей?
Anonymous Quiz
41%
Bagging
41%
Boosting
15%
Stacking
2%
Dropout
💊5
🤔 Какой метод уменьшает дисперсию, комбинируя слабые модели и повышая их взвешенность?
Anonymous Quiz
40%
Bagging
37%
Boosting
11%
Stacking
12%
Random Forest
💊1
🤔 Какие реализации бустинга есть?

AdaBoost, Gradient Boosting, XGBoost, CatBoost и LightGBM. Они различаются производительностью и подходами к построению деревьев.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
🤔 Какой метод часто применяют для борьбы с дисбалансом классов?
Anonymous Quiz
70%
SMOTE
22%
PCA
5%
K-means
4%
Логистическая регрессия
🤔 Какая техника использует усреднение моделей для повышения точности предсказаний?
Anonymous Quiz
65%
Bagging
20%
Stacking
13%
Boosting
3%
Dropout
💊15
🤔 За что мэп штрафует больше: за перепрогноз или недопрогноз?

MAP (Mean Average Precision) больше штрафует за недопрогноз (упущенные релевантные элементы), так как метрика ориентирована на точность в верхней части ранжированного списка.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какой метод используется для масштабирования данных в sklearn?
Anonymous Quiz
65%
StandardScaler
20%
MinMaxScaler
6%
RobustScaler
9%
Normalizer
💊10