Data Science | Тесты
2.62K subscribers
26 photos
426 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод используется для оценки важности признаков в модели?
Anonymous Quiz
54%
Random Forest Feature Importance
16%
LASSO Regression
3%
Gradient Boosting
27%
Principal Component Analysis
🔥1
🤔 Какой метод машинного обучения используется для предсказания непрерывных значений на основе линейных зависимостей между признаками?
Anonymous Quiz
4%
Decision Tree
86%
Линейная регрессия
6%
RNN
3%
Автоэнкодеры
🤔 Где использование линейных моделей целесообразно?

Линейные модели применяются, когда данные линейно разделимы или зависимости между признаками и целевой переменной близки к линейным.
1. Они эффективны на высоких объёмах данных благодаря низкой вычислительной сложности.
2. Хорошо интерпретируемы, что важно в задачах с требованием объяснимости.
3. Используются в случаях, когда признаки предварительно масштабированы и очищены.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает смещение и дисперсию, используя ансамбль моделей?
Anonymous Quiz
41%
Bagging
41%
Boosting
16%
Stacking
2%
Dropout
💊4
🤔 Какой метод уменьшает дисперсию, комбинируя слабые модели и повышая их взвешенность?
Anonymous Quiz
40%
Bagging
35%
Boosting
12%
Stacking
13%
Random Forest
🤔 Какие реализации бустинга есть?

AdaBoost, Gradient Boosting, XGBoost, CatBoost и LightGBM. Они различаются производительностью и подходами к построению деревьев.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод часто применяют для борьбы с дисбалансом классов?
Anonymous Quiz
70%
SMOTE
22%
PCA
5%
K-means
4%
Логистическая регрессия
🤔 Какая техника использует усреднение моделей для повышения точности предсказаний?
Anonymous Quiz
65%
Bagging
19%
Stacking
12%
Boosting
3%
Dropout
💊14
🤔 За что мэп штрафует больше: за перепрогноз или недопрогноз?

MAP (Mean Average Precision) больше штрафует за недопрогноз (упущенные релевантные элементы), так как метрика ориентирована на точность в верхней части ранжированного списка.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какой метод используется для масштабирования данных в sklearn?
Anonymous Quiz
64%
StandardScaler
21%
MinMaxScaler
7%
RobustScaler
8%
Normalizer
💊10
🤔 Какой метод используется для оценки важности признаков в модели случайного леса?
Anonymous Quiz
75%
Gini Importance
9%
Gradient Descent
7%
Mean Squared Error
9%
Cross-Validation
🤔 В чём смысл Information Value (IV)?

Это метрика, используемая для оценки предсказательной способности признака относительно целевой переменной.
1. Высокое значение IV говорит о сильной связи между признаком и целевой переменной.
2. Часто используется в кредитном скоринге для выбора наиболее значимых признаков.
3. Значения IV помогают определить, какие признаки следует включить в модель, а какие можно исключить.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
🤔 Какой метод машинного обучения используется для задач регрессии, когда требуется учитывать нелинейные зависимости между признаками?
Anonymous Quiz
5%
Линейная регрессия
60%
Полиномиальная регрессия
25%
Градиентный бустинг
11%
K-ближайших соседей
💊15
🤔 Какая функция в pandas используется для создания сводных таблиц?
Anonymous Quiz
76%
pivot_table
10%
groupby
11%
merge
4%
concat
🔥1
🤔 Что хуже: иметь много ложных срабатываний или ложно-отрицательных срабатываний?

Это зависит от задачи. Ложно-отрицательные срабатывания хуже в задачах, где важно не пропустить критический случай (например, диагностика). Ложные срабатывания могут быть менее критичными, но увеличивают нагрузку на систему.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию, комбинируя деревья решений?
Anonymous Quiz
49%
Bagging
40%
Boosting
9%
Gradient Descent
2%
Pruning
🤔 Какой метод оптимизации применяется для поиска минимума функции?
Anonymous Quiz
61%
SGD
25%
SGD
3%
v3. K-means
11%
DBSCAN
💊23
🤔 Какой функционал оптимизируется в задаче линейной регрессии? Как записать это в векторной записи?

Оптимизируется ошибка между предсказанными и фактическими значениями, минимизируя среднеквадратичное отклонение, что позволяет определить параметры модели.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом порядка слов?
Anonymous Quiz
0%
Линейная регрессия
4%
K-means
88%
N-grams
7%
Логистическая регрессия