Data Science | Тесты
2.67K subscribers
29 photos
448 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод используется для оценки важности признаков в модели случайного леса?
Anonymous Quiz
75%
Gini Importance
10%
Gradient Descent
6%
Mean Squared Error
9%
Cross-Validation
🤔 В чём смысл Information Value (IV)?

Это метрика, используемая для оценки предсказательной способности признака относительно целевой переменной.
1. Высокое значение IV говорит о сильной связи между признаком и целевой переменной.
2. Часто используется в кредитном скоринге для выбора наиболее значимых признаков.
3. Значения IV помогают определить, какие признаки следует включить в модель, а какие можно исключить.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какой метод машинного обучения используется для задач регрессии, когда требуется учитывать нелинейные зависимости между признаками?
Anonymous Quiz
5%
Линейная регрессия
61%
Полиномиальная регрессия
24%
Градиентный бустинг
10%
K-ближайших соседей
💊15
🤔 Какая функция в pandas используется для создания сводных таблиц?
Anonymous Quiz
76%
pivot_table
9%
groupby
12%
merge
3%
concat
🔥1
🤔 Что хуже: иметь много ложных срабатываний или ложно-отрицательных срабатываний?

Это зависит от задачи. Ложно-отрицательные срабатывания хуже в задачах, где важно не пропустить критический случай (например, диагностика). Ложные срабатывания могут быть менее критичными, но увеличивают нагрузку на систему.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию, комбинируя деревья решений?
Anonymous Quiz
49%
Bagging
40%
Boosting
10%
Gradient Descent
2%
Pruning
🤔 Какой метод оптимизации применяется для поиска минимума функции?
Anonymous Quiz
61%
SGD
26%
SGD
2%
v3. K-means
11%
DBSCAN
💊24
🤔 Какой функционал оптимизируется в задаче линейной регрессии? Как записать это в векторной записи?

Оптимизируется ошибка между предсказанными и фактическими значениями, минимизируя среднеквадратичное отклонение, что позволяет определить параметры модели.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом порядка слов?
Anonymous Quiz
0%
Линейная регрессия
4%
K-means
87%
N-grams
9%
Логистическая регрессия
🤔 Что известно о Gradient-boosted trees?

Это ансамблевый метод, строящий модель как последовательность слабых моделей (обычно деревьев), где каждая новая модель корректирует ошибки предыдущей. Он использует градиентный спуск по функции потерь. Обладает высокой точностью и хорошо работает с табличными данными, но чувствителен к гиперпараметрам. Популярные реализации — XGBoost, LightGBM, CatBoost.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм используется для классификации на основе теоремы Байеса?
Anonymous Quiz
4%
Логистическая регрессия
3%
Метод опорных векторов
91%
Наивный байесовский классификатор
1%
Случайный лес
🤔 Вопрос: Как называется процесс преобразования категориальных данных в числовые?
Anonymous Quiz
11%
Нормализация
7%
Стандартизация
81%
One-hot кодировка
1%
Логарифмирование
🤔 Какие знаешь рекомендательные модели?

Модели: коллаборативная фильтрация (на основе пользователей или элементов), контентная фильтрация, гибридные подходы и модели с использованием глубокого обучения (например, нейронные сетевые рекомендатели).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает переобучение с использованием L2 регуляризации?
Anonymous Quiz
51%
Ridge Regression
41%
Lasso Regression
3%
Elastic Net
5%
Dropout
🤔 Какой метод уменьшения размерности используется для нахождения наиболее значимых признаков, влияющих на целевую переменную?
Anonymous Quiz
62%
PCA
9%
LDA
26%
Регрессия с L1-регуляризацией
3%
NMF
💊14
🤔 Сравнение архитектуры RNN, CNN, трансформера?

RNN обрабатывает данные последовательно и хорошо работает с временными рядами или текстами, но страдает от проблем с градиентами и плохо масштабируется. CNN извлекает локальные признаки через свёртки, изначально предназначен для изображений, но может применяться к тексту. Трансформер использует механизм внимания, обрабатывает всё параллельно и учитывает контекст целиком, что делает его эффективным в работе с языком и последовательностями.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🤔 Какой метод машинного обучения используется для классификации данных с высокими размерностями, где количество признаков значительно больше, чем количество наблюдений?
Anonymous Quiz
8%
Линейная регрессия
66%
Метод опорных векторов (SVM)
9%
Логистическая регрессия
18%
K-means
🤔 Какой метод уменьшения размерности используется для выделения скрытых факторов в данных с учетом неотрицательных ограничений?
Anonymous Quiz
33%
PCA
23%
LDA
22%
NMF
22%
T-SNE
🤔 Как валидировать временные ряды?

Валидация по времени включает разбиение данных на интервалы с учётом временной последовательности. Методы: time series split (скользящее окно), расширяемое окно или кросс-валидация по времени.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM