Data Science | Тесты
2.62K subscribers
26 photos
422 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 За что мэп штрафует больше: за перепрогноз или недопрогноз?

MAP (Mean Average Precision) больше штрафует за недопрогноз (упущенные релевантные элементы), так как метрика ориентирована на точность в верхней части ранжированного списка.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
🤔 Какой метод используется для масштабирования данных в sklearn?
Anonymous Quiz
64%
StandardScaler
20%
MinMaxScaler
7%
RobustScaler
9%
Normalizer
💊8
🤔 Какой метод используется для оценки важности признаков в модели случайного леса?
Anonymous Quiz
74%
Gini Importance
10%
Gradient Descent
7%
Mean Squared Error
10%
Cross-Validation
🤔 В чём смысл Information Value (IV)?

Это метрика, используемая для оценки предсказательной способности признака относительно целевой переменной.
1. Высокое значение IV говорит о сильной связи между признаком и целевой переменной.
2. Часто используется в кредитном скоринге для выбора наиболее значимых признаков.
3. Значения IV помогают определить, какие признаки следует включить в модель, а какие можно исключить.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для задач регрессии, когда требуется учитывать нелинейные зависимости между признаками?
Anonymous Quiz
5%
Линейная регрессия
59%
Полиномиальная регрессия
25%
Градиентный бустинг
11%
K-ближайших соседей
💊14
🤔 Какая функция в pandas используется для создания сводных таблиц?
Anonymous Quiz
78%
pivot_table
8%
groupby
10%
merge
4%
concat
🔥1
🤔 Что хуже: иметь много ложных срабатываний или ложно-отрицательных срабатываний?

Это зависит от задачи. Ложно-отрицательные срабатывания хуже в задачах, где важно не пропустить критический случай (например, диагностика). Ложные срабатывания могут быть менее критичными, но увеличивают нагрузку на систему.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию, комбинируя деревья решений?
Anonymous Quiz
47%
Bagging
41%
Boosting
10%
Gradient Descent
2%
Pruning
🤔 Какой метод оптимизации применяется для поиска минимума функции?
Anonymous Quiz
61%
SGD
26%
SGD
3%
v3. K-means
10%
DBSCAN
💊21
🤔 Какой функционал оптимизируется в задаче линейной регрессии? Как записать это в векторной записи?

Оптимизируется ошибка между предсказанными и фактическими значениями, минимизируя среднеквадратичное отклонение, что позволяет определить параметры модели.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом порядка слов?
Anonymous Quiz
0%
Линейная регрессия
2%
K-means
91%
N-grams
7%
Логистическая регрессия
🤔 Что известно о Gradient-boosted trees?

Это ансамблевый метод, строящий модель как последовательность слабых моделей (обычно деревьев), где каждая новая модель корректирует ошибки предыдущей. Он использует градиентный спуск по функции потерь. Обладает высокой точностью и хорошо работает с табличными данными, но чувствителен к гиперпараметрам. Популярные реализации — XGBoost, LightGBM, CatBoost.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм используется для классификации на основе теоремы Байеса?
Anonymous Quiz
6%
Логистическая регрессия
3%
Метод опорных векторов
91%
Наивный байесовский классификатор
0%
Случайный лес
🤔 Вопрос: Как называется процесс преобразования категориальных данных в числовые?
Anonymous Quiz
11%
Нормализация
2%
Стандартизация
86%
One-hot кодировка
1%
Логарифмирование
🤔 Какие знаешь рекомендательные модели?

Модели: коллаборативная фильтрация (на основе пользователей или элементов), контентная фильтрация, гибридные подходы и модели с использованием глубокого обучения (например, нейронные сетевые рекомендатели).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает переобучение с использованием L2 регуляризации?
Anonymous Quiz
51%
Ridge Regression
42%
Lasso Regression
3%
Elastic Net
4%
Dropout
🤔 Какой метод уменьшения размерности используется для нахождения наиболее значимых признаков, влияющих на целевую переменную?
Anonymous Quiz
70%
PCA
3%
LDA
23%
Регрессия с L1-регуляризацией
4%
NMF
💊11
🤔 Сравнение архитектуры RNN, CNN, трансформера?

RNN обрабатывает данные последовательно и хорошо работает с временными рядами или текстами, но страдает от проблем с градиентами и плохо масштабируется. CNN извлекает локальные признаки через свёртки, изначально предназначен для изображений, но может применяться к тексту. Трансформер использует механизм внимания, обрабатывает всё параллельно и учитывает контекст целиком, что делает его эффективным в работе с языком и последовательностями.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод машинного обучения используется для классификации данных с высокими размерностями, где количество признаков значительно больше, чем количество наблюдений?
Anonymous Quiz
9%
Линейная регрессия
57%
Метод опорных векторов (SVM)
7%
Логистическая регрессия
26%
K-means