Data Science | Тесты
2.55K subscribers
26 photos
388 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод используется для кластеризации данных на основе схожести объектов и их расстояний друг от друга?
Anonymous Quiz
73%
K-means
23%
DBSCAN
1%
Decision Tree
3%
Naive Bayes
🤔 Какой метод машинного обучения используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
6%
Decision Tree
9%
TF-IDF
4%
Автоэнкодеры
81%
User-Based Collaborative Filtering
🤔 Что такое precision?

Precision (точность) — это метрика классификации, которая показывает долю правильных положительных предсказаний среди всех предсказанных положительных классов. Она рассчитывается как отношение количества истинно положительных предсказаний к сумме истинно положительных и ложно положительных. Precision важен, когда цена ложноположительных результатов высока. Высокое значение precision указывает на то, что модель почти не ошибается при предсказании положительного класса.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод проверки модели применим к малым наборам данных?
Anonymous Quiz
37%
K-Fold Cross-Validation
38%
Leave-One-Out
15%
Bootstrapping
10%
Holdout Validation
🤔 Какой метод используется для создания синтетических образцов в несбалансированных данных?
Anonymous Quiz
3%
K-means
7%
Random Forest
82%
SMOTE
8%
Naive Bayes
🤔 За что мэп штрафует больше: за перепрогноз или недопрогноз?

MAP (Mean Average Precision) больше штрафует за недопрогноз (упущенные релевантные элементы), так как метрика ориентирована на точность в верхней части ранжированного списка.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает дисперсию в ансамблевых методах?
Anonymous Quiz
58%
Bagging
29%
Boosting
6%
Stacking
7%
Gradient Descent
🤔 Какой метод уменьшает дисперсию в ансамблевом обучении с голосованием?
Anonymous Quiz
49%
Bagging
22%
Boosting
22%
Stacking
7%
Dropout
🤔 Как валидировать временные ряды?

Валидация по времени включает разбиение данных на интервалы с учётом временной последовательности. Методы: time series split (скользящее окно), расширяемое окно или кросс-валидация по времени.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для оценки важности переменных в ансамблевых моделях?
Anonymous Quiz
10%
Градиентный бустинг
5%
Бэггинг
80%
Feature Importance
5%
K-ближайших соседей
🤔 Какой метод часто применяют для оценки классификационных моделей?
Anonymous Quiz
86%
ROC-кривая
8%
K-means
3%
PCA
4%
Логистическая регрессия
💊2
🤔 Как работает where?

Функция where возвращает элементы, соответствующие условию:
1. В SQL — фильтрует строки, соответствующие критериям.
2. В NumPy — выбирает элементы массива по условию или заменяет значения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой алгоритм подходит для детекции выбросов в данных?
Anonymous Quiz
7%
Линейная регрессия
71%
DBSCAN
14%
PCA
8%
AdaBoost
🤔 Какой метод оптимизации используется для настройки гиперпараметров моделей путем случайного поиска?
Anonymous Quiz
6%
Градиентный спуск
21%
Стохастический градиентный спуск
72%
Random Search
1%
K-means
🤔2
🤔 Какие есть усовершенствования бинарной кросс-энтропии?

Бинарную кросс-энтропию можно улучшать в зависимости от задачи:
- С взвешиванием классов — если классы несбалансированы.
- Focal Loss — фокусируется на трудных примерах, уменьшая вклад лёгких.
- Label smoothing — снижает переуверенность модели, заменяя метки вроде 1/0 на 0.9/0.1.
- Dice Loss / Jaccard Loss — используются в задачах сегментации, где важна форма, а не только точность пикселя.
- Combo Loss — сочетание BCE с другими функциями (например, с Dice), чтобы уравновесить разные аспекты задачи.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая техника помогает уменьшить дисбаланс классов в обучающих данных?
Anonymous Quiz
18%
RandomUnderSampler
63%
SMOTE
15%
CrossValidation
4%
PCA
🤔 Какой метод используется для оценки влияния каждой переменной на модель?
Anonymous Quiz
9%
Gradient Descent
18%
Forward Selection
65%
Permutation Importance
8%
Backpropagation
🤔 Какие есть проблемы с Batch Norm?

1. Зависимость от мини-батчей: небольшие батчи могут приводить к нестабильной оценке среднего и дисперсии.
2. Сложности с применением в рекуррентных сетях: последовательность данных может вызывать проблемы с нормализацией.
3. Увеличение вычислительных затрат: дополнительные параметры и операции замедляют обучение.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм использует энтропию для построения модели?
Anonymous Quiz
5%
K-Means
30%
Random Forest
24%
Naive Bayes
40%
Decision Tree
🤔1
🤔 Какой метод часто используется для повышения точности моделей путем создания мета-модели на основе предсказаний нескольких базовых моделей?
Anonymous Quiz
27%
Бэггинг
69%
Стеккинг
2%
K-means
2%
Т-SNE