Data Science | Тесты
2.51K subscribers
25 photos
357 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшает переобучение в нейронных сетях?
Anonymous Quiz
74%
Dropout
20%
Batch Normalization
5%
Gradient Clipping
1%
Momentum
💊6
🤔 Какой метод уменьшения размерности используется для визуализации высокоразмерных данных в двумерном или трехмерном пространстве?
Anonymous Quiz
34%
PCA
10%
LDA
24%
Isomap
32%
T-SNE
🤔 Как систематическая ошибка и дисперсии связаны между собой?

Высокая систематическая ошибка (bias) уменьшает сложность модели, но снижает точность, а высокая дисперсия (variance) приводит к переобучению. Баланс между ними важен для оптимальной работы модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какой метод используется для кластеризации данных на основе схожести объектов и их расстояний друг от друга?
Anonymous Quiz
72%
K-means
24%
DBSCAN
1%
Decision Tree
2%
Naive Bayes
🤔 Какой метод машинного обучения используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
6%
Decision Tree
8%
TF-IDF
5%
Автоэнкодеры
81%
User-Based Collaborative Filtering
🤔 Что такое precision?

Precision (точность) — это метрика классификации, которая показывает долю правильных положительных предсказаний среди всех предсказанных положительных классов. Она рассчитывается как отношение количества истинно положительных предсказаний к сумме истинно положительных и ложно положительных. Precision важен, когда цена ложноположительных результатов высока. Высокое значение precision указывает на то, что модель почти не ошибается при предсказании положительного класса.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод проверки модели применим к малым наборам данных?
Anonymous Quiz
39%
K-Fold Cross-Validation
35%
Leave-One-Out
16%
Bootstrapping
11%
Holdout Validation
🤔 Какой метод используется для создания синтетических образцов в несбалансированных данных?
Anonymous Quiz
3%
K-means
6%
Random Forest
84%
SMOTE
7%
Naive Bayes
🤔 За что мэп штрафует больше: за перепрогноз или недопрогноз?

MAP (Mean Average Precision) больше штрафует за недопрогноз (упущенные релевантные элементы), так как метрика ориентирована на точность в верхней части ранжированного списка.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает дисперсию в ансамблевых методах?
Anonymous Quiz
60%
Bagging
29%
Boosting
5%
Stacking
5%
Gradient Descent
🤔 Какой метод уменьшает дисперсию в ансамблевом обучении с голосованием?
Anonymous Quiz
51%
Bagging
22%
Boosting
18%
Stacking
8%
Dropout
🤔 Как валидировать временные ряды?

Валидация по времени включает разбиение данных на интервалы с учётом временной последовательности. Методы: time series split (скользящее окно), расширяемое окно или кросс-валидация по времени.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для оценки важности переменных в ансамблевых моделях?
Anonymous Quiz
11%
Градиентный бустинг
5%
Бэггинг
81%
Feature Importance
3%
K-ближайших соседей
🤔 Какой метод часто применяют для оценки классификационных моделей?
Anonymous Quiz
87%
ROC-кривая
7%
K-means
3%
PCA
4%
Логистическая регрессия
💊2
🤔 Как работает where?

Функция where возвращает элементы, соответствующие условию:
1. В SQL — фильтрует строки, соответствующие критериям.
2. В NumPy — выбирает элементы массива по условию или заменяет значения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм подходит для детекции выбросов в данных?
Anonymous Quiz
7%
Линейная регрессия
69%
DBSCAN
14%
PCA
10%
AdaBoost
🤔 Какой метод оптимизации используется для настройки гиперпараметров моделей путем случайного поиска?
Anonymous Quiz
6%
Градиентный спуск
20%
Стохастический градиентный спуск
74%
Random Search
0%
K-means
🤔2
🤔 Какие есть усовершенствования бинарной кросс-энтропии?

Бинарную кросс-энтропию можно улучшать в зависимости от задачи:
- С взвешиванием классов — если классы несбалансированы.
- Focal Loss — фокусируется на трудных примерах, уменьшая вклад лёгких.
- Label smoothing — снижает переуверенность модели, заменяя метки вроде 1/0 на 0.9/0.1.
- Dice Loss / Jaccard Loss — используются в задачах сегментации, где важна форма, а не только точность пикселя.
- Combo Loss — сочетание BCE с другими функциями (например, с Dice), чтобы уравновесить разные аспекты задачи.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая техника помогает уменьшить дисбаланс классов в обучающих данных?
Anonymous Quiz
17%
RandomUnderSampler
64%
SMOTE
15%
CrossValidation
4%
PCA
🤔 Какой метод используется для оценки влияния каждой переменной на модель?
Anonymous Quiz
8%
Gradient Descent
17%
Forward Selection
64%
Permutation Importance
10%
Backpropagation