Data Science | Тесты
2.51K subscribers
25 photos
363 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод используется для оценки важности переменных в ансамблевых моделях?
Anonymous Quiz
10%
Градиентный бустинг
6%
Бэггинг
80%
Feature Importance
4%
K-ближайших соседей
🤔 Какой метод часто применяют для оценки классификационных моделей?
Anonymous Quiz
86%
ROC-кривая
7%
K-means
3%
PCA
3%
Логистическая регрессия
💊2
🤔 Как работает where?

Функция where возвращает элементы, соответствующие условию:
1. В SQL — фильтрует строки, соответствующие критериям.
2. В NumPy — выбирает элементы массива по условию или заменяет значения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой алгоритм подходит для детекции выбросов в данных?
Anonymous Quiz
7%
Линейная регрессия
71%
DBSCAN
13%
PCA
9%
AdaBoost
🤔 Какой метод оптимизации используется для настройки гиперпараметров моделей путем случайного поиска?
Anonymous Quiz
6%
Градиентный спуск
21%
Стохастический градиентный спуск
72%
Random Search
1%
K-means
🤔2
🤔 Какие есть усовершенствования бинарной кросс-энтропии?

Бинарную кросс-энтропию можно улучшать в зависимости от задачи:
- С взвешиванием классов — если классы несбалансированы.
- Focal Loss — фокусируется на трудных примерах, уменьшая вклад лёгких.
- Label smoothing — снижает переуверенность модели, заменяя метки вроде 1/0 на 0.9/0.1.
- Dice Loss / Jaccard Loss — используются в задачах сегментации, где важна форма, а не только точность пикселя.
- Combo Loss — сочетание BCE с другими функциями (например, с Dice), чтобы уравновесить разные аспекты задачи.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая техника помогает уменьшить дисбаланс классов в обучающих данных?
Anonymous Quiz
16%
RandomUnderSampler
65%
SMOTE
15%
CrossValidation
4%
PCA
🤔 Какой метод используется для оценки влияния каждой переменной на модель?
Anonymous Quiz
8%
Gradient Descent
18%
Forward Selection
65%
Permutation Importance
9%
Backpropagation
🤔 Какие есть проблемы с Batch Norm?

1. Зависимость от мини-батчей: небольшие батчи могут приводить к нестабильной оценке среднего и дисперсии.
2. Сложности с применением в рекуррентных сетях: последовательность данных может вызывать проблемы с нормализацией.
3. Увеличение вычислительных затрат: дополнительные параметры и операции замедляют обучение.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм использует энтропию для построения модели?
Anonymous Quiz
5%
K-Means
32%
Random Forest
23%
Naive Bayes
40%
Decision Tree
🤔1
🤔 Какой метод часто используется для повышения точности моделей путем создания мета-модели на основе предсказаний нескольких базовых моделей?
Anonymous Quiz
26%
Бэггинг
70%
Стеккинг
2%
K-means
2%
Т-SNE
🤔 Чему равно p-value для выброса?

Это вероятность получить значение настолько же экстремальное, как наблюдаемое, при условии, что оно принадлежит общему распределению.
Чем меньше p-value, тем выше вероятность, что точка — выброс.
Значение зависит от метода (Grubbs, Dixon, Z-score и др.). Обычно, если p < 0.05, точка может считаться выбросом.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод помогает в обработке несбалансированных данных?
Anonymous Quiz
76%
SMOTE
5%
K-means
6%
PCA
13%
Random Forest
🤔 Какой метод часто применяют для предобработки данных перед моделированием?
Anonymous Quiz
89%
Normalization
2%
K-means
7%
PCA
1%
Логистическая регрессия
🤔 В каких моделях используются несимметрические метрики?

Несимметрические метрики часто используются в моделях, где присутствует дисбаланс классов или когда ошибки в одних классах имеют более высокую стоимость, чем ошибки в других. Например, в медицинской диагностике, финансовом мошенничестве или кредитном скоринге, где пропуск положительного случая (например, болезни) может быть критичным.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в ансамблевых методах?
Anonymous Quiz
63%
Bagging
27%
Boosting
7%
Stacking
3%
Gradient Descent
🤔 Какой метод используется для оценки модели машинного обучения на основе разделения данных на обучающую и тестовую выборки?
Anonymous Quiz
33%
Cross-validation
4%
Bootstrap
59%
Train-Test Split
4%
A/B Testing
💊5
🤔 Как избегают коллизии в хеш-таблице

Для предотвращения коллизий в хэш-таблице используются методы, такие как цепочки (связывание элементов в списки) и открытая адресация (перенос коллизий в другие доступные ячейки). Метод цепочек добавляет все значения с одинаковым хэшом в связанный список, что позволяет хранить несколько элементов в одной ячейке. В открытой адресации при коллизии выполняется последовательный поиск следующей свободной ячейки.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод машинного обучения устойчив к переобучению за счет использования нескольких слабых моделей?
Anonymous Quiz
5%
Линейная регрессия
85%
Градиентный бустинг
10%
K-ближайших соседей
1%
Логистическая регрессия
🤔 Какой метод уменьшает переобучение, нормализуя данные на каждой скрытой слое?
Anonymous Quiz
21%
Dropout
71%
Batch Normalization
3%
Early Stopping
6%
Gradient Clipping
🤔1