Data Science | Тесты
2.54K subscribers
25 photos
383 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какая функция используется для вычисления коэффициента корреляции?
Anonymous Quiz
34%
pearsonr
13%
spearmanr
2%
kendalltau
51%
correlate
🤔 Какой метод уменьшает дисперсию, нормализуя данные на скрытых слоях?
Anonymous Quiz
14%
Dropout
77%
Batch Normalization
6%
Gradient Clipping
3%
Early Stopping
🤔 В чем разница между L1 и L2 регуляризацией?

L1-регуляризация (Lasso) добавляет сумму модулей весов к функции потери, склоняя веса к нулю, что способствует разреженности. L2-регуляризация (Ridge) добавляет сумму квадратов весов, уменьшая их величину, но не зануляя. L1 эффективна для отбора признаков, а L2 — для стабилизации модели и борьбы с переобучением.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает дисперсию модели, суммируя прогнозы нескольких моделей?
Anonymous Quiz
86%
Бэггинг
5%
Ридж-регрессия
1%
Лассо-регрессия
8%
PCA
🤔 Какой метод машинного обучения используется для классификации данных, используя вероятностные распределения признаков?
Anonymous Quiz
21%
Логистическая регрессия
69%
Наивный байесовский классификатор
2%
K-ближайших соседей
7%
Метод опорных векторов (SVM)
🤔 Как можно сравнивать два ненормальных распределения?

1. Применить непараметрические тесты, такие как тест Манна-Уитни или Краскела-Уоллиса.
2. Использовать бутстрепинг для создания доверительных интервалов.
3. Рассмотреть преобразование данных для приближения к нормальному виду.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод часто применяют для предобработки категориальных данных?
Anonymous Quiz
93%
One-hot encoding
4%
K-means
1%
PCA
2%
Логистическая регрессия
🤔 Какая метрика используется для оценки качества модели классификации, учитывающая как полноту, так и точность?
Anonymous Quiz
18%
ROC AUC
74%
F1 Score
2%
Mean Squared Error
6%
Accuracy
🤔 В чём смысл Information Value (IV)?

Это метрика, используемая для оценки предсказательной способности признака относительно целевой переменной.
1. Высокое значение IV говорит о сильной связи между признаком и целевой переменной.
2. Часто используется в кредитном скоринге для выбора наиболее значимых признаков.
3. Значения IV помогают определить, какие признаки следует включить в модель, а какие можно исключить.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для детектирования выбросов в наборе данных?
Anonymous Quiz
59%
DBSCAN
8%
k-means
25%
LDA
9%
PCA
🔥2
🤔 Какой метод часто используется для обнаружения аномалий в данных?
Anonymous Quiz
5%
Линейная регрессия
6%
Логистическая регрессия
74%
Изолирующий лес
15%
K-means
🤔 Чем отличается градиентный спуск от SGD?

Градиентный спуск использует весь набор данных для вычисления градиента и обновления параметров, что требует значительных вычислительных ресурсов. Стохастический градиентный спуск (SGD) обновляет параметры после каждого примера или мини-батча, что ускоряет обучение, но может быть менее стабильным. SGD часто сходится быстрее, но может застревать в локальных минимумах.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод часто применяют для классификации изображений?
Anonymous Quiz
92%
CNN
3%
K-means
2%
PCA
2%
Логистическая регрессия
🤔 Какой метод кластеризации не требует заранее знать число кластеров?
Anonymous Quiz
28%
K-means
44%
DBSCAN
24%
Hierarchical Clustering
4%
Mean Shift
🤔 Чем отличаются str и repr?

str предназначен для отображения понятного текста для пользователя, repr — для отображения точного представления объекта для разработчика.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой алгоритм используется для снижения размерности данных с сохранением их вариативности?
Anonymous Quiz
6%
K-means кластеризация
90%
Метод главных компонент (PCA)
1%
Линейная регрессия
3%
Деревья решений
🤔 Какой метод машинного обучения используется для предсказания категориальных переменных на основе временных рядов?
Anonymous Quiz
13%
Decision Tree
13%
Логистическая регрессия
26%
Автоэнкодеры
49%
RNN
🤔 Какие принципы ООП тебе известны?

Основные принципы: инкапсуляция (сокрытие данных), наследование (повторное использование кода), полиморфизм (разные реализации одного интерфейса), абстракция (выделение ключевых характеристик).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод уменьшает дисперсию, объединяя предсказания моделей на мета-уровне?
Anonymous Quiz
42%
Bagging
13%
Boosting
38%
Stacking
6%
Dropout
🤔 Какой метод уменьшает дисперсию, используя случайные подмножества признаков?
Anonymous Quiz
42%
Bagging
37%
Random Forest
12%
Boosting
9%
Stacking
💊1