Data Science | Тесты
2.62K subscribers
26 photos
421 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшает смещение и дисперсию в регрессии с L1 и L2 штрафами?
Anonymous Quiz
12%
Ridge Regression
18%
Lasso
66%
Elastic Net
4%
PCA
🤔 Какой метод машинного обучения находит ближайших соседей данных точек?
Anonymous Quiz
20%
K-Means Clustering
1%
Random Forest
78%
K-Nearest Neighbors
1%
Support Vector Machines
🤔 Зачем нужен yield вместо return в функции?

`yield` используется в генераторах Python и позволяет функции возвращать промежуточный результат, приостанавливая выполнение функции и сохраняя ее состояние для последующего возобновления. Это эффективно для работы с большими данными или сложными алгоритмами.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какая функция используется для вычисления коэффициента корреляции?
Anonymous Quiz
34%
pearsonr
13%
spearmanr
2%
kendalltau
51%
correlate
🤔 Какой метод уменьшает дисперсию, нормализуя данные на скрытых слоях?
Anonymous Quiz
15%
Dropout
77%
Batch Normalization
6%
Gradient Clipping
2%
Early Stopping
🤔 В чем разница между L1 и L2 регуляризацией?

L1-регуляризация (Lasso) добавляет сумму модулей весов к функции потери, склоняя веса к нулю, что способствует разреженности. L2-регуляризация (Ridge) добавляет сумму квадратов весов, уменьшая их величину, но не зануляя. L1 эффективна для отбора признаков, а L2 — для стабилизации модели и борьбы с переобучением.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод уменьшает дисперсию модели, суммируя прогнозы нескольких моделей?
Anonymous Quiz
85%
Бэггинг
6%
Ридж-регрессия
1%
Лассо-регрессия
8%
PCA
🤔 Какой метод машинного обучения используется для классификации данных, используя вероятностные распределения признаков?
Anonymous Quiz
21%
Логистическая регрессия
69%
Наивный байесовский классификатор
3%
K-ближайших соседей
7%
Метод опорных векторов (SVM)
🤔 Как можно сравнивать два ненормальных распределения?

1. Применить непараметрические тесты, такие как тест Манна-Уитни или Краскела-Уоллиса.
2. Использовать бутстрепинг для создания доверительных интервалов.
3. Рассмотреть преобразование данных для приближения к нормальному виду.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод часто применяют для предобработки категориальных данных?
Anonymous Quiz
91%
One-hot encoding
5%
K-means
1%
PCA
2%
Логистическая регрессия
🤔 Какая метрика используется для оценки качества модели классификации, учитывающая как полноту, так и точность?
Anonymous Quiz
19%
ROC AUC
74%
F1 Score
2%
Mean Squared Error
5%
Accuracy
🤔 В чём смысл Information Value (IV)?

Это метрика, используемая для оценки предсказательной способности признака относительно целевой переменной.
1. Высокое значение IV говорит о сильной связи между признаком и целевой переменной.
2. Часто используется в кредитном скоринге для выбора наиболее значимых признаков.
3. Значения IV помогают определить, какие признаки следует включить в модель, а какие можно исключить.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод используется для детектирования выбросов в наборе данных?
Anonymous Quiz
56%
DBSCAN
10%
k-means
26%
LDA
8%
PCA
🔥2
🤔 Какой метод часто используется для обнаружения аномалий в данных?
Anonymous Quiz
5%
Линейная регрессия
6%
Логистическая регрессия
73%
Изолирующий лес
16%
K-means
🤔 Чем отличается градиентный спуск от SGD?

Градиентный спуск использует весь набор данных для вычисления градиента и обновления параметров, что требует значительных вычислительных ресурсов. Стохастический градиентный спуск (SGD) обновляет параметры после каждого примера или мини-батча, что ускоряет обучение, но может быть менее стабильным. SGD часто сходится быстрее, но может застревать в локальных минимумах.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод часто применяют для классификации изображений?
Anonymous Quiz
92%
CNN
4%
K-means
2%
PCA
2%
Логистическая регрессия
🤔 Какой метод кластеризации не требует заранее знать число кластеров?
Anonymous Quiz
28%
K-means
46%
DBSCAN
23%
Hierarchical Clustering
4%
Mean Shift
🤔 Чем отличаются str и repr?

str предназначен для отображения понятного текста для пользователя, repr — для отображения точного представления объекта для разработчика.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой алгоритм используется для снижения размерности данных с сохранением их вариативности?
Anonymous Quiz
5%
K-means кластеризация
90%
Метод главных компонент (PCA)
1%
Линейная регрессия
4%
Деревья решений
🤔 Какой метод машинного обучения используется для предсказания категориальных переменных на основе временных рядов?
Anonymous Quiz
13%
Decision Tree
13%
Логистическая регрессия
27%
Автоэнкодеры
48%
RNN