Data Science | Тесты
2.55K subscribers
25 photos
386 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Что такое Median?

Это центральное значение упорядоченного ряда.
- Если количество элементов нечетное, медиана – это средний элемент.
- Если четное, медиана – среднее двух центральных значений.
Медиана менее чувствительна к выбросам, чем среднее (Mean).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊2
🤔 Какой метод уменьшения размерности используется для выделения скрытых факторов в данных с учетом неотрицательных ограничений?
Anonymous Quiz
28%
PCA
10%
LDA
43%
NMF
19%
T-SNE
🤔 Какой метод уменьшения размерности используется для выделения скрытых факторов в данных с учетом неотрицательных ограничений?
Anonymous Quiz
27%
PCA
17%
LDA
49%
NMF
6%
T-SNE
🤔 В чем разница между классификацией и регрессией?

Классификация определяет категории, а регрессия – непрерывные значения. Например, классификация предсказывает класс, а регрессия – числовой результат.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод оценки помогает избежать переобучения модели?
Anonymous Quiz
48%
Кросс-валидация
6%
Гиперпараметрическая оптимизация
45%
Регуляризация
0%
Аугментация данных
💊6
🤔 Какой метод используется для классификации текстовых данных с учетом частотных характеристик слов?
Anonymous Quiz
1%
Decision Tree
84%
TF-IDF
11%
Naive Bayes
4%
K-means
🤔 Как работает градиентный бустинг регрессор?

Это ансамблевый метод, который комбинирует множество слабых моделей (обычно деревьев решений) для улучшения качества предсказаний:
1. Первая модель предсказывает исходные данные, а остатки ошибок передаются следующей.
2. Каждое новое дерево обучается на ошибках предыдущих, уменьшая отклонения.
3. Градиентный спуск минимизирует ошибку, выбирая оптимальные веса.
4. Итоговое предсказание – это взвешенная сумма предсказаний всех деревьев.
Градиентный бустинг хорошо работает с нелинейными зависимостями и устойчив к выбросам.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для оценки модели с дисбалансированными данными?
Anonymous Quiz
4%
Точность
62%
F1-score
29%
ROC AUC
5%
Каппа коэффициент
🤔 Какой метод применяется для борьбы с мультиколлинеарностью в регрессии?
Anonymous Quiz
19%
Ridge регрессия
39%
Lasso регрессия
17%
Elastic Net
25%
Principal Component Analysis (PCA)
🤔 Зачем нужен self super?

self указывает на текущий экземпляр класса, а super позволяет обращаться к методам родительского класса, избегая дублирования кода.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод статистики используется для проверки гипотезы об однородности дисперсий?
Anonymous Quiz
24%
Т-тест
22%
Z-тест
29%
Фишер тест
25%
Манна-Уитни
🤔 Какой алгоритм часто используется для классификации текстовых данных?
Anonymous Quiz
3%
Линейная регрессия
13%
K-means
24%
Логистическая регрессия
61%
Наивный байесовский классификатор
🤔 Какие подходы понижения размерности известны?

Основные подходы понижения размерности включают метод главных компонент (PCA), сингулярное разложение (SVD), t-SNE и UMAP. PCA снижает размерность данных, находя новые оси, которые объясняют наибольшую дисперсию данных. t-SNE и UMAP используются для визуализации данных в пространстве низкой размерности, сохраняя их топологическую структуру. Эти методы позволяют уменьшить количество признаков при сохранении важной информации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод используется для снижения размерности данных?
Anonymous Quiz
78%
PCA
18%
t-SNE
1%
Random Forest
3%
KMeans
💊4
🤔 Какой метод машинного обучения хорошо работает с линейно неразделимыми данными?
Anonymous Quiz
23%
Линейная регрессия
21%
K-ближайших соседей
45%
Метод опорных векторов с ядром
10%
Логистическая регрессия
🤔 Как работают несимметрические метрики?

Несимметрические метрики в контексте машинного обучения оценивают модель, акцентируя внимание на одном классе или типе ошибки больше, чем на других. Это особенно полезно в случаях, когда стоимость одного типа ошибки значительно выше другого. Примером несимметричной метрики является F1-score, который более чувствителен к классам с меньшим числом образцов или когда важно сбалансировать точность и полноту.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для кластеризации данных на основе иерархической структуры?
Anonymous Quiz
3%
K-средние
20%
DBSCAN
77%
Иерархическая кластеризация
0%
T-SNE
🤔 Какой метод оценки моделей снижает смещение и дисперсию?
Anonymous Quiz
51%
Cross-validation
35%
Bootstrap Aggregating
9%
Gradient Descent
6%
Hyperparameter Tuning
🤔 Как решить задачу, где присутствует одновременно два target – один categorical, другой continuous?

Используются модели multi-output, которые обучаются на несколько целевых переменных, например, через отдельные выходные слои в нейросети.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм часто используется для прогнозирования временных рядов?
Anonymous Quiz
6%
Линейная регрессия
85%
ARIMA
5%
Случайный лес
3%
K-means