Data Science | Тесты
2.51K subscribers
25 photos
364 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Что такое мультиколлинеарность?

Это ситуация, когда признаки сильно коррелируют друг с другом.
- Это вызывает нестабильность линейных моделей, так как коэффициенты могут становиться большими и неинтерпретируемыми.
- Решения: удаление зависимых признаков, PCA, L1-регуляризация (Lasso).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая техника используется для обработки естественного языка?
Anonymous Quiz
5%
Convolutional Neural Networks (CNN)
4%
Latent Dirichlet Allocation (LDA)
0%
Time Series Analysis
91%
Natural Language Processing (NLP)
💊3
🤔 Какой метод уменьшает дисперсию, комбинируя модели с заменой?
Anonymous Quiz
19%
Boosting
36%
Bagging
38%
Stacking
8%
Gradient Descent
🤔 Что такое пи вэлью?

P-value — это вероятность того, что наблюдаемые данные или более экстремальные данные могли бы возникнуть при условии, что нулевая гипотеза верна. В контексте статистических тестов, маленькое значение p-value указывает на то, что нулевая гипотеза может быть отвергнута в пользу альтернативной гипотезы. Обычно порог значимости устанавливается на уровне 0.05, и если p-value меньше этого порога, нулевая гипотеза отвергается. P-value не говорит о размере эффекта, а лишь о степени уверенности в полученных данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод оптимизации используется для минимизации функции потерь путем учета как первого, так и второго моментов градиентов?
Anonymous Quiz
20%
Градиентный спуск
28%
RMSProp
10%
Метод Ньютона
42%
Адам
🤔 Какой метод уменьшает смещение и дисперсию в ансамблевых моделях, используя взвешивание?
Anonymous Quiz
43%
Bagging
20%
Boosting
30%
Stacking
8%
Gradient Descent
🤔 В чём разница между методом GMM и K-Means?

1. K-Means:
o Основан на разделении данных по расстояниям до центроидов (жёсткое разделение).
o Каждая точка принадлежит только одному кластеру.
2. GMM (Gaussian Mixture Model):
o Использует вероятностный подход: каждая точка имеет вероятность принадлежности к каждому кластеру (мягкое разделение).
o Кластеры формируются на основе распределений Гаусса, что делает GMM более гибким для сложных данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает смещение и дисперсию, добавляя случайные шумы в данные?
Anonymous Quiz
11%
Bagging
16%
Dropout
67%
Data Augmentation
6%
Boosting
💊19
🤔 Какой метод машинного обучения используется для кластеризации данных на основе плотности?
Anonymous Quiz
18%
K-средние
63%
DBSCAN
10%
Иерархическая кластеризация
8%
T-SNE
🤔 Какой оптимизатор выбрать для обучения нейронной сети?

Adam часто используется из-за адаптивного шага обучения. SGD предпочтителен для больших данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод оптимизации используется для минимизации функции потерь путем адаптивного изменения скорости обучения?
Anonymous Quiz
12%
Градиентный спуск
20%
Стохастический градиентный спуск
10%
RMSProp
58%
Адам
🤔 Какой метод использует алгоритм ожидаемого максимума для кластеризации данных?
Anonymous Quiz
25%
K-means
15%
DBSCAN
35%
Gaussian Mixture Models
25%
Hierarchical Clustering
🤔 Сравнение архитектуры RNN, CNN, трансформера?

RNN обрабатывает данные последовательно и хорошо работает с временными рядами или текстами, но страдает от проблем с градиентами и плохо масштабируется. CNN извлекает локальные признаки через свёртки, изначально предназначен для изображений, но может применяться к тексту. Трансформер использует механизм внимания, обрабатывает всё параллельно и учитывает контекст целиком, что делает его эффективным в работе с языком и последовательностями.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊1
🤔 Какой метод уменьшает дисперсию в ансамблевом обучении?
Anonymous Quiz
63%
Bagging
27%
Boosting
5%
Gradient Descent
6%
Cross-Validation
🔥1
🤔 Какой метод снижает дисперсию ансамблевой модели в машинном обучении?
Anonymous Quiz
70%
Бэггинг
15%
Градиентный бустинг
11%
Случайные леса
3%
Стеккинг
🤔 В чем разница между командами DELETE и TRUNCATE?

`DELETE` удаляет строки из таблицы на основе указанного условия и записывает каждое удаление в журнал транзакций, что позволяет выполнить откат операции. `TRUNCATE` быстро удаляет все строки из таблицы, не записывая в журнал отдельные удаления, что делает эту операцию быстрой, но необратимой.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности часто используется для визуализации данных?
Anonymous Quiz
42%
PCA
51%
T-SNE
5%
LDA
2%
NMF