Data Science | Тесты
2.63K subscribers
26 photos
423 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшает размерность данных, сохраняя вариативность?
Anonymous Quiz
7%
K-средних
30%
Метод опорных векторов (SVM)
61%
Главные компоненты (PCA)
2%
Линейная регрессия
🤔1
🤔 Как работает Dropout?

Это техника регуляризации в нейросетях, уменьшающая переобучение:
1. На каждой итерации обучения случайно зануляется часть нейронов.
2. Это предотвращает чрезмерную зависимость от отдельных признаков.
3. Во время предсказания Dropout не применяется, а выходы масштабируются.
Dropout делает нейросеть более устойчивой и снижает вероятность переобучения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🤔 Какой метод используется для обучения модели на дисбалансированных данных?
Anonymous Quiz
58%
Undersampling
12%
Grid Search
22%
Feature Scaling
8%
Dropout
🤔 Какой метод уменьшает размер данных без потери информации?
Anonymous Quiz
82%
PCA (Principal Component Analysis)
10%
K-Means Clustering
3%
Decision Trees
5%
Linear Regression
🤔2
🤔 Как делается прунинг деревьев?

1. Pre-pruning: остановка роста дерева по заранее заданным критериям (глубина, минимальный размер листа).
2. Post-pruning: удаление "слабых" ветвей после построения дерева для улучшения обобщения.
3. Метрики, такие как ошибка на валидационной выборке, помогают оценить, какие ветви обрезать.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой алгоритм используется для обнаружения выбросов в данных?
Anonymous Quiz
20%
K-means
57%
Isolation Forest
5%
Linear Regression
18%
PCA
🤔 Как использовать P-value, когда мы проверяем гипотезу?

P-value показывает вероятность получения текущих результатов при условии, что нулевая гипотеза верна. Если P-value ниже уровня значимости, нулевая гипотеза отвергается.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в ансамблевых методах, используя различные модели?
Anonymous Quiz
44%
Bagging
25%
Boosting
20%
Stacking
10%
Gradient Descent
🤔2💊1
🤔 Какой метод машинного обучения используется для анализа и классификации временных рядов, учитывая их локальные паттерны?
Anonymous Quiz
7%
Decision Tree
13%
Логистическая регрессия
66%
DTW (Dynamic Time Warping)
15%
Автоэнкодеры
🤔 Что такое recall?

Recall (полнота) — это метрика, показывающая, какая доля истинных положительных случаев была правильно предсказана моделью. Она рассчитывается как отношение количества истинно положительных предсказаний к сумме истинно положительных и ложно отрицательных. Recall важен, когда важно минимизировать количество пропущенных положительных случаев. Высокий recall означает, что модель почти не пропускает положительные случаи.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from easyoffer
Новая фича на easyoffer Автоотлики

Вы автоматически откликаетесь на подходящие вам вакансии. Попробуйте её бесплатно и начните получать больше предложений о работе.

🚀 Запуск занимаем всего 3 минуты, а экономит очень много времени
🛡 Это безопасно: easyoffer официально одобрен HeadHunter и прошел его модерацию.
🥷🏻 Автоотклик незаметен для рекртера. Автоотклик ничем не отличается от обычного отклика, который вы делаете вручную

Рекрутеры давно используют автоматизацию для поиска кандидатов. Так почему вы должны откликаться вручную?

💡Совет – Добавьте шаблон сопроводительного письма, чтобы откликаться на большее количество вакансий (на некоторые вакансии нельзя откликнуться без сопроводительного)

Попробовать бесплатно → https://easyoffer.ru/autoapply
🤔 Какой метод оптимизации применяется для поиска минимума функции?
Anonymous Quiz
52%
SGD
30%
SGD
7%
v3. K-means
11%
DBSCAN
💊16🤔8
🤔 Какой метод уменьшения размерности используется для сохранения дисперсии данных?
Anonymous Quiz
62%
PCA
12%
LDA
22%
T-SNE
5%
Isomap
🤔 Что хуже: иметь много ложных срабатываний или ложно-отрицательных срабатываний?

Это зависит от задачи. Ложно-отрицательные срабатывания хуже в задачах, где важно не пропустить критический случай (например, диагностика). Ложные срабатывания могут быть менее критичными, но увеличивают нагрузку на систему.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод уменьшает смещение и дисперсию в модели случайного леса?
Anonymous Quiz
45%
Bagging
23%
Boosting
13%
Gradient Descent
20%
Pruning
🤔 Какой метод используется для анализа текстов и определения ключевых слов?
Anonymous Quiz
2%
Logistic Regression
96%
TF-IDF
1%
Decision Tree
2%
K-means
🤔 Что можешь сказать про оконные функции?

Оконные функции в SQL и в библиотеках анализа данных, таких как pandas, позволяют выполнять вычисления по подмножествам данных (окнам), которые связаны с текущей строкой. Это включает в себя операции, такие как суммирование, вычисление среднего, и другие статистические функции, применяемые к "окну" данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод оптимизации учитывает моментум для ускорения обучения?
Anonymous Quiz
63%
Adam
16%
AdaGrad
10%
RMSprop
11%
Gradient Descent
💊2
🤔 Какой метод уменьшает дисперсию, используя случайные подмножества данных для обучения?
Anonymous Quiz
63%
Bagging
15%
Boosting
15%
Stacking
7%
Gradient Descent
💊28