Data Science | Тесты
2.67K subscribers
27 photos
445 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод используется для обучения модели на дисбалансированных данных?
Anonymous Quiz
59%
Undersampling
12%
Grid Search
21%
Feature Scaling
7%
Dropout
🤔 Какой метод уменьшает размер данных без потери информации?
Anonymous Quiz
83%
PCA (Principal Component Analysis)
10%
K-Means Clustering
3%
Decision Trees
4%
Linear Regression
🤔2
🤔 Как делается прунинг деревьев?

1. Pre-pruning: остановка роста дерева по заранее заданным критериям (глубина, минимальный размер листа).
2. Post-pruning: удаление "слабых" ветвей после построения дерева для улучшения обобщения.
3. Метрики, такие как ошибка на валидационной выборке, помогают оценить, какие ветви обрезать.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой алгоритм используется для обнаружения выбросов в данных?
Anonymous Quiz
21%
K-means
57%
Isolation Forest
5%
Linear Regression
17%
PCA
🤔 Как использовать P-value, когда мы проверяем гипотезу?

P-value показывает вероятность получения текущих результатов при условии, что нулевая гипотеза верна. Если P-value ниже уровня значимости, нулевая гипотеза отвергается.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в ансамблевых методах, используя различные модели?
Anonymous Quiz
45%
Bagging
25%
Boosting
20%
Stacking
11%
Gradient Descent
🤔2💊1
🤔 Какой метод машинного обучения используется для анализа и классификации временных рядов, учитывая их локальные паттерны?
Anonymous Quiz
6%
Decision Tree
12%
Логистическая регрессия
67%
DTW (Dynamic Time Warping)
14%
Автоэнкодеры
🤔 Что такое recall?

Recall (полнота) — это метрика, показывающая, какая доля истинных положительных случаев была правильно предсказана моделью. Она рассчитывается как отношение количества истинно положительных предсказаний к сумме истинно положительных и ложно отрицательных. Recall важен, когда важно минимизировать количество пропущенных положительных случаев. Высокий recall означает, что модель почти не пропускает положительные случаи.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from easyoffer
Новая фича на easyoffer Автоотлики

Вы автоматически откликаетесь на подходящие вам вакансии. Попробуйте её бесплатно и начните получать больше предложений о работе.

🚀 Запуск занимаем всего 3 минуты, а экономит очень много времени
🛡 Это безопасно: easyoffer официально одобрен HeadHunter и прошел его модерацию.
🥷🏻 Автоотклик незаметен для рекртера. Автоотклик ничем не отличается от обычного отклика, который вы делаете вручную

Рекрутеры давно используют автоматизацию для поиска кандидатов. Так почему вы должны откликаться вручную?

💡Совет – Добавьте шаблон сопроводительного письма, чтобы откликаться на большее количество вакансий (на некоторые вакансии нельзя откликнуться без сопроводительного)

Попробовать бесплатно → https://easyoffer.ru/autoapply
🤔 Какой метод оптимизации применяется для поиска минимума функции?
Anonymous Quiz
52%
SGD
30%
SGD
6%
v3. K-means
12%
DBSCAN
💊16🤔8
🤔 Какой метод уменьшения размерности используется для сохранения дисперсии данных?
Anonymous Quiz
61%
PCA
14%
LDA
21%
T-SNE
4%
Isomap
🤔 Что хуже: иметь много ложных срабатываний или ложно-отрицательных срабатываний?

Это зависит от задачи. Ложно-отрицательные срабатывания хуже в задачах, где важно не пропустить критический случай (например, диагностика). Ложные срабатывания могут быть менее критичными, но увеличивают нагрузку на систему.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод уменьшает смещение и дисперсию в модели случайного леса?
Anonymous Quiz
46%
Bagging
23%
Boosting
12%
Gradient Descent
19%
Pruning
🤔 Какой метод используется для анализа текстов и определения ключевых слов?
Anonymous Quiz
2%
Logistic Regression
96%
TF-IDF
1%
Decision Tree
1%
K-means
🤔 Что можешь сказать про оконные функции?

Оконные функции в SQL и в библиотеках анализа данных, таких как pandas, позволяют выполнять вычисления по подмножествам данных (окнам), которые связаны с текущей строкой. Это включает в себя операции, такие как суммирование, вычисление среднего, и другие статистические функции, применяемые к "окну" данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод оптимизации учитывает моментум для ускорения обучения?
Anonymous Quiz
63%
Adam
17%
AdaGrad
9%
RMSprop
10%
Gradient Descent
💊2
🤔 Какой метод уменьшает дисперсию, используя случайные подмножества данных для обучения?
Anonymous Quiz
62%
Bagging
17%
Boosting
15%
Stacking
7%
Gradient Descent
💊28
🤔 Какие проблемы могут возникнуть при прогнозе LTV на полгода вперед?

Основные проблемы при прогнозе LTV (Lifetime Value) на длительный срок включают в себя высокую неопределённость в поведении пользователей, изменение рыночных условий и устаревание данных. Кроме того, прогнозы могут быть неточными из-за сезонных изменений или новых факторов, которые не были учтены в модели. Также возможна недостаточность данных для точного прогнозирования поведения пользователей на долгий срок. Модели могут переоценивать или недооценивать реальные значения LTV.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍1
🤔 Какой метод используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
24%
K-means
71%
User-Based Collaborative Filtering
2%
Decision Tree
4%
TF-IDF