Data Science | Тесты
2.67K subscribers
27 photos
445 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какие проблемы могут возникнуть при прогнозе LTV на полгода вперед?

Основные проблемы при прогнозе LTV (Lifetime Value) на длительный срок включают в себя высокую неопределённость в поведении пользователей, изменение рыночных условий и устаревание данных. Кроме того, прогнозы могут быть неточными из-за сезонных изменений или новых факторов, которые не были учтены в модели. Также возможна недостаточность данных для точного прогнозирования поведения пользователей на долгий срок. Модели могут переоценивать или недооценивать реальные значения LTV.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍1
🤔 Какой метод используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
24%
K-means
71%
User-Based Collaborative Filtering
2%
Decision Tree
4%
TF-IDF
🤔 Какой метод выбирает модели путём уменьшения количества данных?
Anonymous Quiz
51%
PCA
11%
Bagging
17%
Cross-validation
21%
Bootstrapping
💊6
🤔 Как делать прогноз для новых пользователей?

Для новых пользователей, у которых нет достаточного количества данных, можно использовать методы прогнозирования на основе поведения похожих пользователей (кластеризация, сегментация) или демографических данных. Также можно использовать модели, которые комбинируют поведенческие данные с внешними признаками (например, география или источник трафика). Важным шагом является регулярное обновление модели по мере поступления новых данных о поведении пользователя. Кроме того, можно использовать методы cold-start для работы с новыми пользователями.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для повышения устойчивости модели к выбросам?
Anonymous Quiz
8%
Линейная регрессия
40%
Градиентный бустинг
46%
Медианная регрессия
6%
K-means
🤔 Какой метод применяется для оценки важности признаков в sklearn?
Anonymous Quiz
63%
feature_importances_
31%
get_feature_importances
3%
importance_of_features
3%
feature_significance_
🤔 Какую метрику регрессии используешь для объяснения результатов?

Для объяснения результатов регрессии обычно используются несколько метрик, таких как среднеквадратичная ошибка (MSE), средняя абсолютная ошибка (MAE) и R-квадрат. Выбор зависит от специфики задачи и приоритетов: чувствительности к выбросам, интерпретируемости или доли объясненной дисперсии. Важно учитывать контекст и использовать несколько метрик для полной оценки.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод машинного обучения используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
8%
Decision Tree
5%
TF-IDF
5%
Автоэнкодеры
82%
User-Based Collaborative Filtering
🤔 Какой метод использует ансамбль деревьев решений для повышения точности модели?
Anonymous Quiz
77%
AdaBoost
10%
PCA
7%
DBSCAN
6%
Naive Bayes
🤔 Что такое градиентное затухание?

Градиентное затухание (vanishing gradients) — это проблема, когда в глубоких нейросетях градиенты становятся очень малыми при обратном распространении.
Это мешает обновлению весов в начальных слоях, и обучение "замирает".
Чаще всего возникает в RNN и в сетях с плохой инициализацией или неподходящей функцией активации.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
🤔 Какой метод уменьшает смещение при работе с несбалансированными данными?
Anonymous Quiz
12%
Oversampling
38%
Class Weighing
35%
SMOTE
15%
Undersampling
💊3🔥1
🤔 Какой метод машинного обучения используется для классификации временных рядов на основе их формы и паттернов?
Anonymous Quiz
9%
Decision Tree
13%
Логистическая регрессия
58%
Shapelets
19%
Автоэнкодеры
🔥1
🤔 Где вообще используются линейные модели?

Линейные модели применяются в задачах с линейной зависимостью, таких как регрессия для предсказания спроса или цен, классификация в кредитных скорингах, а также в задачах с высоким соотношением признаков к данным.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1💊1
🤔 Какой метод машинного обучения используется для классификации на основе вероятностей?
Anonymous Quiz
8%
Линейная регрессия
6%
K-ближайших соседей
8%
Метод опорных векторов
78%
Наивный байесовский классификатор
🔥1
🤔 Какой метод оптимизации применяется для поиска минимума функции?
Anonymous Quiz
57%
SGD
34%
SGD
7%
v3. K-means
2%
DBSCAN
💊17🤔7
🤔 Чем отличается итератор от генератора?

Итератор — это объект с методами iter и next, позволяющий поочерёдно перебирать элементы. Генератор — это удобная форма итератора, создаваемая функцией с использованием yield, которая сохраняет своё состояние между вызовами. Итераторы требуют ручной реализации, а генераторы упрощают создание итераций.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод часто используется для визуализации данных в двумерном пространстве?
Anonymous Quiz
46%
PCA
31%
T-SNE
15%
LDA
9%
NMF
💊3🔥1
🤔 Как работает where?

Функция where возвращает элементы, соответствующие условию:
1. В SQL — фильтрует строки, соответствующие критериям.
2. В NumPy — выбирает элементы массива по условию или заменяет значения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какую функцию потерь используют для регрессии в линейной модели?
Anonymous Quiz
9%
Логистическую функцию
2%
Hinge-функцию
89%
Среднеквадратичную ошибку (MSE)
0%
Перекрестную энтропию