Data Science | Тесты
2.67K subscribers
27 photos
445 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Как работает Dropout?

Это техника регуляризации в нейросетях, уменьшающая переобучение:
1. На каждой итерации обучения случайно зануляется часть нейронов.
2. Это предотвращает чрезмерную зависимость от отдельных признаков.
3. Во время предсказания Dropout не применяется, а выходы масштабируются.
Dropout делает нейросеть более устойчивой и снижает вероятность переобучения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод уменьшает дисперсию в модели случайного леса?
Anonymous Quiz
61%
Bagging
18%
Boosting
9%
Gradient Descent
12%
Cross-Validation
🤔 Какой метод машинного обучения устойчив к переобучению?
Anonymous Quiz
16%
Линейная регрессия
6%
Логистическая регрессия
65%
Случайный лес
14%
K-means
🤔 Назови формулу линейной модели.

Формула линейной модели имеет вид: `y = w0 + w1 * x1 + w2 * x2 + ... + wn * xn`, где `y` — это предсказанная величина, `x1, x2, ..., xn` — входные переменные (признаки), а `w0, w1, ..., wn` — коэффициенты (веса), которые модель подбирает во время обучения. `w0` представляет собой свободный член (смещение или bias). Цель линейной регрессии — найти такие значения весов, которые минимизируют ошибку предсказания.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности часто используется для визуализации данных?
Anonymous Quiz
49%
PCA
22%
PCA
15%
LDA
14%
NMF
💊17🤔9
🤔 Какой метод используется для предсказания категориальных переменных на основе вероятностных распределений?
Anonymous Quiz
28%
Logistic Regression
60%
Naive Bayes
5%
Decision Tree
7%
Random Forest
🤔 Как работает MSE?

MSE (Mean Squared Error) — это метрика, используемая для оценки качества модели регрессии, которая измеряет среднее квадратичное отклонение предсказанных значений от фактических. Она рассчитывается как среднее арифметическое квадратов разности между предсказанными и реальными значениями: `MSE = (1/n) * Σ(actual - predicted)^2`, где n — количество наблюдений. MSE чувствительна к большим ошибкам, так как квадраты отклонений увеличивают вес крупных ошибок. Цель модели — минимизировать MSE, чтобы предсказания были как можно ближе к фактическим значениям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает переобучение в глубоком обучении, исключая случайные нейроны?
Anonymous Quiz
13%
Batch Normalization
11%
L2-регуляризация
71%
Dropout
5%
Data Augmentation
🤔 Как избегают коллизии в хеш-таблице

Для предотвращения коллизий в хэш-таблице используются методы, такие как цепочки (связывание элементов в списки) и открытая адресация (перенос коллизий в другие доступные ячейки). Метод цепочек добавляет все значения с одинаковым хэшом в связанный список, что позволяет хранить несколько элементов в одной ячейке. В открытой адресации при коллизии выполняется последовательный поиск следующей свободной ячейки.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод повышает интерпретируемость модели при борьбе с мультиколлинеарностью?
Anonymous Quiz
5%
Обычная линейная регрессия (OLR)
31%
Регрессия гребня (Ridge)
30%
Метод опорных векторов (SVM)
35%
Лассо регрессия (Lasso)
🤔 Какие технологии применяют для больших данных?
Anonymous Quiz
45%
Hadoop
37%
Spark
11%
NoSQL базы данных
7%
Kubernetes
💊8🤔1
🤔 Как работает having?

`HAVING` в SQL используется для фильтрации результатов группировки, которые были созданы с помощью `GROUP BY`. В отличие от `WHERE`, который фильтрует строки до группировки, `HAVING` применяет фильтры уже после того, как данные были агрегированы. Это позволяет отфильтровывать группы на основе агрегатных функций, таких как `COUNT()`, `SUM()` или `AVG()`. Использование `HAVING` удобно, когда требуется отобрать только те группы, которые соответствуют определённым условиям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения устойчив к переобучению за счет использования нескольких слабых моделей?
Anonymous Quiz
6%
Линейная регрессия
77%
Градиентный бустинг
13%
K-ближайших соседей
4%
Логистическая регрессия
💊2
🤔 Какой метод снижает размерность данных и увеличивает объяснимость?
Anonymous Quiz
82%
PCA
7%
K-means
8%
Logistic Regression
4%
Random Forest
💊1
🤔 Как делается прунинг деревьев?

1. Pre-pruning: остановка роста дерева по заранее заданным критериям (глубина, минимальный размер листа).
2. Post-pruning: удаление "слабых" ветвей после построения дерева для улучшения обобщения.
3. Метрики, такие как ошибка на валидационной выборке, помогают оценить, какие ветви обрезать.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает размерность данных, сохраняя как можно больше вариации?
Anonymous Quiz
2%
Градиентный спуск
72%
Метод главных компонент
17%
Лассо-регрессия
9%
Бэггинг
💊1
🤔 Какой алгоритм используется для выявления аномалий в данных?
Anonymous Quiz
12%
Random Forest
65%
Isolation Forest
6%
Gradient Boosting
17%
Naive Bayes
👍2
🤔 Как представить модель LTV для бизнеса?

Модель LTV для бизнеса следует представить как инструмент для прогнозирования доходов от клиентов на протяжении их жизненного цикла, что позволяет планировать стратегии удержания, маркетинговые усилия и бюджеты. Важно объяснить, как модель использует данные для определения ключевых показателей, таких как частота покупок, средний чек и продолжительность взаимодействия. Модель должна быть легко интерпретируемой для принятия управленческих решений. Основное внимание должно быть уделено практичес

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
🤔 Какой метод машинного обучения используется для прогнозирования временных рядов с учетом сезонных компонентов?
Anonymous Quiz
4%
Decision Tree
8%
Логистическая регрессия
82%
SARIMA
6%
Автоэнкодеры
🔥1