Data Science | Тесты
2.62K subscribers
26 photos
426 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой алгоритм часто используется для прогнозирования временных рядов?
Anonymous Quiz
8%
Линейная регрессия
83%
ARIMA
4%
Случайный лес
4%
K-means
🤔 Как работает регресс?

Регрессия — это метод машинного обучения, который моделирует зависимость между одной или несколькими независимыми переменными (признаками) и зависимой переменной (предсказываемой величиной). Основная цель регрессии — предсказать значение зависимой переменной на основе новых значений независимых переменных, минимизируя ошибку. В Data Science регрессия широко используется для прогнозирования и анализа взаимосвязей данных, таких как линейная и логистическая регрессии.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊3🔥2
🤔 Какой метод часто применяют для оценки точности моделей машинного обучения?
Anonymous Quiz
81%
Cross-Validation
6%
K-means
10%
PCA
3%
Логистическая регрессия
💊6
🤔 Какой метод уменьшает смещение и дисперсию в регрессии с L1 и L2 штрафами?
Anonymous Quiz
12%
Ridge Regression
22%
Lasso
61%
Elastic Net
5%
PCA
🤔 В чем различия между методами apply и applymap?

В pandas `apply` используется для применения функции вдоль оси DataFrame (по строкам или столбцам), в то время как `applymap` применяется к каждому элементу DataFrame индивидуально.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод проверки качества модели делит данные на k подмножеств?
Anonymous Quiz
10%
Grid Search
5%
Random Search
74%
Cross-Validation
12%
Bootstrap
🤔 Какой метод обнаруживает выбросы в многомерных данных?
Anonymous Quiz
22%
PCA
47%
Isolation Forest
14%
K-Means Clustering
17%
SVM
🤔 В чем разница между pivot и pivot_table?

`pivot` может создавать новый производный DataFrame, переформатируя исходный DataFrame. Он не поддерживает агрегацию данных. `pivot_table` делает то же самое, что и `pivot`, но также поддерживает агрегацию данных, позволяя использовать функции агрегирования, такие как суммирование, среднее и т.д.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для повышения точности моделей путем создания ансамбля из нескольких моделей?
Anonymous Quiz
90%
Градиентный бустинг
8%
K-means
1%
Линейная регрессия
1%
Логистическая регрессия
🤔 Вопрос: Какой алгоритм является примером ленивого обучения?
Anonymous Quiz
14%
Линейная регрессия
59%
K-ближайших соседей (K-NN)
17%
Случайный лес
10%
Нейронные сети
🔥1💊1
🤔 Можно ли тьюнить только Batch Norm?

1. Да, параметры Batch Norm, такие как скорость обучения, моментум и гамма/бета, могут быть настроены для улучшения обучения.
2. Однако тьюнинг только Batch Norm может быть недостаточен без оптимизации других частей модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
19%
K-means
77%
User-Based Collaborative Filtering
2%
Decision Tree
2%
Naive Bayes
🔥1
🤔 Какой метод уменьшает смещение и дисперсию в нейронных сетях?
Anonymous Quiz
30%
Dropout
50%
Batch Normalization
13%
Ensemble Learning
6%
Gradient Clipping
💊3🔥1
🤔 Что знаешь про early stopping?

Early stopping — это техника регуляризации, которая завершает обучение модели, если метрика качества на валидационном наборе перестаёт улучшаться. Это предотвращает переобучение, позволяя сохранить оптимальные параметры до ухудшения обобщающей способности. Метод основан на мониторинге функции ошибки или качества модели во время каждой итерации обучения.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в модели случайного леса?
Anonymous Quiz
55%
Bagging
22%
Boosting
12%
Pruning
12%
Cross-Validation
🤔 Какой метод машинного обучения используется для прогнозирования категориальных переменных?
Anonymous Quiz
5%
Линейная регрессия
64%
Логистическая регрессия
22%
K-means
9%
PCA
🤔1
🤔 Как систематическая ошибка и дисперсии связаны между собой?

Высокая систематическая ошибка (bias) уменьшает сложность модели, но снижает точность, а высокая дисперсия (variance) приводит к переобучению. Баланс между ними важен для оптимальной работы модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2
🤔 Какой метод помогает бороться с мультиколлинеарностью?
Anonymous Quiz
11%
Ridge Regression
24%
Lasso Regression
20%
Elastic Net
45%
All of the above
🤔 Какой метод машинного обучения используется для обнаружения выбросов?
Anonymous Quiz
6%
Линейная регрессия
72%
Изолирующий лес
3%
Логистическая регрессия
18%
PCA
🔥1
🤔 Что такое Boxplot?

Это статистический график, показывающий распределение данных:
1. Ящик (Box) – показывает межквартильный размах (между Q1 и Q3).
2. Линия внутри ящика – медиана (Q2).
3. "Усы" – представляют диапазон данных без выбросов.
4. Точки за пределами усов – выбросы.
Boxplot полезен для визуализации асимметрии, выбросов и распределения данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2