Data Science | Тесты
2.67K subscribers
27 photos
462 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой алгоритм часто используется для прогнозирования временных рядов?
Anonymous Quiz
8%
Линейная регрессия
84%
ARIMA
4%
Случайный лес
4%
K-means
🤔 Как работает регресс?

Регрессия — это метод машинного обучения, который моделирует зависимость между одной или несколькими независимыми переменными (признаками) и зависимой переменной (предсказываемой величиной). Основная цель регрессии — предсказать значение зависимой переменной на основе новых значений независимых переменных, минимизируя ошибку. В Data Science регрессия широко используется для прогнозирования и анализа взаимосвязей данных, таких как линейная и логистическая регрессии.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊3🔥2
🤔 Какой метод часто применяют для оценки точности моделей машинного обучения?
Anonymous Quiz
81%
Cross-Validation
6%
K-means
11%
PCA
3%
Логистическая регрессия
💊6
🤔 Какой метод уменьшает смещение и дисперсию в регрессии с L1 и L2 штрафами?
Anonymous Quiz
11%
Ridge Regression
24%
Lasso
60%
Elastic Net
5%
PCA
🤔 В чем различия между методами apply и applymap?

В pandas `apply` используется для применения функции вдоль оси DataFrame (по строкам или столбцам), в то время как `applymap` применяется к каждому элементу DataFrame индивидуально.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
🤔 Какой метод проверки качества модели делит данные на k подмножеств?
Anonymous Quiz
9%
Grid Search
5%
Random Search
74%
Cross-Validation
11%
Bootstrap
🤔 Какой метод обнаруживает выбросы в многомерных данных?
Anonymous Quiz
23%
PCA
47%
Isolation Forest
13%
K-Means Clustering
16%
SVM
🤔 В чем разница между pivot и pivot_table?

`pivot` может создавать новый производный DataFrame, переформатируя исходный DataFrame. Он не поддерживает агрегацию данных. `pivot_table` делает то же самое, что и `pivot`, но также поддерживает агрегацию данных, позволяя использовать функции агрегирования, такие как суммирование, среднее и т.д.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для повышения точности моделей путем создания ансамбля из нескольких моделей?
Anonymous Quiz
91%
Градиентный бустинг
8%
K-means
1%
Линейная регрессия
1%
Логистическая регрессия
🤔 Вопрос: Какой алгоритм является примером ленивого обучения?
Anonymous Quiz
14%
Линейная регрессия
58%
K-ближайших соседей (K-NN)
18%
Случайный лес
10%
Нейронные сети
🔥1💊1
🤔 Можно ли тьюнить только Batch Norm?

1. Да, параметры Batch Norm, такие как скорость обучения, моментум и гамма/бета, могут быть настроены для улучшения обучения.
2. Однако тьюнинг только Batch Norm может быть недостаточен без оптимизации других частей модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
21%
K-means
76%
User-Based Collaborative Filtering
2%
Decision Tree
1%
Naive Bayes
🔥1
🤔 Какой метод уменьшает смещение и дисперсию в нейронных сетях?
Anonymous Quiz
31%
Dropout
49%
Batch Normalization
15%
Ensemble Learning
6%
Gradient Clipping
💊3🔥1
🤔 Что знаешь про early stopping?

Early stopping — это техника регуляризации, которая завершает обучение модели, если метрика качества на валидационном наборе перестаёт улучшаться. Это предотвращает переобучение, позволяя сохранить оптимальные параметры до ухудшения обобщающей способности. Метод основан на мониторинге функции ошибки или качества модели во время каждой итерации обучения.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в модели случайного леса?
Anonymous Quiz
51%
Bagging
22%
Boosting
14%
Pruning
13%
Cross-Validation
🤔 Какой метод машинного обучения используется для прогнозирования категориальных переменных?
Anonymous Quiz
6%
Линейная регрессия
63%
Логистическая регрессия
21%
K-means
9%
PCA
🤔1
🤔 Как систематическая ошибка и дисперсии связаны между собой?

Высокая систематическая ошибка (bias) уменьшает сложность модели, но снижает точность, а высокая дисперсия (variance) приводит к переобучению. Баланс между ними важен для оптимальной работы модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2
🤔 Какой метод помогает бороться с мультиколлинеарностью?
Anonymous Quiz
11%
Ridge Regression
24%
Lasso Regression
20%
Elastic Net
44%
All of the above
🤔 Какой метод машинного обучения используется для обнаружения выбросов?
Anonymous Quiz
6%
Линейная регрессия
73%
Изолирующий лес
4%
Логистическая регрессия
18%
PCA
🔥1
🤔 Что такое Boxplot?

Это статистический график, показывающий распределение данных:
1. Ящик (Box) – показывает межквартильный размах (между Q1 и Q3).
2. Линия внутри ящика – медиана (Q2).
3. "Усы" – представляют диапазон данных без выбросов.
4. Точки за пределами усов – выбросы.
Boxplot полезен для визуализации асимметрии, выбросов и распределения данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2