Data Science | Тесты
2.67K subscribers
27 photos
445 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшает смещение при оценке модели?
Anonymous Quiz
31%
Ensemble Learning
26%
Gradient Descent
35%
Regularization
9%
Feature Selection
💊3
🤔 Как избегают коллизии в хеш мапе?

В хеш-мапах коллизии избегаются несколькими способами:
1. Цепочки: каждый элемент хеш-таблицы содержит список (или другую структуру данных), который может хранить несколько элементов с одинаковым хешем.
2. Открытая адресация: при коллизии происходит последовательный поиск следующей свободной ячейки по определенному алгоритму (линейное пробирование, квадратичное пробирование, двойное хеширование).
3. Перехеширование: при высоком уровне заполненности хеш-таблицы, таблица может быть перестроена с новым размером и новой хеш-функцией для уменьшения количества коллизий.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для прогнозирования категориальных переменных на основе дерева решений?
Anonymous Quiz
3%
Линейная регрессия
8%
Логистическая регрессия
86%
Decision Tree
3%
K-means
💊3
🤔 Какой метод уменьшает переобучение, используя комбинацию прогнозов нескольких моделей?
Anonymous Quiz
5%
Dropout
13%
Batch Normalization
74%
Boosting
8%
Regularization
💊5
🤔 Назови формулу линейной модели.

Формула линейной модели имеет вид: `y = w0 + w1 * x1 + w2 * x2 + ... + wn * xn`, где `y` — это предсказанная величина, `x1, x2, ..., xn` — входные переменные (признаки), а `w0, w1, ..., wn` — коэффициенты (веса), которые модель подбирает во время обучения. `w0` представляет собой свободный член (смещение или bias). Цель линейной регрессии — найти такие значения весов, которые минимизируют ошибку предсказания.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод уменьшает дисперсию в линейной регрессии?
Anonymous Quiz
34%
Lasso
33%
Ridge
17%
PCA
16%
Elastic Net
💊3
🤔 Какой метод уменьшает дисперсию в модели нейронной сети?
Anonymous Quiz
31%
Dropout
48%
Batch Normalization
14%
Gradient Clipping
7%
Data Augmentation
🤔 Какие реализации бустинга есть?

AdaBoost, Gradient Boosting, XGBoost, CatBoost и LightGBM. Они различаются производительностью и подходами к построению деревьев.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используют для оценки важности переменных в ансамблях?
Anonymous Quiz
5%
Random Sampling
78%
Feature Importances
9%
AdaBoost
8%
Cross-Validation
🤔 Какой метод оценки моделей учитывает как сложность модели, так и ее способность обобщать данные?
Anonymous Quiz
14%
R-squared
29%
Cross-Validation
31%
AIC (Akaike Information Criterion)
26%
F1-Score
🤔 Что известно про оконные функции?

Это SQL-функции, выполняющиеся по окну строк, но не сворачивающие их в одно значение.
- Используются с OVER().
- Примеры: ROW_NUMBER(), RANK(), LEAD(), LAG(), SUM() OVER(), AVG() OVER().


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод регуляризации добавляет сумму абсолютных значений коэффициентов?
Anonymous Quiz
65%
Лассо-регрессия
20%
Ридж-регрессия
10%
SVM
5%
Кросс-валидация
🤔 Какой метод уменьшает размерность и сохраняет расстояния?
Anonymous Quiz
43%
PCA
41%
t-SNE
10%
LDA
6%
MDS
💊1
🤔 Что такое Boxplot?

Это статистический график, показывающий распределение данных:
1. Ящик (Box) – показывает межквартильный размах (между Q1 и Q3).
2. Линия внутри ящика – медиана (Q2).
3. "Усы" – представляют диапазон данных без выбросов.
4. Точки за пределами усов – выбросы.
Boxplot полезен для визуализации асимметрии, выбросов и распределения данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🤔 Какой метод sklearn используется для стандартизации данных?
Anonymous Quiz
81%
StandardScaler
8%
MinMaxScaler
1%
RobustScaler
10%
Normalizer
🤔 Можно ли тьюнить только Batch Norm?

1. Да, параметры Batch Norm, такие как скорость обучения, моментум и гамма/бета, могут быть настроены для улучшения обучения.
2. Однако тьюнинг только Batch Norm может быть недостаточен без оптимизации других частей модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍1💊1
🤔 Какой алгоритм уменьшает размерность данных, сохраняя важную информацию?
Anonymous Quiz
3%
KNN
81%
PCA
4%
Decision Tree
12%
SVM
🤔1
🤔 Какой метод уменьшает размерность данных, сохраняя вариативность?
Anonymous Quiz
8%
K-средних
31%
Метод опорных векторов (SVM)
60%
Главные компоненты (PCA)
2%
Линейная регрессия
🤔1
🤔 Как работает Dropout?

Это техника регуляризации в нейросетях, уменьшающая переобучение:
1. На каждой итерации обучения случайно зануляется часть нейронов.
2. Это предотвращает чрезмерную зависимость от отдельных признаков.
3. Во время предсказания Dropout не применяется, а выходы масштабируются.
Dropout делает нейросеть более устойчивой и снижает вероятность переобучения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3