Data Science | Тесты
2.63K subscribers
26 photos
427 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Что известно о Gradient-boosted trees?

Это ансамблевый метод, строящий модель как последовательность слабых моделей (обычно деревьев), где каждая новая модель корректирует ошибки предыдущей. Он использует градиентный спуск по функции потерь. Обладает высокой точностью и хорошо работает с табличными данными, но чувствителен к гиперпараметрам. Популярные реализации — XGBoost, LightGBM, CatBoost.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм используется для классификации на основе теоремы Байеса?
Anonymous Quiz
5%
Логистическая регрессия
3%
Метод опорных векторов
91%
Наивный байесовский классификатор
1%
Случайный лес
🤔 Вопрос: Как называется процесс преобразования категориальных данных в числовые?
Anonymous Quiz
11%
Нормализация
6%
Стандартизация
82%
One-hot кодировка
1%
Логарифмирование
🤔 Какие знаешь рекомендательные модели?

Модели: коллаборативная фильтрация (на основе пользователей или элементов), контентная фильтрация, гибридные подходы и модели с использованием глубокого обучения (например, нейронные сетевые рекомендатели).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает переобучение с использованием L2 регуляризации?
Anonymous Quiz
49%
Ridge Regression
43%
Lasso Regression
4%
Elastic Net
5%
Dropout
🤔 Какой метод уменьшения размерности используется для нахождения наиболее значимых признаков, влияющих на целевую переменную?
Anonymous Quiz
65%
PCA
6%
LDA
27%
Регрессия с L1-регуляризацией
3%
NMF
💊13
🤔 Сравнение архитектуры RNN, CNN, трансформера?

RNN обрабатывает данные последовательно и хорошо работает с временными рядами или текстами, но страдает от проблем с градиентами и плохо масштабируется. CNN извлекает локальные признаки через свёртки, изначально предназначен для изображений, но может применяться к тексту. Трансформер использует механизм внимания, обрабатывает всё параллельно и учитывает контекст целиком, что делает его эффективным в работе с языком и последовательностями.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод машинного обучения используется для классификации данных с высокими размерностями, где количество признаков значительно больше, чем количество наблюдений?
Anonymous Quiz
8%
Линейная регрессия
63%
Метод опорных векторов (SVM)
8%
Логистическая регрессия
20%
K-means
🤔 Какой метод уменьшения размерности используется для выделения скрытых факторов в данных с учетом неотрицательных ограничений?
Anonymous Quiz
35%
PCA
25%
LDA
21%
NMF
20%
T-SNE
🤔 Как валидировать временные ряды?

Валидация по времени включает разбиение данных на интервалы с учётом временной последовательности. Методы: time series split (скользящее окно), расширяемое окно или кросс-валидация по времени.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод понижает размерность данных, сохраняя важные вариации?
Anonymous Quiz
4%
Random Forest
91%
Principal Component Analysis (PCA)
2%
Naive Bayes
3%
Gradient Boosting
🤔 Какие переменные (типы данных) можно использовать в качестве ключей?

Хэшируемые типы данных, такие как числа, строки, кортежи с неизменяемыми элементами. Это важно, если требуется быстро сопоставить значения в структуре данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод обучения уменьшает вероятность переобучения путём создания ансамбля моделей?
Anonymous Quiz
41%
Gradient Boosting
1%
Ridge Regression
3%
Lasso Regression
56%
Random Forest
💊1
🤔 Какой метод машинного обучения устойчив к выбросам благодаря использованию медианного значения ошибки?
Anonymous Quiz
4%
Линейная регрессия
74%
Медианная регрессия
7%
Логистическая регрессия
16%
Случайный лес
🤔 Какие есть детекторы и архитектуры в CV?

Классические: SIFT, HOG. Современные архитектуры: YOLO, SSD, Faster R-CNN для детекции объектов, U-Net, DeepLab для сегментации.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для уменьшения размерности данных, сохраняя при этом максимальное количество информации?
Anonymous Quiz
94%
PCA (метод главных компонент)
3%
Логистическая регрессия
1%
Кластеризация
1%
Градиентный бустинг
🤔 Расскажи о Gradient-boosted trees

Gradient-boosted trees — это ансамблевый метод машинного обучения, который строит серию деревьев решений, каждое из которых исправляет ошибки предыдущих. Процесс обучения происходит путем последовательного добавления деревьев, каждое из которых минимизирует ошибку путем градиентного спуска, усиливая правильные прогнозы. Gradient boosting широко используется для задач регрессии и классификации, обеспечивая высокую точность и гибкость в работе с разными типами данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод часто используется для прогнозирования временных рядов?
Anonymous Quiz
3%
Линейная регрессия
5%
Decision Tree
85%
ARIMA
7%
PCA