Data Science | Тесты
2.67K subscribers
27 photos
445 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какие знаешь рекомендательные модели?

Модели: коллаборативная фильтрация (на основе пользователей или элементов), контентная фильтрация, гибридные подходы и модели с использованием глубокого обучения (например, нейронные сетевые рекомендатели).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает переобучение с использованием L2 регуляризации?
Anonymous Quiz
51%
Ridge Regression
41%
Lasso Regression
3%
Elastic Net
5%
Dropout
🤔 Какой метод уменьшения размерности используется для нахождения наиболее значимых признаков, влияющих на целевую переменную?
Anonymous Quiz
62%
PCA
9%
LDA
26%
Регрессия с L1-регуляризацией
3%
NMF
💊14
🤔 Сравнение архитектуры RNN, CNN, трансформера?

RNN обрабатывает данные последовательно и хорошо работает с временными рядами или текстами, но страдает от проблем с градиентами и плохо масштабируется. CNN извлекает локальные признаки через свёртки, изначально предназначен для изображений, но может применяться к тексту. Трансформер использует механизм внимания, обрабатывает всё параллельно и учитывает контекст целиком, что делает его эффективным в работе с языком и последовательностями.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🤔 Какой метод машинного обучения используется для классификации данных с высокими размерностями, где количество признаков значительно больше, чем количество наблюдений?
Anonymous Quiz
8%
Линейная регрессия
66%
Метод опорных векторов (SVM)
9%
Логистическая регрессия
18%
K-means
🤔 Какой метод уменьшения размерности используется для выделения скрытых факторов в данных с учетом неотрицательных ограничений?
Anonymous Quiz
33%
PCA
23%
LDA
22%
NMF
22%
T-SNE
🤔 Как валидировать временные ряды?

Валидация по времени включает разбиение данных на интервалы с учётом временной последовательности. Методы: time series split (скользящее окно), расширяемое окно или кросс-валидация по времени.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод понижает размерность данных, сохраняя важные вариации?
Anonymous Quiz
4%
Random Forest
93%
Principal Component Analysis (PCA)
1%
Naive Bayes
2%
Gradient Boosting
🤔 Какие переменные (типы данных) можно использовать в качестве ключей?

Хэшируемые типы данных, такие как числа, строки, кортежи с неизменяемыми элементами. Это важно, если требуется быстро сопоставить значения в структуре данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод обучения уменьшает вероятность переобучения путём создания ансамбля моделей?
Anonymous Quiz
38%
Gradient Boosting
2%
Ridge Regression
4%
Lasso Regression
56%
Random Forest
💊1
🤔 Какой метод машинного обучения устойчив к выбросам благодаря использованию медианного значения ошибки?
Anonymous Quiz
4%
Линейная регрессия
72%
Медианная регрессия
7%
Логистическая регрессия
17%
Случайный лес
🤔 Какие есть детекторы и архитектуры в CV?

Классические: SIFT, HOG. Современные архитектуры: YOLO, SSD, Faster R-CNN для детекции объектов, U-Net, DeepLab для сегментации.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод используется для уменьшения размерности данных, сохраняя при этом максимальное количество информации?
Anonymous Quiz
93%
PCA (метод главных компонент)
3%
Логистическая регрессия
3%
Кластеризация
1%
Градиентный бустинг
🤔 Расскажи о Gradient-boosted trees

Gradient-boosted trees — это ансамблевый метод машинного обучения, который строит серию деревьев решений, каждое из которых исправляет ошибки предыдущих. Процесс обучения происходит путем последовательного добавления деревьев, каждое из которых минимизирует ошибку путем градиентного спуска, усиливая правильные прогнозы. Gradient boosting широко используется для задач регрессии и классификации, обеспечивая высокую точность и гибкость в работе с разными типами данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод часто используется для прогнозирования временных рядов?
Anonymous Quiz
7%
Линейная регрессия
7%
Decision Tree
80%
ARIMA
6%
PCA
💊1
🤔 Какой метод используется для создания эмбеддингов слов путем обучения модели на контекстных окнах?
Anonymous Quiz
4%
Decision Tree
5%
Логистическая регрессия
74%
Word2Vec
18%
TF-IDF
🤔 У бинарного классификатора разделение данных такое, что 95% в одном классе, 5% в другом — какую метрику следует выбрать?

Лучше использовать F1-score, AUC-ROC или precision-recall, поскольку они учитывают дисбаланс классов и избегают искажений, связанных с accuracy.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊2