Data Science | Тесты
2.52K subscribers
26 photos
371 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшения размерности часто используется для визуализации данных?
Anonymous Quiz
41%
PCA
50%
T-SNE
7%
LDA
2%
NMF
🤔 Какой метод машинного обучения используется для анализа изображений и распознавания объектов на основе их особенностей?
Anonymous Quiz
3%
Decision Tree
3%
Логистическая регрессия
88%
Convolutional Neural Networks (CNN)
6%
Автоэнкодеры
🤔 Почему хорошо работает случайный лес?

Случайный лес работает хорошо, потому что он сочетает предсказания множества независимых деревьев решений, что снижает вероятность переобучения и увеличивает общую точность модели. Каждое дерево строится на случайной подвыборке данных и случайных признаках, что обеспечивает разнообразие моделей. За счёт этого случайный лес становится устойчивым к шуму и переобучению, предоставляя более стабильные и обобщающие предсказания. Модель также устойчива к выбросам и может эффективно работать с большим количеством признаков.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм находит ближайших соседей по эвклидовому расстоянию?
Anonymous Quiz
2%
Decision Tree
2%
Random Forest
95%
K-Nearest Neighbors
1%
Gradient Boosting
🤔 Что знаешь про early stopping?

Early stopping — это техника регуляризации, которая завершает обучение модели, если метрика качества на валидационном наборе перестаёт улучшаться. Это предотвращает переобучение, позволяя сохранить оптимальные параметры до ухудшения обобщающей способности. Метод основан на мониторинге функции ошибки или качества модели во время каждой итерации обучения.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для выбора наиболее важных признаков в модели?
Anonymous Quiz
57%
PCA
27%
Lasso
9%
K-means
7%
Decision Tree
🔥1
🤔 Какой алгоритм машинного обучения хорошо работает с линейно неразделимыми данными?
Anonymous Quiz
31%
Линейная регрессия
19%
K-ближайших соседей
45%
Метод опорных векторов с ядром
4%
Метод опорных векторов с ядром
💊12
🤔 Какие есть детекторы и архитектуры в CV?

Классические: SIFT, HOG. Современные архитектуры: YOLO, SSD, Faster R-CNN для детекции объектов, U-Net, DeepLab для сегментации.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
🤔 Какой метод уменьшает смещение и дисперсию в регрессии с L1 и L2 штрафами?
Anonymous Quiz
13%
Ridge Regression
20%
Lasso
63%
Elastic Net
5%
PCA
🤔 Какой метод машинного обучения находит ближайших соседей данных точек?
Anonymous Quiz
16%
K-Means Clustering
1%
Random Forest
82%
K-Nearest Neighbors
1%
Support Vector Machines
🤔 Зачем нужен yield вместо return в функции?

`yield` используется в генераторах Python и позволяет функции возвращать промежуточный результат, приостанавливая выполнение функции и сохраняя ее состояние для последующего возобновления. Это эффективно для работы с большими данными или сложными алгоритмами.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
🤔 Какая функция используется для вычисления коэффициента корреляции?
Anonymous Quiz
35%
pearsonr
12%
spearmanr
3%
kendalltau
51%
correlate
🤔 Какой метод уменьшает дисперсию, нормализуя данные на скрытых слоях?
Anonymous Quiz
17%
Dropout
73%
Batch Normalization
7%
Gradient Clipping
2%
Early Stopping
🤔 В чем разница между L1 и L2 регуляризацией?

L1-регуляризация (Lasso) добавляет сумму модулей весов к функции потери, склоняя веса к нулю, что способствует разреженности. L2-регуляризация (Ridge) добавляет сумму квадратов весов, уменьшая их величину, но не зануляя. L1 эффективна для отбора признаков, а L2 — для стабилизации модели и борьбы с переобучением.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает дисперсию модели, суммируя прогнозы нескольких моделей?
Anonymous Quiz
86%
Бэггинг
6%
Ридж-регрессия
0%
Лассо-регрессия
8%
PCA
🤔 Какой метод машинного обучения используется для классификации данных, используя вероятностные распределения признаков?
Anonymous Quiz
24%
Логистическая регрессия
73%
Наивный байесовский классификатор
2%
K-ближайших соседей
2%
Метод опорных векторов (SVM)
📺 Уникальная база IT собеседований

456+
реальных собеседований на программиста, тестировщика, аналитика и прочие IT профы.

Есть собесы от ведущих компаний: Сбер, Яндекс, ВТБ, Тинькофф, Озон, Wildberries и т.д.

🎯 Переходи по ссылке и присоединяйся к базе, чтобы прокачать свои шансы на успешное трудоустройство!
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Как можно сравнивать два ненормальных распределения?

1. Применить непараметрические тесты, такие как тест Манна-Уитни или Краскела-Уоллиса.
2. Использовать бутстрепинг для создания доверительных интервалов.
3. Рассмотреть преобразование данных для приближения к нормальному виду.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод часто применяют для предобработки категориальных данных?
Anonymous Quiz
94%
One-hot encoding
4%
K-means
0%
PCA
2%
Логистическая регрессия