Data Science | Тесты

🤔 Какой алгоритм находит ближайших соседей по эвклидовому расстоянию?

Anonymous Quiz

Decision Tree

128 voters438 views09:02

Data Science | Тесты

🤔 Что знаешь про early stopping?

Early stopping — это техника регуляризации, которая завершает обучение модели, если метрика качества на валидационном наборе перестаёт улучшаться. Это предотвращает переобучение, позволяя сохранить оптимальные параметры до ухудшения обобщающей способности. Метод основан на мониторинге функции ошибки или качества модели во время каждой итерации обучения.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

427 views16:01

Data Science | Тесты

🤔 Какой метод используется для выбора наиболее важных признаков в модели?

Anonymous Quiz

🔥1

118 voters425 views20:01

Data Science | Тесты

🤔 Какой алгоритм машинного обучения хорошо работает с линейно неразделимыми данными?

Anonymous Quiz

Метод опорных векторов с ядром

💊16

119 voters442 views09:02

Data Science | Тесты

🤔 Какие есть детекторы и архитектуры в CV?

Классические: SIFT, HOG. Современные архитектуры: YOLO, SSD, Faster R-CNN для детекции объектов, U-Net, DeepLab для сегментации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1🔥1

448 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает смещение и дисперсию в регрессии с L1 и L2 штрафами?

Anonymous Quiz

135 voters450 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения находит ближайших соседей данных точек?

Anonymous Quiz

Support Vector Machines

131 voters450 views09:02

Data Science | Тесты

🤔 Зачем нужен yield вместо return в функции?

`yield` используется в генераторах Python и позволяет функции возвращать промежуточный результат, приостанавливая выполнение функции и сохраняя ее состояние для последующего возобновления. Это эффективно для работы с большими данными или сложными алгоритмами.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2

454 views16:01

Data Science | Тесты

🤔 Какая функция используется для вычисления коэффициента корреляции?

Anonymous Quiz

140 voters424 views20:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию, нормализуя данные на скрытых слоях?

Anonymous Quiz

119 voters416 views09:02

Data Science | Тесты

🤔 В чем разница между L1 и L2 регуляризацией?

L1-регуляризация (Lasso) добавляет сумму модулей весов к функции потери, склоняя веса к нулю, что способствует разреженности. L2-регуляризация (Ridge) добавляет сумму квадратов весов, уменьшая их величину, но не зануляя. L1 эффективна для отбора признаков, а L2 — для стабилизации модели и борьбы с переобучением.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

444 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию модели, суммируя прогнозы нескольких моделей?

Anonymous Quiz

114 voters406 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для классификации данных, используя вероятностные распределения признаков?

Anonymous Quiz

22%

Логистическая регрессия

69%

Наивный байесовский классификатор

K-ближайших соседей

Метод опорных векторов (SVM)

100 voters385 views09:02

Data Science | Тесты

🤔 Как можно сравнивать два ненормальных распределения?

1. Применить непараметрические тесты, такие как тест Манна-Уитни или Краскела-Уоллиса.
2. Использовать бутстрепинг для создания доверительных интервалов.
3. Рассмотреть преобразование данных для приближения к нормальному виду.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

383 views16:01

Data Science | Тесты

🤔 Какой метод часто применяют для предобработки категориальных данных?

Anonymous Quiz

Логистическая регрессия

124 voters408 views20:01

Data Science | Тесты

🤔 Какая метрика используется для оценки качества модели классификации, учитывающая как полноту, так и точность?

Anonymous Quiz

127 voters391 views09:02

Data Science | Тесты

🤔

В чём смысл Information Value (IV)?

Это метрика, используемая для оценки предсказательной способности признака относительно целевой переменной.
1. Высокое значение IV говорит о сильной связи между признаком и целевой переменной.
2. Часто используется в кредитном скоринге для выбора наиболее значимых признаков.
3. Значения IV помогают определить, какие признаки следует включить в модель, а какие можно исключить.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

412 views16:01

Data Science | Тесты

🤔 Какой метод используется для детектирования выбросов в наборе данных?

Anonymous Quiz

🔥2

119 voters414 views20:01

Data Science | Тесты

🤔 Какой метод часто используется для обнаружения аномалий в данных?

Anonymous Quiz

Линейная регрессия

Логистическая регрессия

109 voters385 views09:02

Data Science | Тесты

🤔 Чем отличается градиентный спуск от SGD?

Градиентный спуск использует весь набор данных для вычисления градиента и обновления параметров, что требует значительных вычислительных ресурсов. Стохастический градиентный спуск (SGD) обновляет параметры после каждого примера или мини-батча, что ускоряет обучение, но может быть менее стабильным. SGD часто сходится быстрее, но может застревать в локальных минимумах.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

391 views16:01

About

Blog

Apps

Platform