Data Science | Тесты – Telegram

Data Science | Тесты

2.55K subscribers

25 photos

386 links

Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy

Download Telegram

About

Blog

Apps

Platform

Data Science | Тесты

2.55K subscribers

Data Science | Тесты

🤔 Что такое Median?

Это центральное значение упорядоченного ряда.
- Если количество элементов нечетное, медиана – это средний элемент.
- Если четное, медиана – среднее двух центральных значений.
Медиана менее чувствительна к выбросам, чем среднее (Mean).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

💊2

362 views16:01

Data Science | Тесты

🤔 Какой метод уменьшения размерности используется для выделения скрытых факторов в данных с учетом неотрицательных ограничений?

Anonymous Quiz

89 voters354 views20:01

Data Science | Тесты

🤔 Какой метод уменьшения размерности используется для выделения скрытых факторов в данных с учетом неотрицательных ограничений?

Anonymous Quiz

81 voters353 views09:02

Data Science | Тесты

🤔 В чем разница между классификацией и регрессией?

Классификация определяет категории, а регрессия – непрерывные значения. Например, классификация предсказывает класс, а регрессия – числовой результат.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

371 views16:01

Data Science | Тесты

🤔 Какой метод оценки помогает избежать переобучения модели?

Anonymous Quiz

Кросс-валидация

Гиперпараметрическая оптимизация

Регуляризация

Аугментация данных

💊6

110 voters357 views20:01

Data Science | Тесты

🤔 Какой метод используется для классификации текстовых данных с учетом частотных характеристик слов?

Anonymous Quiz

94 voters332 views09:02

Data Science | Тесты

🤔 Как работает градиентный бустинг регрессор?

Это ансамблевый метод, который комбинирует множество слабых моделей (обычно деревьев решений) для улучшения качества предсказаний:
1. Первая модель предсказывает исходные данные, а остатки ошибок передаются следующей.
2. Каждое новое дерево обучается на ошибках предыдущих, уменьшая отклонения.
3. Градиентный спуск минимизирует ошибку, выбирая оптимальные веса.
4. Итоговое предсказание – это взвешенная сумма предсказаний всех деревьев.
Градиентный бустинг хорошо работает с нелинейными зависимостями и устойчив к выбросам.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

368 views16:01

Data Science | Тесты

🤔 Какой метод используется для оценки модели с дисбалансированными данными?

Anonymous Quiz

Точность

Каппа коэффициент

106 voters349 views20:01

Data Science | Тесты

🤔 Какой метод применяется для борьбы с мультиколлинеарностью в регрессии?

Anonymous Quiz

Ridge регрессия

Lasso регрессия

Principal Component Analysis (PCA)

106 voters329 views09:02

Data Science | Тесты

🤔 Зачем нужен self super?

self указывает на текущий экземпляр класса, а super позволяет обращаться к методам родительского класса, избегая дублирования кода.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

325 views16:01

Data Science | Тесты

🤔 Какой метод статистики используется для проверки гипотезы об однородности дисперсий?

Anonymous Quiz

Фишер тест

Манна-Уитни

106 voters298 views20:01

Data Science | Тесты

🤔 Какой алгоритм часто используется для классификации текстовых данных?

Anonymous Quiz

Линейная регрессия

Логистическая регрессия

Наивный байесовский классификатор

102 voters294 views09:02

Data Science | Тесты

🤔 Какие подходы понижения размерности известны?

Основные подходы понижения размерности включают метод главных компонент (PCA), сингулярное разложение (SVD), t-SNE и UMAP. PCA снижает размерность данных, находя новые оси, которые объясняют наибольшую дисперсию данных. t-SNE и UMAP используются для визуализации данных в пространстве низкой размерности, сохраняя их топологическую структуру. Эти методы позволяют уменьшить количество признаков при сохранении важной информации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

276 views16:01

Data Science | Тесты

🤔 Какой метод используется для снижения размерности данных?

Anonymous Quiz

💊4

102 voters269 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения хорошо работает с линейно неразделимыми данными?

Anonymous Quiz

Линейная регрессия

K-ближайших соседей

Метод опорных векторов с ядром

Логистическая регрессия

99 voters265 views09:02

Data Science | Тесты

🤔

Как работают несимметрические метрики?

Несимметрические метрики в контексте машинного обучения оценивают модель, акцентируя внимание на одном классе или типе ошибки больше, чем на других. Это особенно полезно в случаях, когда стоимость одного типа ошибки значительно выше другого. Примером несимметричной метрики является F1-score, который более чувствителен к классам с меньшим числом образцов или когда важно сбалансировать точность и полноту.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

268 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для кластеризации данных на основе иерархической структуры?

Anonymous Quiz

K-средние

Иерархическая кластеризация

90 voters258 views20:01

Data Science | Тесты

🤔 Какой метод оценки моделей снижает смещение и дисперсию?

Anonymous Quiz

Cross-validation

Bootstrap Aggregating

Gradient Descent

Hyperparameter Tuning

81 voters247 views09:02

Data Science | Тесты

🤔 Как решить задачу, где присутствует одновременно два target – один categorical, другой continuous?

Используются модели multi-output, которые обучаются на несколько целевых переменных, например, через отдельные выходные слои в нейросети.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

246 views16:01

Data Science | Тесты

🤔 Какой алгоритм часто используется для прогнозирования временных рядов?

Anonymous Quiz

Линейная регрессия

Случайный лес

110 voters225 views20:01