Data Science | Тесты

🤔 Какой метод используется для классификации текстовых данных с учетом частотных характеристик слов?

Anonymous Quiz

Decision Tree

98 voters346 views09:02

Data Science | Тесты

🤔 Как работает градиентный бустинг регрессор?

Это ансамблевый метод, который комбинирует множество слабых моделей (обычно деревьев решений) для улучшения качества предсказаний:
1. Первая модель предсказывает исходные данные, а остатки ошибок передаются следующей.
2. Каждое новое дерево обучается на ошибках предыдущих, уменьшая отклонения.
3. Градиентный спуск минимизирует ошибку, выбирая оптимальные веса.
4. Итоговое предсказание – это взвешенная сумма предсказаний всех деревьев.
Градиентный бустинг хорошо работает с нелинейными зависимостями и устойчив к выбросам.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

382 views16:01

Data Science | Тесты

🤔 Какой метод используется для оценки модели с дисбалансированными данными?

Anonymous Quiz

111 voters371 views20:01

Data Science | Тесты

🤔 Какой метод применяется для борьбы с мультиколлинеарностью в регрессии?

Anonymous Quiz

Principal Component Analysis (PCA)

112 voters358 views09:02

Data Science | Тесты

🤔 Зачем нужен self super?

self указывает на текущий экземпляр класса, а super позволяет обращаться к методам родительского класса, избегая дублирования кода.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

361 views16:01

Data Science | Тесты

🤔 Какой метод статистики используется для проверки гипотезы об однородности дисперсий?

Anonymous Quiz

112 voters357 views20:01

Data Science | Тесты

🤔 Какой алгоритм часто используется для классификации текстовых данных?

Anonymous Quiz

Логистическая регрессия

61%

Наивный байесовский классификатор

109 voters338 views09:02

Data Science | Тесты

🤔 Какие подходы понижения размерности известны?

Основные подходы понижения размерности включают метод главных компонент (PCA), сингулярное разложение (SVD), t-SNE и UMAP. PCA снижает размерность данных, находя новые оси, которые объясняют наибольшую дисперсию данных. t-SNE и UMAP используются для визуализации данных в пространстве низкой размерности, сохраняя их топологическую структуру. Эти методы позволяют уменьшить количество признаков при сохранении важной информации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

319 views16:01

Data Science | Тесты

🤔 Какой метод используется для снижения размерности данных?

Anonymous Quiz

💊4

108 voters304 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения хорошо работает с линейно неразделимыми данными?

Anonymous Quiz

Метод опорных векторов с ядром

Логистическая регрессия

106 voters287 views09:02

Data Science | Тесты

🤔

Как работают несимметрические метрики?

Несимметрические метрики в контексте машинного обучения оценивают модель, акцентируя внимание на одном классе или типе ошибки больше, чем на других. Это особенно полезно в случаях, когда стоимость одного типа ошибки значительно выше другого. Примером несимметричной метрики является F1-score, который более чувствителен к классам с меньшим числом образцов или когда важно сбалансировать точность и полноту.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

283 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для кластеризации данных на основе иерархической структуры?

Anonymous Quiz

Иерархическая кластеризация

T-SNE

95 voters279 views20:01

Data Science | Тесты

🤔 Какой метод оценки моделей снижает смещение и дисперсию?

Anonymous Quiz

48%

Cross-validation

35%

Bootstrap Aggregating

Gradient Descent

Hyperparameter Tuning

88 voters272 views09:02

Data Science | Тесты

🤔 Как решить задачу, где присутствует одновременно два target – один categorical, другой continuous?

Используются модели multi-output, которые обучаются на несколько целевых переменных, например, через отдельные выходные слои в нейросети.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

275 views16:01

Data Science | Тесты

🤔 Какой алгоритм часто используется для прогнозирования временных рядов?

Anonymous Quiz

122 voters269 views20:01

Data Science | Тесты

🤔 Какой алгоритм машинного обучения использует метод ядровых функций?

Anonymous Quiz

Support Vector Machine

16%

Naive Bayes

96 voters257 views09:02

Data Science | Тесты

🤔

Почему в нейронных сетях нельзя инициализировать веса нулями?

1. Симметричность: При инициализации весов нулями все нейроны в слое начинают обучение одинаково, что делает их идентичными.
2. Отсутствие обучения: Градиенты для всех нейронов слоя будут одинаковыми, из-за чего они не смогут различаться и обучаться.
3. Решение: Инициализация случайными значениями разрывает симметрию, позволяя нейронам обучаться независимо друг от друга.
Стандартные методы, такие как He или Xavier инициализация, обеспечивают оптимальный начальный размах весов.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

241 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для задач классификации, когда классы плохо разделимы линейно?

Anonymous Quiz

10%

Логистическая регрессия

Линейная регрессия

22%

Метод ближайших соседей

63%

Метод опорных векторов с ядром (SVM)

🤔1

89 voters210 views20:01

Data Science | Тесты

🚀 Phystech.Genesis зовёт тебя на Data Science конкурс по археологии!

Проверь навыки на реальных данных: разработай ПО для поиска объектов в рельефе по данным аэрофотосъёмки, спутниковых снимков и лазерного сканирования.

Почему стоит участвовать?
• Работа над социально значимой задачей – технологии, которые помогут археологам.
• Сообщество специалистов: знакомство с компаниями и экспертами CV/ML.
🔥 Призовой фонд – 5 000 000 ₽.

Кого ждем?
💻 Команды 2-5 человек уровня Middle и выше в области ML/CV.

📌 Формат: онлайн на DS-платформе Phystech.Genesis.
Участвовать могут как физические лица, так и компании.

⏳ Подай заявку до 14 октября по ссылке.

197 views07:00

Data Science | Тесты

🤔 Какой метод уменьшает смещение при оценке модели?

Anonymous Quiz