Data Science | Тесты – Telegram

Data Science | Тесты

2.51K subscribers

25 photos

364 links

Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy

Download Telegram

About

Blog

Apps

Platform

Data Science | Тесты

2.51K subscribers

Data Science | Тесты

🤔

Какие есть проблемы с Batch Norm?

1. Зависимость от мини-батчей: небольшие батчи могут приводить к нестабильной оценке среднего и дисперсии.
2. Сложности с применением в рекуррентных сетях: последовательность данных может вызывать проблемы с нормализацией.
3. Увеличение вычислительных затрат: дополнительные параметры и операции замедляют обучение.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

388 views16:01

Data Science | Тесты

🤔 Какой алгоритм использует энтропию для построения модели?

Anonymous Quiz

🤔1

136 voters385 views20:01

Data Science | Тесты

🤔 Какой метод часто используется для повышения точности моделей путем создания мета-модели на основе предсказаний нескольких базовых моделей?

Anonymous Quiz

Стеккинг

109 voters408 views09:02

Data Science | Тесты

🤔 Чему равно p-value для выброса?

Это вероятность получить значение настолько же экстремальное, как наблюдаемое, при условии, что оно принадлежит общему распределению.
Чем меньше p-value, тем выше вероятность, что точка — выброс.
Значение зависит от метода (Grubbs, Dixon, Z-score и др.). Обычно, если p < 0.05, точка может считаться выбросом.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

436 views16:01

Data Science | Тесты

🤔 Какой метод помогает в обработке несбалансированных данных?

Anonymous Quiz

126 voters416 views20:01

Data Science | Тесты

🤔 Какой метод часто применяют для предобработки данных перед моделированием?

Anonymous Quiz

Логистическая регрессия

122 voters405 views09:02

Data Science | Тесты

🤔 В каких моделях используются несимметрические метрики?

Несимметрические метрики часто используются в моделях, где присутствует дисбаланс классов или когда ошибки в одних классах имеют более высокую стоимость, чем ошибки в других. Например, в медицинской диагностике, финансовом мошенничестве или кредитном скоринге, где пропуск положительного случая (например, болезни) может быть критичным.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

410 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию в ансамблевых методах?

Anonymous Quiz

Gradient Descent

120 voters396 views20:01

Data Science | Тесты

🤔 Какой метод используется для оценки модели машинного обучения на основе разделения данных на обучающую и тестовую выборки?

Anonymous Quiz

Cross-validation

Train-Test Split

💊5

114 voters391 views09:02

Data Science | Тесты

🤔 Как избегают коллизии в хеш-таблице

Для предотвращения коллизий в хэш-таблице используются методы, такие как цепочки (связывание элементов в списки) и открытая адресация (перенос коллизий в другие доступные ячейки). Метод цепочек добавляет все значения с одинаковым хэшом в связанный список, что позволяет хранить несколько элементов в одной ячейке. В открытой адресации при коллизии выполняется последовательный поиск следующей свободной ячейки.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

414 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения устойчив к переобучению за счет использования нескольких слабых моделей?

Anonymous Quiz

Линейная регрессия

Градиентный бустинг

K-ближайших соседей

Логистическая регрессия

138 voters409 views20:01

Data Science | Тесты

🤔 Какой метод уменьшает переобучение, нормализуя данные на каждой скрытой слое?

Anonymous Quiz

Batch Normalization

Gradient Clipping

🤔1

121 voters380 views09:02

Data Science | Тесты

🤔 Что такое мультиколлинеарность?

Это ситуация, когда признаки сильно коррелируют друг с другом.
- Это вызывает нестабильность линейных моделей, так как коэффициенты могут становиться большими и неинтерпретируемыми.
- Решения: удаление зависимых признаков, PCA, L1-регуляризация (Lasso).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

374 views16:01

Data Science | Тесты

🤔 Какая техника используется для обработки естественного языка?

Anonymous Quiz

Convolutional Neural Networks (CNN)

Latent Dirichlet Allocation (LDA)

Time Series Analysis

Natural Language Processing (NLP)

💊3

129 voters374 views20:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию, комбинируя модели с заменой?

Anonymous Quiz

Gradient Descent

102 voters353 views09:02

Data Science | Тесты

🤔

Что такое пи вэлью?

P-value — это вероятность того, что наблюдаемые данные или более экстремальные данные могли бы возникнуть при условии, что нулевая гипотеза верна. В контексте статистических тестов, маленькое значение p-value указывает на то, что нулевая гипотеза может быть отвергнута в пользу альтернативной гипотезы. Обычно порог значимости устанавливается на уровне 0.05, и если p-value меньше этого порога, нулевая гипотеза отвергается. P-value не говорит о размере эффекта, а лишь о степени уверенности в полученных данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

357 views16:01

Data Science | Тесты

🤔 Какой метод оптимизации используется для минимизации функции потерь путем учета как первого, так и второго моментов градиентов?

Anonymous Quiz

Градиентный спуск

Метод Ньютона

108 voters344 views20:01

Data Science | Тесты

🤔 Какой метод уменьшает смещение и дисперсию в ансамблевых моделях, используя взвешивание?

Anonymous Quiz

Gradient Descent

88 voters313 views09:02

Data Science | Тесты

🤔

В чём разница между методом GMM и K-Means?

1. K-Means:
o Основан на разделении данных по расстояниям до центроидов (жёсткое разделение).
o Каждая точка принадлежит только одному кластеру.
2. GMM (Gaussian Mixture Model):
o Использует вероятностный подход: каждая точка имеет вероятность принадлежности к каждому кластеру (мягкое разделение).
o Кластеры формируются на основе распределений Гаусса, что делает GMM более гибким для сложных данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

318 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает смещение и дисперсию, добавляя случайные шумы в данные?

Anonymous Quiz

Data Augmentation

💊20

111 voters300 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для кластеризации данных на основе плотности?

Anonymous Quiz

K-средние

Иерархическая кластеризация

104 voters288 views09:02