Data Science | Тесты – Telegram

Data Science | Тесты

2.62K subscribers

26 photos

421 links

Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy

Download Telegram

About

Blog

Apps

Platform

Data Science | Тесты

2.62K subscribers

Data Science | Тесты

🤔

Где использование линейных моделей целесообразно?

Линейные модели применяются, когда данные линейно разделимы или зависимости между признаками и целевой переменной близки к линейным.
1. Они эффективны на высоких объёмах данных благодаря низкой вычислительной сложности.
2. Хорошо интерпретируемы, что важно в задачах с требованием объяснимости.
3. Используются в случаях, когда признаки предварительно масштабированы и очищены.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

371 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает смещение и дисперсию, используя ансамбль моделей?

Anonymous Quiz

💊2

121 voters378 views20:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию, комбинируя слабые модели и повышая их взвешенность?

Anonymous Quiz

98 voters343 views09:01

Data Science | Тесты

🤔 Какие реализации бустинга есть?

AdaBoost, Gradient Boosting, XGBoost, CatBoost и LightGBM. Они различаются производительностью и подходами к построению деревьев.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

354 views16:01

Data Science | Тесты

🤔 Какой метод часто применяют для борьбы с дисбалансом классов?

Anonymous Quiz

Логистическая регрессия

116 voters340 views20:01

Data Science | Тесты

🤔 Какая техника использует усреднение моделей для повышения точности предсказаний?

Anonymous Quiz

💊12

103 voters345 views09:01

Data Science | Тесты

🤔 За что мэп штрафует больше: за перепрогноз или недопрогноз?

MAP (Mean Average Precision) больше штрафует за недопрогноз (упущенные релевантные элементы), так как метрика ориентирована на точность в верхней части ранжированного списка.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2

340 views16:01

Data Science | Тесты

🤔 Какой метод используется для масштабирования данных в sklearn?

Anonymous Quiz

💊7

117 voters333 views20:01

Data Science | Тесты

🤔 Какой метод используется для оценки важности признаков в модели случайного леса?

Anonymous Quiz

Gini Importance

Gradient Descent

Mean Squared Error

Cross-Validation

95 voters317 views09:01

Data Science | Тесты

🤔

В чём смысл Information Value (IV)?

Это метрика, используемая для оценки предсказательной способности признака относительно целевой переменной.
1. Высокое значение IV говорит о сильной связи между признаком и целевой переменной.
2. Часто используется в кредитном скоринге для выбора наиболее значимых признаков.
3. Значения IV помогают определить, какие признаки следует включить в модель, а какие можно исключить.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

316 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для задач регрессии, когда требуется учитывать нелинейные зависимости между признаками?

Anonymous Quiz

Линейная регрессия

Полиномиальная регрессия

Градиентный бустинг

K-ближайших соседей

💊12

130 voters304 views20:01

Data Science | Тесты

🤔 Какая функция в pandas используется для создания сводных таблиц?

Anonymous Quiz

🔥1

118 voters284 views09:02

Data Science | Тесты

🤔 Что хуже: иметь много ложных срабатываний или ложно-отрицательных срабатываний?

Это зависит от задачи. Ложно-отрицательные срабатывания хуже в задачах, где важно не пропустить критический случай (например, диагностика). Ложные срабатывания могут быть менее критичными, но увеличивают нагрузку на систему.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

273 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию, комбинируя деревья решений?

Anonymous Quiz

Gradient Descent

98 voters261 views20:01

Data Science | Тесты

🤔 Какой метод оптимизации применяется для поиска минимума функции?

Anonymous Quiz

💊20

95 voters252 views09:02

Data Science | Тесты

🤔 Какой функционал оптимизируется в задаче линейной регрессии? Как записать это в векторной записи?

Оптимизируется ошибка между предсказанными и фактическими значениями, минимизируя среднеквадратичное отклонение, что позволяет определить параметры модели.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

252 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает размерность данных, максимизируя вариацию?

Anonymous Quiz

Метод главных компонент (PCA)

Линейная дискриминантная анализа (LDA)

Т-распределенная стохастическая соседская эмуляМетод ближайших соседей (k-NN)ция (t-SNE)

85 voters243 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом порядка слов?

Anonymous Quiz

Линейная регрессия

Логистическая регрессия

85 voters217 views09:01

Data Science | Тесты

🤔 Что известно о Gradient-boosted trees?

Это ансамблевый метод, строящий модель как последовательность слабых моделей (обычно деревьев), где каждая новая модель корректирует ошибки предыдущей. Он использует градиентный спуск по функции потерь. Обладает высокой точностью и хорошо работает с табличными данными, но чувствителен к гиперпараметрам. Популярные реализации — XGBoost, LightGBM, CatBoost.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

216 views16:01

Data Science | Тесты

🤔 Какой алгоритм используется для классификации на основе теоремы Байеса?

Anonymous Quiz

Логистическая регрессия

Метод опорных векторов

Наивный байесовский классификатор

Случайный лес

82 voters199 views20:01