Data Science | Тесты
2.56K subscribers
25 photos
388 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.iss.one/+RQVnIJT__Z42ZWUy
Вакансии t.iss.one/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какие принципы ООП тебе известны?

Основные принципы: инкапсуляция (сокрытие данных), наследование (повторное использование кода), полиморфизм (разные реализации одного интерфейса), абстракция (выделение ключевых характеристик).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
🤔 Какой метод уменьшает дисперсию, объединяя предсказания моделей на мета-уровне?
Anonymous Quiz
41%
Bagging
15%
Boosting
38%
Stacking
6%
Dropout
🤔 Какой метод уменьшает дисперсию, используя случайные подмножества признаков?
Anonymous Quiz
43%
Bagging
38%
Random Forest
11%
Boosting
8%
Stacking
💊1
🤔 Что известно о ML дизайне?

ML-дизайн включает выбор модели, структуры данных, метрик и процесса обучения для конкретной задачи. Важные аспекты:
• Постановка задачи (классификация, регрессия, кластеризация).
• Подготовка данных (очистка, масштабирование, выделение признаков).
• Выбор и настройка модели, а также оптимизация гиперпараметров.
• Оценка результатов (использование метрик качества и валидации).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом порядка слов?
Anonymous Quiz
3%
Линейная регрессия
5%
K-means
84%
N-grams
8%
Логистическая регрессия
💊5
🤔 Какой метод используется для обнаружения аномалий в данных?
Anonymous Quiz
76%
Isolation Forest
2%
Linear Regression
20%
K-means Clustering
2%
Decision Tree
🤔 Какая скорость поиска в хэш-таблице

Скорость поиска в хэш-таблице (например, HashMap) в среднем составляет O(1), так как ключи напрямую отображаются в индекс с помощью хэш-функции. В худшем случае, при коллизиях, время поиска может увеличиваться до O(n), если хэш-таблица не оптимизирована или используется неэффективная стратегия разрешения коллизий. Однако в большинстве случаев эффективные хэш-функции и методы обработки коллизий поддерживают близкую к O(1) скорость.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности используется для выделения линейных комбинаций признаков, которые максимизируют разницу между классами?
Anonymous Quiz
53%
PCA
22%
LDA
22%
T-SNE
3%
T-SNE
🤔 Какой метод используют для уменьшения дисперсии оценок модели в кросс-валидации?
Anonymous Quiz
29%
Bootstrap Aggregating
11%
Principal Component Analysis
54%
K-fold Cross Validation
6%
Random Subsampling
👍1💊1
🤔 Какой функционал оптимизируется в задаче линейной регрессии? Как записать это в векторной записи?

Оптимизируется ошибка между предсказанными и фактическими значениями, минимизируя среднеквадратичное отклонение, что позволяет определить параметры модели.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для классификации изображений?
Anonymous Quiz
5%
K-ближайших соседей
1%
Линейная регрессия
93%
Convolutional Neural Networks (CNN)
1%
Логистическая регрессия
🤔 В чем разница между pivot и pivot_table?

`pivot` может создавать новый производный DataFrame, переформатируя исходный DataFrame. Он не поддерживает агрегацию данных. `pivot_table` делает то же самое, что и `pivot`, но также поддерживает агрегацию данных, позволяя использовать функции агрегирования, такие как суммирование, среднее и т.д.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для классификации изображений?
Anonymous Quiz
5%
K-ближайших соседей
1%
Линейная регрессия
92%
Convolutional Neural Networks (CNN)
2%
Логистическая регрессия
🤔 Какой метод используется для оценки неопределенности в прогнозах нейросетей?
Anonymous Quiz
34%
Dropout в тестовом режиме
23%
Batch Normalization
21%
L1-регуляризация
21%
Min-Max Scaling
🤔 Что такое Median?

Это центральное значение упорядоченного ряда.
- Если количество элементов нечетное, медиана – это средний элемент.
- Если четное, медиана – среднее двух центральных значений.
Медиана менее чувствительна к выбросам, чем среднее (Mean).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊2
🤔 Какой метод уменьшения размерности используется для выделения скрытых факторов в данных с учетом неотрицательных ограничений?
Anonymous Quiz
27%
PCA
11%
LDA
42%
NMF
20%
T-SNE
🤔 Какой метод уменьшения размерности используется для выделения скрытых факторов в данных с учетом неотрицательных ограничений?
Anonymous Quiz
27%
PCA
17%
LDA
49%
NMF
7%
T-SNE
🤔 В чем разница между классификацией и регрессией?

Классификация определяет категории, а регрессия – непрерывные значения. Например, классификация предсказывает класс, а регрессия – числовой результат.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод оценки помогает избежать переобучения модели?
Anonymous Quiz
45%
Кросс-валидация
7%
Гиперпараметрическая оптимизация
48%
Регуляризация
0%
Аугментация данных
💊7