Библиотека собеса по Data Science | вопросы с собеседований
4.28K subscribers
478 photos
15 videos
1 file
589 links
Вопросы с собеседований по Data Science и ответы на них.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/7dfb7235

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://t.iss.one/proglibrary/9197
Download Telegram
🔬 Вы когда-нибудь смотрели на код и думали: «Работает, но почему?»

А теперь представьте, что вы:

→ понимаете, почему модель учится слишком медленно или слишком быстро;
→ видите, какие данные реально влияют на предсказание, а какие — шум;
→ знаете, что происходит внутри нейронки.

4 декабря стартует курс «Математика для разработки AI-моделей».

Линал, оптимизация, матан, статистика — всё, что происходит внутри модели между input и output. Практика на Python. Живые разборы с экспертами из SberAI, ВШЭ, Wildberries&Russ.

3 задания + финальный проект. Без теории ради теории — только то, что реально используется в моделях.

🎁 Бонус: курс по школьной математике + тест уровня математики

👉 Записаться
В задаче бинарной классификации, что произойдет с метрикой Recall (Полнота) модели, если мы значительно понизим порог классификации (threshold)?
Anonymous Quiz
19%
Recall уменьшится, Precision (Точность) увеличится.
7%
Обе метрики (Recall и Precision) увеличатся.
69%
Recall увеличится, Precision (Точность) уменьшится.
4%
Обе метрики (Recall и Precision) уменьшатся.
1
Вы работаете с категориальным признаком City (Город), который содержит более 1000 уникальных значений. Какой из перечисленных методов кодирования чаще всего используется в Data Science для работы с высококардинальными категориальными признаками
Anonymous Quiz
20%
Label Encoding
28%
Target Encoding (Mean Encoding)
35%
Frequency Encoding (Count Encoding)
16%
One-Hot Encoding
👍3
Почему вас валят на собесах по ML?

Чаще всего не из-за незнания fit/predict , а из-за непонимания математики, которая стоит за этими методами.

Мы перезапустили курс с живыми вебинарами, чтобы закрыть эти пробелы. Глубокое погружение в линейную алгебру.

Ближайшие темы (Hard Skills):

Матрицы: ранг, обратимость, линейные преобразования и решение СЛАУ.

Линейная регрессия: реализация МНК с нуля в NumPy vs scikit-learn , интерпретация коэффициентов.

SVD и Eigenvalues: смысл собственных векторов, снижение размерности и построение рек. систем.

Вы научитесь не просто «тюнить параметры», а понимать физический смысл операций.

Вход в поток до 9 декабря.
https://clc.to/LojFzw