Собрана коллекция из 100+ Colab-ноутбуков с пошаговыми гайдами по fine-tuning любых семейств языковых моделей.
Всё в одном месте — запускай, пробуй и адаптируй под свои задачи.
Подходит для:
🔥 экспериментов с разными архитектурами LLM
🔥 быстрого прототипирования
🔥 обучения и изучения техник fine-tuning
Отличный ресурс, чтобы не тратить время на настройку окружения и сразу переходить к практике.
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤5🔥1
🚀 Как запустить Random Forest на GPU и получить ускорение в 40 раз
Оказалось, это реально просто — и даже open-source. Фреймворк Hummingbird компилирует обученные ML-модели в тензорные вычисления.
Что это даёт:
— модель можно гонять на GPU, TPU и других ускорителях,
— при этом сохраняется исходная точность,
— а инференс становится до 40 раз быстрее.
📌 Это особенно полезно, если модель уже обучена, а вам важно её быстро и эффективно задеплоить.
Для обучения на GPU есть альтернатива — RAPIDS CuML.
🐸 Библиотека дата-сайентиста
#буст
Оказалось, это реально просто — и даже open-source. Фреймворк Hummingbird компилирует обученные ML-модели в тензорные вычисления.
Что это даёт:
— модель можно гонять на GPU, TPU и других ускорителях,
— при этом сохраняется исходная точность,
— а инференс становится до 40 раз быстрее.
📌 Это особенно полезно, если модель уже обучена, а вам важно её быстро и эффективно задеплоить.
Для обучения на GPU есть альтернатива — RAPIDS CuML.
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2👏1
Переворачиваем календарь — а там скидки, которые уже закончились.
Но мы их вернули на последний день 🤔
До 00:00 третьего сентября (цены как до 1 сентября):
▪️ Математика для Data Science — 35.199 ₽ вместо 44.900 ₽
▪️ Алгоритмы и структуры данных — 31.669 ₽ вместо 39.900 ₽
▪️ Основы IT — 14.994 ₽ вместо 19.900 ₽
▪️ Архитектуры и шаблоны — 24.890 ₽ вместо 32.900 ₽
▪️ Python — 24.990 ₽ вместо 32.900 ₽
▪️ ML для Data Science — 34.000 ₽ вместо 44. 000 ₽
▪️ AI-агенты — 49.000 ₽ вместо 59.000 ₽
👉 Хватаем скидки из прошлого
P.S. Машину времени одолжили у дяди Миши
Но мы их вернули на последний день 🤔
До 00:00 третьего сентября (цены как до 1 сентября):
▪️ Математика для Data Science — 35.199 ₽ вместо 44.900 ₽
▪️ Алгоритмы и структуры данных — 31.669 ₽ вместо 39.900 ₽
▪️ Основы IT — 14.994 ₽ вместо 19.900 ₽
▪️ Архитектуры и шаблоны — 24.890 ₽ вместо 32.900 ₽
▪️ Python — 24.990 ₽ вместо 32.900 ₽
▪️ ML для Data Science — 34.000 ₽ вместо 44. 000 ₽
▪️ AI-агенты — 49.000 ₽ вместо 59.000 ₽
👉 Хватаем скидки из прошлого
P.S. Машину времени одолжили у дяди Миши
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
✍️ AI by Hand: рекуррентные нейросети (RNN)
Новое упражнение для практики:
➡️ табличная версия RNN, где можно вводить свои значения, следить за вычислениями и изучать уравнения,
➡️ классическая графическая схема RNN для наглядного сопоставления с матричной записью.
Отличный способ разобрать RNN руками и понять, как они реально работают.
🔗 Упражнение: https://clc.to/t3YQvQ
🐸 Библиотека дата-сайентиста
#буст
Новое упражнение для практики:
Отличный способ разобрать RNN руками и понять, как они реально работают.
🔗 Упражнение: https://clc.to/t3YQvQ
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍2🔥1
😎 Сколько баллов набрали вы?
Голосуйте, какой у вас уровень разработчика:
😁 — 5-12 баллов (стажер)
👍 — 13-25 баллов (джуниор)
⚡️ — 26-40 баллов (джуниор+)
👏 — 41-60 баллов (миддл)
🔥 — 61-80 баллов (миддл+)
🎉 — 81-100 баллов (сеньор)
🤩 — 100+ баллов (тимлид)
Но вот в чем прикол — опытный разработчик набирает баллы не случайными косяками, а осознанными решениями.
👉 Научим, как быстро прокачаться от стажера до сеньора
Голосуйте, какой у вас уровень разработчика:
😁 — 5-12 баллов (стажер)
👍 — 13-25 баллов (джуниор)
⚡️ — 26-40 баллов (джуниор+)
👏 — 41-60 баллов (миддл)
🔥 — 61-80 баллов (миддл+)
🎉 — 81-100 баллов (сеньор)
🤩 — 100+ баллов (тимлид)
Но вот в чем прикол — опытный разработчик набирает баллы не случайными косяками, а осознанными решениями.
👉 Научим, как быстро прокачаться от стажера до сеньора
😁3🤩2👍1
Colour — это open-source пакет для Python, включающий:
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🤔1
📊 6 лучших библиотек Python для визуализации
Если вы начинаете работать с визуализацией в Python, выбор может показаться бесконечным: Matplotlib, seaborn, Plotly, Bokeh, Altair, Pygal… Какая библиотека лучше?
Всё зависит от задачи:
➕ Matplotlib — мощная и гибкая, но требует больше кода.
➕ Seaborn — удобна для статистических графиков.
➕ Plotly — интерактивные и красивые графики.
➕ Bokeh — для веб-визуализации.
➕ Altair — декларативный стиль, быстрый старт.
➕ Pygal — SVG-графики для встраивания.
В статье сравниваются плюсы и минусы каждой библиотеки, чтобы вам было проще выбрать подходящую под задачу.
🔗 Ссылка на статью: https://clc.to/nuqZPg
🐸 Библиотека дата-сайентиста
#буст
Если вы начинаете работать с визуализацией в Python, выбор может показаться бесконечным: Matplotlib, seaborn, Plotly, Bokeh, Altair, Pygal… Какая библиотека лучше?
Всё зависит от задачи:
В статье сравниваются плюсы и минусы каждой библиотеки, чтобы вам было проще выбрать подходящую под задачу.
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Большинство датасетов для Vision-Language моделей остаются закрытыми и недоступными для сообщества.
FineVision — огромный мультимодальный датасет:
— 24 млн сэмплов
— 17M изображений
— 89M QA-диалогов
— 10B токенов ответов
— Оценка качества с помощью 32B VLM по 4 метрикам
Для дата-сайентистов это полезно, потому что:
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2🔥1
🎮 КВЕСТОВАЯ ЛИНИЯ: «Путь Data Scientist'а»
⮕ Твой стартовый набор искателя данных:
⚡️ АКТИВЕН ВРЕМЕННЫЙ БАФФ: «Щедрость наставника»
Эффект: –30% к цене полного набора ДСника
Было: 121.800 ₽ → Стало: 84.900 ₽
☞ Что ждет тебя в этом квесте
📎 Забрать бафф
Рассрочки: 3 мес | 6 мес | 12 мес
⮕ Твой стартовый набор искателя данных:
Python — твое легендарное оружие (урон по багам +∞)
Математика — твой базовый интеллект (влияет на понимание алгоритмов)
Машинное обучение — твое дерево навыков (открывает новые способности)
⚡️ АКТИВЕН ВРЕМЕННЫЙ БАФФ: «Щедрость наставника»
Эффект: –30% к цене полного набора ДСника
Было: 121.800 ₽ → Стало: 84.900 ₽
☞ Что ждет тебя в этом квесте
— Получение артефактов: портфолио проектов и сертификаты— Прокачка от новичка до Senior Data Scientist— Босс-файты с реальными задачами из индустрии— Доступ к гильдии единомышленников
📎 Забрать бафф
Рассрочки: 3 мес | 6 мес | 12 мес
Please open Telegram to view this post
VIEW IN TELEGRAM
😁10❤2
Почему библиотека Pandas получила такое название?
Anonymous Quiz
14%
В честь медведя панды
70%
От слов «panel data»
4%
В честь автора с фамилией Panda
12%
Просто шутка про животное
❤1
🧵 Архитектуры и данные
— The Parallelism Mesh Zoo — схемный разбор стратегий параллелизации в PyTorch и JAX через понятие device mesh. Отличный способ проверить, понимаете ли вы, как работает масштабирование на GPU. Читать
— 3 Questions: Synthetic Data — MIT о плюсах и минусах синтетических данных: от приватности и экономии до ограничений и рисков. Читать
🧠 Новые модели и AI-сервисы
— Google EmbeddingGemma — новая open-модель эмбеддингов для офлайн-работы прямо на ноутбуках и смартфонах. Подробнее
— OpenAI Jobs Platform — AI-платформа для поиска работы и сертификации AI-навыков. Подробнее
— Google NotebookLM — теперь умеет аудио-обзоры в 4 форматах: Deep Dive, Brief, Critique и Debate + более естественные голоса. Подробнее
📚 Лонгриды и статьи
— ML Q & AI. Глава 8. Успех трансформеров
—Очеловечить компьютер: как развивалось машинное обучение в середине XX века
— Интерпретация и оптимизация перцептрона Розенблатта
— Что такое детерминизм и как с ним бороться?
— Когда YOLO не спасает: как один параметр может испортить всё
#свежак
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
⚡️ Будь как этот гений с картинки — предлагай свои условия работодателю, а не наоборот!
Кто нужен?
Но если вы пока джун — я бы предложил:
- Full-time контракт: 180к/мес после курса + опцион на карьеру в топ-компаниях
- Либо фикс за проект: стань ML-инженером за 39к вместо 44к с промокодом LASTCALL
🔗 Старт 9 сентября
Кто нужен?
Senior ML-Engineer с опытом работы более 6 месяцев в FAANG компаниях. Требование: разработать кросс-платформенное приложение-трекер зарплат с AI-распознаванием вакансий по резюме.
Но если вы пока джун — я бы предложил:
- Full-time контракт: 180к/мес после курса + опцион на карьеру в топ-компаниях
- Либо фикс за проект: стань ML-инженером за 39к вместо 44к с промокодом LASTCALL
🔗 Старт 9 сентября
Forwarded from Библиотека задач по Data Science | тесты, код, задания
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Forwarded from Библиотека задач по Data Science | тесты, код, задания
Иногда реально ощущение, что нас держат в Матрице.
Большинство сидит, читает статьи про ML, смотрит ролики «как это работает» — и всё.
❗ Сегодня последний день промокода Lastcall (−5000 ₽).
Уже завтра стартует первый вебинар по Машинному обучению — полный набор для выхода из Матрицы.
Кто готов вырваться из симуляции и ворваться в сезон найма?
👾 — я уже в команде Нео
👍 — хочу красную таблетку
🤔 — пока думаю, но интересно
👉 Забронируй место сейчас
Большинство сидит, читает статьи про ML, смотрит ролики «как это работает» — и всё.
❗ Сегодня последний день промокода Lastcall (−5000 ₽).
Уже завтра стартует первый вебинар по Машинному обучению — полный набор для выхода из Матрицы.
Кто готов вырваться из симуляции и ворваться в сезон найма?
👾 — я уже в команде Нео
👍 — хочу красную таблетку
🤔 — пока думаю, но интересно
👉 Забронируй место сейчас
🔥 AI и неструктурированные данные: возможности для дата-сайентистов
Google Cloud выпустил практическое руководство по Data Science, где показываются реальные кейсы применения AI для работы с корпоративными данными.
Вот что вы можете делать с такими данными:
▫️ Выявлять причины падения продаж — AI анализирует отзывы клиентов и говорит, какие функции продукта надо улучшить.
▫️ Создать визуальный поиск — клиенты находят товар по картинке, а не по тексту.
▫️ Автоматизировать анализ контрактов — извлекать ключевую информацию из юридических документов за секунды.
▫️ Прогнозировать спрос — точные прогнозы для каждого продукта и магазина, чтобы избежать потерь и перепроизводства.
Это огромная возможность: неструктурированные данные больше не головная боль — это источник инсайтов и новых моделей.
🔗 Ссылка на гайд
🐸 Библиотека дата-сайентиста
#буст
Google Cloud выпустил практическое руководство по Data Science, где показываются реальные кейсы применения AI для работы с корпоративными данными.
Вот что вы можете делать с такими данными:
Это огромная возможность: неструктурированные данные больше не головная боль — это источник инсайтов и новых моделей.
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2