Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
Тюнинг LLM больше не обязательно должен быть медленным, дорогим и прожорливым к GPU.
Открытые инструменты сильно прокачались.
Теперь можно дообучать мощные LLM без корпоративного железа.
Вот 4 библиотеки, которые стоит знать, чтобы тюнинг был быстрее и дешевле:
1. Unsloth
Наверняка самый быстрый способ дообучения LLM на сегодня.
✅ До 2× быстрее
✅ ~70% меньше использования VRAM
✅ Работает с Gemma, Qwen, LLaMA, Mistral и другими
✅ Запускается на потребительских GPU (даже Colab/Kaggle с ~3GB VRAM 🤯 )
2. LLaMA Factory
Полный набор для дообучения.
✅ Поддержка 100+ моделей
✅ CLI + WebUI (подходит новичкам)
✅ LoRA, QLoRA, полный и замороженный FT (2–8 бит)
✅ Встроенные датасеты, мониторинг тренировки и экспорт моделей
3. DeepSpeed
Если идёте на большие масштабы.
✅ ZeRO и FSDP для масштабного обучения
✅ Оптимизация под multi-GPU и multi-node
✅ Проверен в продакшн-LLM тренировках
Если вы масштабируете серьёзные модели → это ваш выбор.
4. Axolotl
Конфигурационно-ориентированное дообучение, сделанное правильно.
✅ Workflow на YAML
✅ Поддержка LoRA, QLoRA, DPO, GRPO и мультимодальных моделей
✅ Оптимизация памяти на уровне ядра
✅ Плавная интеграция с Hugging Face
👉 @PythonPortal
Открытые инструменты сильно прокачались.
Теперь можно дообучать мощные LLM без корпоративного железа.
Вот 4 библиотеки, которые стоит знать, чтобы тюнинг был быстрее и дешевле:
1. Unsloth
Наверняка самый быстрый способ дообучения LLM на сегодня.
2. LLaMA Factory
Полный набор для дообучения.
3. DeepSpeed
Если идёте на большие масштабы.
Если вы масштабируете серьёзные модели → это ваш выбор.
4. Axolotl
Конфигурационно-ориентированное дообучение, сделанное правильно.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12
Media is too big
VIEW IN TELEGRAM
9 ключевых концепций искусственного интеллекта, объясненных за 7 минут
- Tokenization
- Text Decoding
- Prompt Engineering
- Multi Step AI Agents
- RAGs
- RLHF
- VAE
- Diffusion Models
- LoRA
👉 @PythonPortal
- Tokenization
- Text Decoding
- Prompt Engineering
- Multi Step AI Agents
- RAGs
- RLHF
- VAE
- Diffusion Models
- LoRA
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤2
This media is not supported in your browser
VIEW IN TELEGRAM
CLAUDE CODE, но для взлома.
Shannon: полностью автономный AI-хакер, который находит реальные эксплойты в ваших веб-приложениях.
Shannon показал 96,15% успешности на бенчмарке XBOW без подсказок, с учётом исходного кода.
Фичи:
» Полностью автономная работа
» Отчёты уровня пентеста с воспроизводимыми эксплойтами
» Покрытие критических уязвимостей из OWASP
» Динамическое тестирование с пониманием кода
» Работает на базе интегрированных security-инструментов
» Параллельная обработка для ускорения результатов
https://github.com/KeygraphHQ/shannon
👉 @PythonPortal
Shannon: полностью автономный AI-хакер, который находит реальные эксплойты в ваших веб-приложениях.
Shannon показал 96,15% успешности на бенчмарке XBOW без подсказок, с учётом исходного кода.
Фичи:
» Полностью автономная работа
» Отчёты уровня пентеста с воспроизводимыми эксплойтами
» Покрытие критических уязвимостей из OWASP
» Динамическое тестирование с пониманием кода
» Работает на базе интегрированных security-инструментов
» Параллельная обработка для ускорения результатов
https://github.com/KeygraphHQ/shannon
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯21👍8❤2🤔1
10 AI-проектов, которые помогут устроиться на работу в 2026 году:
👉 @PythonPortal
1. RAG-приложение с реальными оценками качества
Собери production-RAG с eval’ами, мониторингом и фидбэк-лупами.
Стек: OpenAI или Claude + векторная БД + eval’ы
Гайд: https://pinecone.io/learn/retrieval-augmented-generation/
2. Автономный агент для ресёрча
Агент, который планирует, ищет, приводит источники и генерирует отчёты.
Стек: LangGraph + инструменты + цитирование
Пример: https://github.com/langchain-ai/langgraph
3. AI-копилот для службы поддержки
Ассистент с human-in-the-loop, гардрейлами и аналитикой.
Стек: OpenAI + Zendesk или Intercom + модерация
Документация: https://platform.openai.com/docs/guides/assistants
4. Голосовой AI-агент (звонки и бронирование)
Принимает реальные звонки, записывает клиентов и делает фоллоу-апы.
Стек: Twilio + Whisper + LLM
Старт: https://twilio.com/docs/voice
5. AgentOps-дашборд
Отслеживание надёжности агентов, стоимости, сбоев и регрессий.
Стек: OpenTelemetry + eval’ы
Inspo: https://github.com/open-telemetry/opentelemetry-python
6. AI-пайплайн для извлечения данных
Массовое извлечение структурированных данных из PDF, писем и изображений.
Стек: vision-модели + валидация схем
Пример: https://github.com/Unstructured-IO/unstructured
7. AI для код-ревью в GitHub
Автоматические саммари PR, флаги рисков и рекомендации.
Стек: GitHub Actions + LLM
Документация: https://docs.github.com/en/actions
8. Мультиагентный планировщик workflow
Агенты-планировщики и исполнители с детерминированными фолбэками.
Стек: LangGraph или CrewAI
CrewAI: https://github.com/joaomdmoura/crewAI
9. AI-поисковик с актуальными данными
Поиск по вебу, форумам и соцсетям с источниками.
Стек: search API + reranker’ы
Референс: https://meilisearch.com/docs
10. Enterprise-инструмент для защиты промптов
Обнаружение prompt injection, утечек данных и небезопасных ответов.
Стек: policy-чеки + red teaming
Гайд: https://github.com/openai/openai-cookbook/tree/main/examples/Safety
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🤣4
Для тех, кто регулярно работает с PDF, где данные как будто намеренно спрятали (таблицы едут, колонки пляшут, сканы, кривой лэйаут) - вот хелпер: PDF-Extract-Kit 1.0.
Это специализированная модель для извлечения структурированных данных из документов
👉 @PythonPortal
Это специализированная модель для извлечения структурированных данных из документов
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤7👍3
Расширение PostgreSQL для RAG и агентских приложений: pgai
Питоновская библиотека, которая превращает PostgreSQL в нормальный, продовый retrieval-движок для RAG и агент-приложений.
Автоматом создает и синхронизирует векторные эмбеддинги из данных в PostgreSQL и документов в S3. Эмбеддинги автоматически обновляются при изменении данных.
Мощный векторный и семантический поиск на pgvector и pgvectorscale.
Есть batch-обработка для эффективной генерации эмбеддингов, плюс встроенная обработка падений модели, rate limit’ов и всплесков латентности.
Работает с любым PostgreSQL, включая Timescale Cloud, Amazon RDS, Supabase и т.д.
👉 @PythonPortal
Питоновская библиотека, которая превращает PostgreSQL в нормальный, продовый retrieval-движок для RAG и агент-приложений.
Автоматом создает и синхронизирует векторные эмбеддинги из данных в PostgreSQL и документов в S3. Эмбеддинги автоматически обновляются при изменении данных.
Мощный векторный и семантический поиск на pgvector и pgvectorscale.
Есть batch-обработка для эффективной генерации эмбеддингов, плюс встроенная обработка падений модели, rate limit’ов и всплесков латентности.
Работает с любым PostgreSQL, включая Timescale Cloud, Amazon RDS, Supabase и т.д.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9
This media is not supported in your browser
VIEW IN TELEGRAM
Тот самый разработчик на удалёнке в час дня, когда ему говорят, что пора бы работать уже
👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
❤30😁26🔥2🤣2
Python UV x Docker совет
Иногда полезно ставить зависимости в несколько шагов.
Например, чтобы лучше работал кэш слоев при сборке Docker-образа.
Сначала ставим только зависимости.
Потом копируем проект и ставим уже сам проект.
Зачем делить на два шага?
Docker собирает образ слоями: если слой закэширован, он не пересобирается, пока не изменились входные файлы.
Если отделить установку зависимостей от установки проекта:
▪️ Если меняется только main.py, Docker переиспользует закэшированный слой с зависимостями (быстрее)
▪️ Если меняется только pyproject.toml, Docker пересобирает слои начиная с этого места (и это правильно, потому что зависимости поменялись)
Без такого разделения любое изменение кода заставит заново переустанавливать все зависимости.
👉 @PythonPortal
Иногда полезно ставить зависимости в несколько шагов.
Например, чтобы лучше работал кэш слоев при сборке Docker-образа.
Сначала ставим только зависимости.
Потом копируем проект и ставим уже сам проект.
Зачем делить на два шага?
Docker собирает образ слоями: если слой закэширован, он не пересобирается, пока не изменились входные файлы.
Если отделить установку зависимостей от установки проекта:
Без такого разделения любое изменение кода заставит заново переустанавливать все зависимости.
# Install the project's dependencies using the lockfile and settings
RUN --mount=type=cache,target=/root/.cache/uv \
--mount=type=bind,source=uv.lock,target=uv.lock \
--mount=type=bind,source=pyproject.toml,target=pyproject.toml \
uv sync --locked --no-install-project
# Then, add the rest of the project source code and install it
# Installing separately from its dependencies allows optimal layer caching
COPY . /app
RUN --mount=type=cache,target=/root/.cache/uv \
uv sync --locked
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍2
Знакомьтесь: Microsoft Agent Framework
Новая open-source библиотека на Python для сборки агентов.
Microsoft Agent Framework это набор средств разработки с открытым исходным кодом для разработки AI-агентов и multi-agent воркфлоу на Python.
Он собирает и расширяет идеи из проектов Semantic Kernel и AutoGen, объединяя их сильные стороны и добавляя новые возможности.
Semantic Kernel и AutoGen были первыми, кто нормально оформил концепции AI-агентов и multi-agent оркестрации.
Agent Framework это прямой наследник, сделанный теми же командами. Он сочетает простые абстракции AutoGen для single-agent и multi-agent паттернов с enterprise-фичами Semantic Kernel: управление состоянием на потоках, type safety, фильтры, телеметрию, плюс широкую поддержку моделей и эмбеддингов.
👉 @PythonPortal
Новая open-source библиотека на Python для сборки агентов.
Microsoft Agent Framework это набор средств разработки с открытым исходным кодом для разработки AI-агентов и multi-agent воркфлоу на Python.
Он собирает и расширяет идеи из проектов Semantic Kernel и AutoGen, объединяя их сильные стороны и добавляя новые возможности.
Semantic Kernel и AutoGen были первыми, кто нормально оформил концепции AI-агентов и multi-agent оркестрации.
Agent Framework это прямой наследник, сделанный теми же командами. Он сочетает простые абстракции AutoGen для single-agent и multi-agent паттернов с enterprise-фичами Semantic Kernel: управление состоянием на потоках, type safety, фильтры, телеметрию, плюс широкую поддержку моделей и эмбеддингов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Google выкатил бесплатного убийцу Duolingo
Называется Little Language Lessons. Он генерит кастомных собеседников для практики, гайды по сленгу и визуальные колоды словаря для 40+ языков.
✓ 40+ языков (английский, немецкий, китайский и т.д.)
✓ 0% подписок и платных планов
✓ 100% практическая польза
👉 @PythonPortal
Называется Little Language Lessons. Он генерит кастомных собеседников для практики, гайды по сленгу и визуальные колоды словаря для 40+ языков.
✓ 40+ языков (английский, немецкий, китайский и т.д.)
✓ 0% подписок и платных планов
✓ 100% практическая польза
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19❤6🤯2🤣1