Please open Telegram to view this post
VIEW IN TELEGRAM
👀32❤4👍3
Чувак полностью реализовал архитектуру GPT-OSS-20B с нуля на PyTorch. Все компоненты написаны с нуля:
▪️ RoPE с YaRN + NTK-by-parts для масштабирования контекста
▪️ RMSNorm
▪️ SwiGLU с клэмпингом и residual connections
▪️ Mixture-of-Experts (MoE)
▪️ Self-Attention, оптимизированный через Grouped Query Attention (GQA)
▪️ Learned sinks
▪️ Banded (скользящее окно) attention
▪️ Поддержка KV-кэширования
Всё это работает на одной A100 SXM (80GB). Он также написал подробную документацию с теорией каждого компонента, а также инструкциями по настройке и инференсу.
Репозиторий: https://github.com/HamzaElshafie/gpt-oss-20B
👉 @PythonPortal
Всё это работает на одной A100 SXM (80GB). Он также написал подробную документацию с теорией каждого компонента, а также инструкциями по настройке и инференсу.
Репозиторий: https://github.com/HamzaElshafie/gpt-oss-20B
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤25🤯19🔥10👍6
Google выпустил новый инструмент: PaperBanana
Умеет создавать академические иллюстрации, готовые к публикации, просто на основе текста с описанием методологии.
Без Figma. Без ручного дизайна. Без навыков рисования.
Как это работает:
Команда AI-агентов трудится за кулисами:
→ Один ищет подходящие примеры диаграмм
→ Один планирует структуру
→ Один оформляет стиль и компоновку
→ Один генерирует изображение
→ Один оценивает результат и улучшает его
Самое интересное: случайные примеры ссылок работают почти так же хорошо, как идеально подобранные. Главное — показать модели, как выглядят хорошие диаграммы, а не искать идеальный тематический пример.
В слепых тестах люди предпочли результаты PaperBanana в 75% случаев.
Это та самая рекурсия, которую мы ждали: AI-системы, способные полностью визуально документировать сами себя.
Открыта запись в лист ожидания
👉 @PythonPortal
Умеет создавать академические иллюстрации, готовые к публикации, просто на основе текста с описанием методологии.
Без Figma. Без ручного дизайна. Без навыков рисования.
Как это работает:
Команда AI-агентов трудится за кулисами:
→ Один ищет подходящие примеры диаграмм
→ Один планирует структуру
→ Один оформляет стиль и компоновку
→ Один генерирует изображение
→ Один оценивает результат и улучшает его
Самое интересное: случайные примеры ссылок работают почти так же хорошо, как идеально подобранные. Главное — показать модели, как выглядят хорошие диаграммы, а не искать идеальный тематический пример.
В слепых тестах люди предпочли результаты PaperBanana в 75% случаев.
Это та самая рекурсия, которую мы ждали: AI-системы, способные полностью визуально документировать сами себя.
Открыта запись в лист ожидания
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14👍4👀3
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Тюнинг LLM больше не обязательно должен быть медленным, дорогим и прожорливым к GPU.
Открытые инструменты сильно прокачались.
Теперь можно дообучать мощные LLM без корпоративного железа.
Вот 4 библиотеки, которые стоит знать, чтобы тюнинг был быстрее и дешевле:
1. Unsloth
Наверняка самый быстрый способ дообучения LLM на сегодня.
✅ До 2× быстрее
✅ ~70% меньше использования VRAM
✅ Работает с Gemma, Qwen, LLaMA, Mistral и другими
✅ Запускается на потребительских GPU (даже Colab/Kaggle с ~3GB VRAM 🤯 )
2. LLaMA Factory
Полный набор для дообучения.
✅ Поддержка 100+ моделей
✅ CLI + WebUI (подходит новичкам)
✅ LoRA, QLoRA, полный и замороженный FT (2–8 бит)
✅ Встроенные датасеты, мониторинг тренировки и экспорт моделей
3. DeepSpeed
Если идёте на большие масштабы.
✅ ZeRO и FSDP для масштабного обучения
✅ Оптимизация под multi-GPU и multi-node
✅ Проверен в продакшн-LLM тренировках
Если вы масштабируете серьёзные модели → это ваш выбор.
4. Axolotl
Конфигурационно-ориентированное дообучение, сделанное правильно.
✅ Workflow на YAML
✅ Поддержка LoRA, QLoRA, DPO, GRPO и мультимодальных моделей
✅ Оптимизация памяти на уровне ядра
✅ Плавная интеграция с Hugging Face
👉 @PythonPortal
Открытые инструменты сильно прокачались.
Теперь можно дообучать мощные LLM без корпоративного железа.
Вот 4 библиотеки, которые стоит знать, чтобы тюнинг был быстрее и дешевле:
1. Unsloth
Наверняка самый быстрый способ дообучения LLM на сегодня.
2. LLaMA Factory
Полный набор для дообучения.
3. DeepSpeed
Если идёте на большие масштабы.
Если вы масштабируете серьёзные модели → это ваш выбор.
4. Axolotl
Конфигурационно-ориентированное дообучение, сделанное правильно.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12
Media is too big
VIEW IN TELEGRAM
9 ключевых концепций искусственного интеллекта, объясненных за 7 минут
- Tokenization
- Text Decoding
- Prompt Engineering
- Multi Step AI Agents
- RAGs
- RLHF
- VAE
- Diffusion Models
- LoRA
👉 @PythonPortal
- Tokenization
- Text Decoding
- Prompt Engineering
- Multi Step AI Agents
- RAGs
- RLHF
- VAE
- Diffusion Models
- LoRA
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤2
This media is not supported in your browser
VIEW IN TELEGRAM
CLAUDE CODE, но для взлома.
Shannon: полностью автономный AI-хакер, который находит реальные эксплойты в ваших веб-приложениях.
Shannon показал 96,15% успешности на бенчмарке XBOW без подсказок, с учётом исходного кода.
Фичи:
» Полностью автономная работа
» Отчёты уровня пентеста с воспроизводимыми эксплойтами
» Покрытие критических уязвимостей из OWASP
» Динамическое тестирование с пониманием кода
» Работает на базе интегрированных security-инструментов
» Параллельная обработка для ускорения результатов
https://github.com/KeygraphHQ/shannon
👉 @PythonPortal
Shannon: полностью автономный AI-хакер, который находит реальные эксплойты в ваших веб-приложениях.
Shannon показал 96,15% успешности на бенчмарке XBOW без подсказок, с учётом исходного кода.
Фичи:
» Полностью автономная работа
» Отчёты уровня пентеста с воспроизводимыми эксплойтами
» Покрытие критических уязвимостей из OWASP
» Динамическое тестирование с пониманием кода
» Работает на базе интегрированных security-инструментов
» Параллельная обработка для ускорения результатов
https://github.com/KeygraphHQ/shannon
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯21👍8❤2🤔1
10 AI-проектов, которые помогут устроиться на работу в 2026 году:
👉 @PythonPortal
1. RAG-приложение с реальными оценками качества
Собери production-RAG с eval’ами, мониторингом и фидбэк-лупами.
Стек: OpenAI или Claude + векторная БД + eval’ы
Гайд: https://pinecone.io/learn/retrieval-augmented-generation/
2. Автономный агент для ресёрча
Агент, который планирует, ищет, приводит источники и генерирует отчёты.
Стек: LangGraph + инструменты + цитирование
Пример: https://github.com/langchain-ai/langgraph
3. AI-копилот для службы поддержки
Ассистент с human-in-the-loop, гардрейлами и аналитикой.
Стек: OpenAI + Zendesk или Intercom + модерация
Документация: https://platform.openai.com/docs/guides/assistants
4. Голосовой AI-агент (звонки и бронирование)
Принимает реальные звонки, записывает клиентов и делает фоллоу-апы.
Стек: Twilio + Whisper + LLM
Старт: https://twilio.com/docs/voice
5. AgentOps-дашборд
Отслеживание надёжности агентов, стоимости, сбоев и регрессий.
Стек: OpenTelemetry + eval’ы
Inspo: https://github.com/open-telemetry/opentelemetry-python
6. AI-пайплайн для извлечения данных
Массовое извлечение структурированных данных из PDF, писем и изображений.
Стек: vision-модели + валидация схем
Пример: https://github.com/Unstructured-IO/unstructured
7. AI для код-ревью в GitHub
Автоматические саммари PR, флаги рисков и рекомендации.
Стек: GitHub Actions + LLM
Документация: https://docs.github.com/en/actions
8. Мультиагентный планировщик workflow
Агенты-планировщики и исполнители с детерминированными фолбэками.
Стек: LangGraph или CrewAI
CrewAI: https://github.com/joaomdmoura/crewAI
9. AI-поисковик с актуальными данными
Поиск по вебу, форумам и соцсетям с источниками.
Стек: search API + reranker’ы
Референс: https://meilisearch.com/docs
10. Enterprise-инструмент для защиты промптов
Обнаружение prompt injection, утечек данных и небезопасных ответов.
Стек: policy-чеки + red teaming
Гайд: https://github.com/openai/openai-cookbook/tree/main/examples/Safety
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🤣4
Для тех, кто регулярно работает с PDF, где данные как будто намеренно спрятали (таблицы едут, колонки пляшут, сканы, кривой лэйаут) - вот хелпер: PDF-Extract-Kit 1.0.
Это специализированная модель для извлечения структурированных данных из документов
👉 @PythonPortal
Это специализированная модель для извлечения структурированных данных из документов
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤7👍3
Расширение PostgreSQL для RAG и агентских приложений: pgai
Питоновская библиотека, которая превращает PostgreSQL в нормальный, продовый retrieval-движок для RAG и агент-приложений.
Автоматом создает и синхронизирует векторные эмбеддинги из данных в PostgreSQL и документов в S3. Эмбеддинги автоматически обновляются при изменении данных.
Мощный векторный и семантический поиск на pgvector и pgvectorscale.
Есть batch-обработка для эффективной генерации эмбеддингов, плюс встроенная обработка падений модели, rate limit’ов и всплесков латентности.
Работает с любым PostgreSQL, включая Timescale Cloud, Amazon RDS, Supabase и т.д.
👉 @PythonPortal
Питоновская библиотека, которая превращает PostgreSQL в нормальный, продовый retrieval-движок для RAG и агент-приложений.
Автоматом создает и синхронизирует векторные эмбеддинги из данных в PostgreSQL и документов в S3. Эмбеддинги автоматически обновляются при изменении данных.
Мощный векторный и семантический поиск на pgvector и pgvectorscale.
Есть batch-обработка для эффективной генерации эмбеддингов, плюс встроенная обработка падений модели, rate limit’ов и всплесков латентности.
Работает с любым PostgreSQL, включая Timescale Cloud, Amazon RDS, Supabase и т.д.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9
This media is not supported in your browser
VIEW IN TELEGRAM
Тот самый разработчик на удалёнке в час дня, когда ему говорят, что пора бы работать уже
👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
❤30😁23🔥2🤣1
Python UV x Docker совет
Иногда полезно ставить зависимости в несколько шагов.
Например, чтобы лучше работал кэш слоев при сборке Docker-образа.
Сначала ставим только зависимости.
Потом копируем проект и ставим уже сам проект.
Зачем делить на два шага?
Docker собирает образ слоями: если слой закэширован, он не пересобирается, пока не изменились входные файлы.
Если отделить установку зависимостей от установки проекта:
▪️ Если меняется только main.py, Docker переиспользует закэшированный слой с зависимостями (быстрее)
▪️ Если меняется только pyproject.toml, Docker пересобирает слои начиная с этого места (и это правильно, потому что зависимости поменялись)
Без такого разделения любое изменение кода заставит заново переустанавливать все зависимости.
👉 @PythonPortal
Иногда полезно ставить зависимости в несколько шагов.
Например, чтобы лучше работал кэш слоев при сборке Docker-образа.
Сначала ставим только зависимости.
Потом копируем проект и ставим уже сам проект.
Зачем делить на два шага?
Docker собирает образ слоями: если слой закэширован, он не пересобирается, пока не изменились входные файлы.
Если отделить установку зависимостей от установки проекта:
Без такого разделения любое изменение кода заставит заново переустанавливать все зависимости.
# Install the project's dependencies using the lockfile and settings
RUN --mount=type=cache,target=/root/.cache/uv \
--mount=type=bind,source=uv.lock,target=uv.lock \
--mount=type=bind,source=pyproject.toml,target=pyproject.toml \
uv sync --locked --no-install-project
# Then, add the rest of the project source code and install it
# Installing separately from its dependencies allows optimal layer caching
COPY . /app
RUN --mount=type=cache,target=/root/.cache/uv \
uv sync --locked
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍1
Знакомьтесь: Microsoft Agent Framework
Новая open-source библиотека на Python для сборки агентов.
Microsoft Agent Framework это набор средств разработки с открытым исходным кодом для разработки AI-агентов и multi-agent воркфлоу на Python.
Он собирает и расширяет идеи из проектов Semantic Kernel и AutoGen, объединяя их сильные стороны и добавляя новые возможности.
Semantic Kernel и AutoGen были первыми, кто нормально оформил концепции AI-агентов и multi-agent оркестрации.
Agent Framework это прямой наследник, сделанный теми же командами. Он сочетает простые абстракции AutoGen для single-agent и multi-agent паттернов с enterprise-фичами Semantic Kernel: управление состоянием на потоках, type safety, фильтры, телеметрию, плюс широкую поддержку моделей и эмбеддингов.
👉 @PythonPortal
Новая open-source библиотека на Python для сборки агентов.
Microsoft Agent Framework это набор средств разработки с открытым исходным кодом для разработки AI-агентов и multi-agent воркфлоу на Python.
Он собирает и расширяет идеи из проектов Semantic Kernel и AutoGen, объединяя их сильные стороны и добавляя новые возможности.
Semantic Kernel и AutoGen были первыми, кто нормально оформил концепции AI-агентов и multi-agent оркестрации.
Agent Framework это прямой наследник, сделанный теми же командами. Он сочетает простые абстракции AutoGen для single-agent и multi-agent паттернов с enterprise-фичами Semantic Kernel: управление состоянием на потоках, type safety, фильтры, телеметрию, плюс широкую поддержку моделей и эмбеддингов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍4