Python Community
12K subscribers
1.37K photos
105 videos
15 files
878 links
Python Community RU - СНГ сообщество Python-разработчиков

Чат канала: @python_community_chat

Сотрудничество: @cyberJohnny и @Sergey_bzd

РКН реестр:
https://knd.gov.ru/license?id=67847dd98e552d6b54a511ed&registryType=bloggersPermission
Download Telegram
🐍 Почему ошибки валидации в Python иногда так сложно найти

Чем глубже вложена структура данных, тем сложнее понять, где именно произошла ошибка.

Если использовать обычные dataclass, вы чаще всего увидите только значение, которое не прошло проверку — но не путь к полю, где возникла проблема.

В сложных вложенных структурах это превращает отладку в настоящую боль.

Pydantic решает эту проблему.

Он показывает полный путь до поля, которое вызвало ошибку — от корневой модели до конкретного атрибута.

В результате сразу понятно, где искать проблему.

Пример:


from pydantic import BaseModel, Field

class Address(BaseModel):
zip_code: str = Field(pattern=r"^\d{5}$")

class Customer(BaseModel):
name: str
address: Address

customer = Customer(
name="Alice",
address={"zip_code": "9ABC1"}
)

Ошибка будет выглядеть так:


ValidationError: address.zip_code
String should match pattern '^\d{5}$'


То есть Pydantic сразу показывает:

address.zip_code

А не просто сообщает, что «где-то внутри данных ошибка».

Для сложных JSON, API-ответов и вложенных моделей это сильно упрощает дебаг.

#Python #Pydantic #Backend #DataValidation

@Python_Community_ru
🖥 ByteDance только что выпустили в открытый доступ - OpenViking, и этот проект показывает, что именно не так с тем, как сегодня строят память для AI-агентов.

Вот где большинство агент-фреймворков ошибаются:

Память хранится в одном месте.
Ресурсы — в другом.
Навыки разбросаны по системе.

Когда агенту нужен контекст, обычно делают плоский векторный поиск и просто надеются на лучший результат.

Именно это и проблема. OpenViking решает её одной идеей:
рассматривать контекст агента как файловую систему.

Всё работает через единый протокол:

viking://

Память, ресурсы и навыки организованы как директории с уникальными URI.
Агент может ls, find и навигировать по контексту, как разработчик в терминале.

Главный прорыв — многоуровневая загрузка контекста:

- L0 — одно предложение для быстрого поиска
- L1 — обзор ~2000 токенов для принятия решений
- L2 — полные детали, загружаются только когда действительно нужны

Большинство агентов просто загружает всё в контекст и надеется на лучшее.

OpenViking загружает только нужные данные и только в нужный момент.

Результат:

- меньше расходов на токены
- выше точность
- быстрее работа агентов

Retrieval теперь тоже работает логичнее.

Вместо одного плоского семантического поиска:

1. сначала происходит позиционирование на уровне директорий
2. затем рекурсивный поиск внутри наиболее релевантных директорий

Можно буквально видеть траекторию поиска — это больше не чёрный ящик.

Есть и механизм самоэволюции агента.

В конце каждой сессии система автоматически:

- извлекает новые знания
- обновляет память агента
- обновляет память пользователя

То есть агент становится умнее с каждым использованием.

Проект уже имеет:

- 9K звёзд на GitHub
- 13 контрибьюторов

Разработан командой ByteDance Viking, которая строит инфраструктуру векторного поиска с 2019 года.

Проект полностью open-source под лицензией Apache 2.0.

https://github.com/volcengine/OpenViking

@Python_Community_ru
🤖 Python библиотеки для AI-агентов — что изучать

Если вы хотите разрабатывать AI-агентов на Python, важно понимать порядок изучения библиотек.

Начните с LangChain, CrewAI или SmolAgents — они позволяют быстро собрать простых агентов, подключить инструменты и протестировать идеи.

Следующий уровень — LangGraph, LlamaIndex и Semantic Kernel. Эти инструменты уже используются для production-систем: RAG, orchestration и сложные workflow.

Самый сложный уровень — AutoGen, DSPy и A2A. Они нужны для автономных мультиагентных систем и оптимизации LLM-пайплайнов.

LangChain — простые агенты, инструменты и память
github.com/langchain-ai/langchain

CrewAI — мультиагентные системы с ролями
github.com/joaomdmoura/crewAI

SmolAgents — лёгкие агенты для быстрых экспериментов
github.com/huggingface/smolagents

LangGraph — orchestration и stateful workflow
github.com/langchain-ai/langgraph

LlamaIndex — RAG и knowledge-агенты
github.com/run-llama/llama_index

Semantic Kernel — AI workflow и плагины
github.com/microsoft/semantic-kernel

AutoGen — автономные мультиагентные системы
github.com/microsoft/autogen

DSPy — оптимизация LLM-пайплайнов
github.com/stanfordnlp/dspy

A2A — протокол взаимодействия между агентами
github.com/a2aproject/A2A

@Python_Community_ru
Cua (https://github.com/trycua/cua) — это Docker для агентов, использующих компьютер — он позволяет агентам ИИ управлять полноценными операционными системами в виртуальных контейнерах и развертывать их локально или в облаке.

— Всего ~1,000 строк кода — легко читать, расширять и встраивать
— Поддержка OpenAI, Anthropic, Mistral и других LLM-провайдеров

https://github.com/trycua/cua

@Python_Community_ru
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Себастьян Рашка собрал в одном месте галерею архитектур современных языковых моделей.

Внутри - 40+ моделей (2024–2026):
от DeepSeek и Qwen до Nemotron и Grok.

Для каждой модели есть:

• наглядная схема архитектуры
• размер и число параметров
• тип декодера
• ссылки на технические отчёты и конфиги
• иногда даже реализации

По сути это единая карта современных LLM, где можно быстро посмотреть, как устроены разные модели и как эволюционируют архитектуры.

https://sebastianraschka.com/llm-architecture-gallery/

@Python_Community_ru
🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Автономный помощник для подачи заявок на работу

ApplyPilot - это мощный инструмент для автоматизации процесса подачи заявок на работу. Он ищет вакансии на нескольких платформах, оценивает их с помощью ИИ, адаптирует ваше резюме и отправляет заявки без вашего участия. Просто настройте один раз и позвольте системе работать за вас.

🚀 Основные моменты:
- Полная автоматизация подачи заявок на работу
- Оценка вакансий по соответствию вашему резюме
- Генерация адаптированных резюме и сопроводительных писем
- Поддержка множества платформ для поиска вакансий
- Открытый исходный код и бесплатный доступ к API

📌 GitHub: https://github.com/Pickle-Pixel/ApplyPilot

@Python_Community_ru
🛰 Shadowbroker: Реальное геопространственное разведывательное решение

Shadowbroker — это платформа для анализа открытых источников, которая в реальном времени агрегирует данные о глобальных событиях, таких как авиаперелеты, морское движение, спутники и конфликты. Идеально подходит для аналитиков и исследователей, желающих получить целостный обзор мировых событий на едином интерфейсе.

🚀Основные моменты:
- Отслеживание частных и коммерческих авиарейсов
- Мониторинг морского трафика и военных кораблей
- Геолокация спутников и анализ их миссий
- Информация о глобальных конфликтах и событиях
- Доступ к CCTV и сигналам GPS в реальном времени

📌 GitHub: https://github.com/BigBodyCobain/Shadowbroker

@Python_Community_ru
💻 Большинство систем безопасности слепы не из-за отсутствия инструментов, а из-за отсутствия данных. Если аудит в Windows настроен формально — система событий есть, но пользы от неё нет.

На открытом уроке разберём, как превратить операционную систему в полноценный источник данных для систем класса SIEM. Мы покажем, как работает журнал событий Windows, как настраивать расширенный аудит, какие события действительно важны и как организовать их сбор.

Разберём установку агента Wazuh и практические подходы к построению наблюдаемости. Вы получите чёткое понимание, как формируется телеметрия и как сделать её пригодной для анализа и выявления инцидентов.

🗓 Урок пройдет 8 апреля в 20:00 МСК в преддверии старта курса «Специалист по внедрению SIEM».

👉 Зарегистрируйтесь и начните работать с данными, а не просто собирать их: https://vk.cc/cVMLhR

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Open-source прорыв: PrismAudio

Вышла модель PrismAudio и она уже забирает SOTA в генерации аудио из видео (V2A)

Что важно:

- 518M модель, принята на ICLR 2026
- обходит все аналоги по качеству звука
- быстрее конкурентов: ~0.63s на инференс

Главная фишка:

модель думает не одним блоком, а разбивает задачу на 4 части:

- смысл (что происходит)
- время (когда звучит)
- эстетика (как звучит)
- пространство (где звучит)

И обучается через RL прямо внутри этого процесса

Результат:

- топ по всем метрикам (CLAP, MOS и др.)
- лучше MMAudio, ThinkSound и HunyuanVideo
- стабильно работает даже вне обучающего датасета

Плюс: выпустили новый бенчмарк AudioCanvas - 800+ сценариев со звуками

Model: https://modelscope.ai/models/iic/PrismAudio
Demo: https://modelscope.cn/studios/iic/PrismAudio
Paper: https://modelscope.ai/papers/2511.18833
GitHub: https://github.com/FunAudioLLM/ThinkSound/tree/prismaudio

🐍 Python полезные ресурсы ( ) ()

@Python_Community_ru
🔥1