Python Portal
56K subscribers
2.42K photos
389 videos
51 files
986 links
Всё самое интересное из мира Python

Связь: @devmangx

РКН: https://clck.ru/3GMMF6
Download Telegram
Изучи Python с Университетом University of Helsinki

✓ С официальным сертификатом
✓ С нуля до продвинутого уровня
✓ 14 частей с практическими заданиями

Весь контент доступен → здесь

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20
pip 26.0: pre-release и фильтрация по времени загрузки

Три большие новые фичи:

▪️ --all-releases <package> и --only-final <package>: контроль pre-release по каждому пакету отдельно, плюс возможность отключить все pre-release пакеты через --only-final :all:
▪️ --uploaded-prior-to <timstamp>: можно ограничить по времени загрузки пакета, например --uploaded-prior-to "2026-01-01T00:00:00Z"
▪️ --requirements-from-script <script>: установка зависимостей, объявленных в inline metadata скрипта (PEP 723)

Куда более подробный пост: читать

Официальный анонс здесь

Полный changelog здесь

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥6😢1
This media is not supported in your browser
VIEW IN TELEGRAM
λ-2D от Lingdong Huang: визуальный, нарисованный руками язык программирования.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
22🤔4🔥2👍1
Вот частое заблуждение про RAG

Когда говорят про RAG, обычно думают так: проиндексировали док → потом достали этот же док.

Но индексация ≠ ретривал.

То есть данные, которые ты индексируешь, не обязаны совпадать с теми данными, которые ты потом скармливаешь LLM на этапе генерации.

Вот 4 умных способа индексировать данные:

1) Chunk Indexing

▪️Самый распространенный подход.
▪️Режешь документ на чанки, строишь эмбеддинги и кладешь их в векторную базу.
▪️Во время запроса просто достаешь ближайшие чанки.

Подход простой и рабочий, но большие или шумные чанки могут просаживать точность.

2) Sub-chunk Indexing

▪️Берешь исходные чанки и дробишь их еще мельче на сабчанки.
▪️Индексируешь уже эти более мелкие куски.
▪️Но при выдаче все равно возвращаешь “большой” чанк для контекста.

Помогает, когда в одном абзаце/секции намешано несколько разных идей: шанс точно сматчиться с запросом выше.

3) Query Indexing

▪️Вместо сырого текста генеришь гипотетические вопросы, на которые, по мнению LLM, этот чанк может ответить.
▪️Эмбеддишь эти вопросы и сохраняешь.
▪️При ретривале реальные пользовательские запросы обычно лучше ложатся на такие “вопросные” представления.
▪️Похожая идея есть в HyDE, только там матчат гипотетический ответ с реальными чанками.

Кайфово для QA-систем, потому что уменьшает семантический разрыв между запросом пользователя и тем, что лежит в индексе.

4) Summary Indexing

▪️Просишь LLM кратко резюмировать каждый чанк в компактную семантическую форму.
▪️Индексируешь summary вместо исходного текста.
▪️А возвращаешь все равно полный чанк для контекста.

Особенно эффективно для плотных или структурированных данных (типа CSV/таблиц), где эмбеддинги сырого текста часто слабо что-то выражают

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
15
Вот полный путь, который я бы рекомендовал, чтобы в этом году собрать production-grade AI-агентов:

▪️база по Python и алгоритмам
▪️математика и основы ML
▪️трансформеры и LLM
▪️prompt engineering
▪️memory и RAG
▪️tools и интеграции
▪️фреймворки типа LangChain или CrewAI
▪️multi-agent системы
▪️тестирование, деплой, безопасность

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
😁156🤣5👍4
JS пойман

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤣57🔥6🤔1
5 AI-проектов, которые помогут устроиться на работу в 2026:

1. RAG с нуля
GitHub: ссылка

2. AI-агент для соцсетей
GitHub: ссылка

3. Анализ медицинских изображений
GitHub: ссылка

4. Агенты с tool-calling через MCP
Ноутбук: ссылка

5. AI-ассистент с памятью
GitHub: ссылка

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
10
Большой Python-грех: использовать изменяемый объект как аргумент по умолчанию

Не используй изменяемые объекты в качестве значений по умолчанию. В Python значения аргументов по умолчанию вычисляются один раз, в момент определения функции, а не при каждом ее вызове.

Если у тебя аргумент по умолчанию выглядит так: items=[], этот список будет общим для всех вызовов, и ты получишь накапливающееся состояние, которого не планировал.

Лучший вариант: ставить неизменяемый объект в значение по умолчанию. Тогда каждый вызов будет получать новый список, как в примере

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2211😁5👍4
Please open Telegram to view this post
VIEW IN TELEGRAM
😁41🤣194
This media is not supported in your browser
VIEW IN TELEGRAM
Китайский агент для автоматизации рабочего стола, который работает полностью локально.

Он умеет запускать любые приложения, открывать файлы, серфить по сайтам и автоматизировать задачи без подключения к интернету.

100% Open-Source.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍166🤔2
Алгоритм Луна (Luhn) для верификации номера кредитных карт

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3810🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
А Нео избавился от влияния вайб кодинга

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👀172👍1
Онлайн-обучение Python и SQL с экспертами из НИУ ВШЭ

В Центре непрерывного образования факультета компьютерных наук НИУ ВШЭ открыт набор на программы повышения квалификации онлайн-формата, обучение на которых позволит вам с нуля освоить ключевые инструменты аналитиков данных — Python и SQL.

1️⃣Python для автоматизации и анализа данных
Вы научитесь работать с основными конструкциями и структурами данных в Python. Изучите Numpy и Pandas — фундаментальные библиотеки для науки о данных. Познакомитесь со всеми шагами проведения разведочного анализа данных. Освоите создание Telegram-ботов и поймете, как грамотно собирать данные. Научитесь строить визуализации для презентации данных.
📁Старт — 3 февраля. Присоединиться можно до 10 февраля. Подать заявку 📍

2️⃣SQL для начинающих
Вы освоите базовые принципы работы с реляционными базами данных и научитесь грамотно фильтровать и сортировать данные, используя ключевые операторы и выражения. Разберете агрегирующие функции, методы работы с датами и строками и поймете, как устроены связи между таблицами. Научитесь использовать подзапросы и временные таблицы, изучите оконные функции.
📁Старт — 16 февраля. Присоединиться можно до 24 февраля. Подать заявку 📍

Реклама. НИУ "ВШЭ". ИНН 7714030726. erid: 2SDnjcx8Peg
Please open Telegram to view this post
VIEW IN TELEGRAM