PythonDigest
1.9K subscribers
23 photos
1 video
17K links
Сборник Python новостей: https://pythondigest.ru

Наш IT-тренажер: https://app.incidenta.tech/

Создано в @incidenta_tech
Download Telegram
Generalized Propensity Score: как оценить эффект от непрерывного воздействия без A/B-теста
https://habr.com/ru/companies/garage8/articles/974802/

В прошлом квартале мы задались вопросом: как оценить эффект от времени, которое пользователь проводит в нашем разделе, на Retention Rate (RR)? Казалось бы, решение очевидное: провести A/B-тест, но на поверку всё оказалось не так просто. В статье разберем, как у нас получилось определить эффект, с какими сложностями столкнулись в процессе и как нам помог метод Generalized Propensity Score.
Как я писал книгу про Python
https://jenyay.net/blog/2025/12/09/kak-ya-pisal-knigu-pro-python/

Полтора года назад я начал писать книгу про Python. Когда-то я писал посты о том, как продвигаются дела с этой книгой. Потом долгое время в блоге я эту тему как-то игнорировал, хотя в Телеграме про нее писал периодически и процесс написания продолжался. И вот, наконец, книга под названием «Python для инженерных задач» вышла. 
tornado - 6.5.3
https://pypi.org/project/tornado/6.5.3/

Масштабируемый, не блокирующий web-сервер. Скачать можно по ссылке: https://pypi.python.org/pypi/tornado/
pymongo - 4.16.0.dev0
https://pypi.org/project/pymongo/4.16.0.dev0/

Python интерфейс для MongoDB. Скачать можно по ссылке: https://pypi.python.org/pypi/pymongo/
Возможное использование Rust в CPython
https://lwn.net/SubscriberLink/1046933/d13433b823f559c0/

Python core developers are actively discussing the introduction of Rust in the CPython code base, starting with optional extension modules and possibly going from there. This post covers the discussion and pros and cons of the idea.
modraw: Drawing Utils From Tldraw for Marimo
https://github.com/koaning/modraw
browsr: File Explorer in Your Terminal
https://github.com/juftin/browsr
От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей
https://habr.com/ru/articles/975082/

От «обезьяньей» работы к Smart-анализу: как правильно готовить данные для моделей.Что такое Exploratory Data Analysis и как избежать основных ошибок при его выполнении.
Multi-API Ensemble: 95% точности транскрипции региональных топонимов
https://habr.com/ru/articles/974978/

В статье полный разбор архитектуры, алгоритмы scoring, примеры кода и расчёт экономики.Один STT-сервис дал 60-70% точности на специфической лексике (топонимы, названия улиц, профессиональные термины). Два сервиса параллельно + взвешенное голосование + AI-fusion для спорных случаев дали 95%+ точности. Время обработки 5-8 секунд.
Python Bytes: #461 This episdoe has a typo
https://pythonbytes.fm/episodes/show/461/this-episdoe-has-a-typo

Очередной выпуск англоязычного подкаста Python Bytes
Python + Fortran: Когда numpy уже мало, а C++ ещё страшно. Ускоряем код в 150 раз
https://habr.com/ru/articles/975052/

В прошлой статье я рассуждал о том, почему Fortran в 2025 году всё ещё жив и даже растет в рейтингах. В комментариях справедливо заметили: «Философия — это хорошо, но как это применить современному разработчику? Зачем мне Fortran, если я пишу на Python?».
Как квантовать LLM. Практическое руководство для начинающих
https://habr.com/ru/articles/975468/

Рост числа параметров в LLM и других нейронных сетях создает проблему того, что запускать их может все меньшее количество людей. Это связано с тем, что запуск больших моделей требует наличие мощного оборудования, недоступное всем. Для решения этой проблемы разрабатываются различные виды оптимизации, позволяющие запускать крупные нейронные сети (в частности LLM) на менее мощном оборудовании. Одним из наиболее популярных подходов оптимизации LLM является квантизация.
Руководство по PyTorch для новичков: создаём модель множественной регрессии с нуля
https://habr.com/ru/companies/otus/articles/975328/

После взрывного роста интереса к ИИ я всё чаще вижу, что PyTorch заметно опережает TensorFlow по популярности. Оба фреймворка очень мощные и позволяют дата-сайентистам решать самые разные задачи, включая обработку естественного языка, что вновь подогрело интерес к глубокому обучению.
Как я тв-шоу переводил с помощью ML-моделей без подписок и СМС
https://habr.com/ru/articles/971644/

Сейчас мы переживаем бум ИИ-сервисов, которые за небольшую плату могут реализовать любые ваши творческие фантазии без необходимости глубокого понимания технических принципов их работы. Но я из тех, кто любит «ковыряться под капотом», поэтому в качестве проекта «выходного дня» я решил реализовать сервис машинного закадрового перевода видео с помощью общедоступных моделей с локальным запуском. А что из этого вышло – читайте далее.
💩1
Django 6.0: эволюция фреймворка в деталях
https://habr.com/ru/articles/975472/

В свежем релизе фреймворк усиливает совместимость между СУБД, упрощает работу с email, улучшает ORM, добавляет удобства в шаблонах и снижает риск «выгорания» первичных ключей.
Latency Profiling in Python: From Code Bottlenecks to Observability
https://quant.engineering/latency-profiling-in-python.html
agentic-context-engine - обучение агентов на основе их опыта
https://github.com/kayba-ai/agentic-context-engine
Анализ данных с сайта Pet911
https://habr.com/ru/articles/976420/

По данным Информационного телеграфного агентства России (ТАСС), в 2024 году в России было потеряно и найдено более 168 тысяч домашних животных, что на 17% больше, чем годом ранее. Для повышения шансов найти питомца живым и невредимым, помимо самостоятельных поисков, можно обратиться к волонтёрским сообществам и специализированным сервисам – именно волонтеры помогают найти более 90% пропавших животных. Одним из ключевых онлайн‑ресурсов, аккумулирующих информацию о пропаже и находке животных, является Pet911.
Talk Python to Me: #530: anywidget: Jupyter Widgets made easy
https://talkpython.fm/episodes/show/530/anywidget-jupyter-widgets-made-easy

Audio