GitHub Разработчика

inksight

Когда фотографируешь рукописные заметки и хочешь превратить их в редактируемый цифровой документ, обычный OCR распознаёт только текст и теряет сами штрихи письма. А профессиональные планшеты для рукописного ввода требуют отдельного оборудования.

Недавно на GitHub появился InkSight — это опенсорсный проект от Google для преобразования рукописных заметок. Он умеет превращать фото рукописного текста в векторные штрихи, сохраняя траекторию письма, с поддержкой редактирования и поиска.

Система построена на архитектуре ViT + mT5 (encoder–decoder). Модель проходит двойное обучение через этапы «чтения» и «письма», благодаря чему она не только понимает рукописный текст, но и умеет восстанавливать сам процесс письма.

Поддерживается многоязычное распознавание, разные фоны и стили письма. Есть два режима конвертации:

на уровне слов,

и на уровне всей страницы.

На выходе получается векторный цифровой почерк, который можно напрямую редактировать, искать по нему или импортировать в заметочные приложения.

Также есть онлайн-демо на Hugging Face, выложен полный датасет и примеры кода в Jupyter для локального запуска.

📁 Language: #Python 13.2%

⭐️ Stars: 759

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤8👍7🔥3

2.5K views06:07

GitHub Разработчика

shapash

Обучить модель машинного обучения — это только первый шаг. Самая болезненная часть начинается, когда нужно объяснить начальству или бизнес-команде, почему модель выдала именно такой прогноз. В случае с «черными ящиками» обычно просто нечего сказать.

Недавно я нашел на GitHub библиотеку Shapash — Python-инструмент, который как раз помогает сделать модель «понятной», превращая сложную алгоритмическую логику в наглядные визуализации.

Библиотека умеет генерировать интерактивную веб-панель, где наглядно показано, какие признаки и как влияют на работу модели. Поддерживается детальный разбор от глобального уровня до отдельных предсказаний. И самое важное — все графики сопровождаются понятными бизнес-лейблами, так что даже люди без техбэкграунда смогут быстро разобраться.

Работает с CatBoost, XGBoost, LightGBM и Sklearn — то есть покрывает основные ML-фреймворки.

Помимо визуализации, библиотека может одним вызовом собрать отдельный HTML-отчет для аудита. Есть даже легковесный предиктор для продакшена, который ставится через pip и сразу готов к использованию.

Если ты регулярно показываешь результаты моделей нетехническим командам или тебе нужна прозрачность для регуляторных проверок, этот проект реально экономит кучу времени на объяснениях.

📁 Language: #Python 14.3%

⭐️ Stars: 3.1k

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤5

2.47K views16:07

OpenContracts

Когда работаешь с юридическими документами и договорами, боль обычно не в самом чтении, а в том, чтобы из сотен и тысяч файлов вытащить ключевую инфу, разметить важные пункты и при этом привести данные к единому формату, чтобы потом нормально анализировать.

Недавно на GitHub попался OpenContracts, опенсорсная платформа для анализа документов, заточенная под knowledge-intensive задачи, чтобы управление документами и извлечение данных было проще и быстрее.
Поддерживает загрузку, разметку и анализ PDF и текстовых документов. Внутри есть плагинный движок парсинга, который может автоматически извлекать признаки лейаута документа и строить векторные эмбеддинги для дальнейшего поиска/ретривала.

Главная фича это пакетное извлечение данных: можно одновременно задавать вопросы по сотням документов и вытаскивать структурированные данные, а результаты сразу подсвечиваются прямо в исходнике. Ещё есть поддержка кастомных схем метаданных, совместной разметки, управления доступами и прочих enterprise-историй.

Платформа построена на фреймворке PydanticAI: там собрана полноценная LLM-система с управлением диалогом и стримингом ответов в реальном времени. Разворачивается быстро через Docker.

Если у тебя много контрактов, юрдоков или другой “тяжёлой” по знаниям документации, и хочется превратить анализ из ручной рутины в более системный воркфлоу, платформу стоит попробовать.

📁 Language: #Python 52.0%

⭐️ Stars: 1.1k

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4

1.73K views06:07

GitHub Разработчика

Constrict

Нужно сжать видео до заданного размера для загрузки. Ручная подгонка битрейта с кучей проб и ошибок отнимает время, а онлайн-сервисы вызывают вопросы к приватности и скорости.

На GitHub нашелся Constrict — open-source инструмент для сжатия видео. Ты просто задаешь целевой размер файла, а он сам рассчитывает оптимальные параметры кодирования. Все обрабатывается локально, без загрузок в облако.

Инструмент построен на FFmpeg и автоматически подбирает битрейт, разрешение, FPS и качество аудио, стараясь сохранить максимум качества при нужном размере.

Поддерживает пакетную обработку в одну директорию, ограничение FPS для баланса четкости и плавности, а также кодеки H.264, HEVC, AV1 и VP9.

Если часто приходится ужимать видео под конкретный лимит и не хочется возиться с настройками или онлайн-сервисами, стоит попробовать.

📁 Language: #Python 94.2%

⭐️ Stars: 323

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2

1.61K views06:07

About

Blog

Apps

Platform