Surya
Surya — open-source OCR-модель на 650 млн параметров, которая показывает 83.3% на olmOCR-bench и обрабатывает до 5 страниц в секунду на RTX 5090.
Что умеет:
• 83.3% на olmOCR-bench — лучший результат среди моделей меньше 3 млрд параметров
• до 5 страниц в секунду на RTX 5090
• 87.2% на мультиязычном бенчмарке для 91 языка
• встроенный анализ структуры документа
• определение порядка чтения текста
• распознавание таблиц без дополнительных моделей
Подходит для извлечения текста из PDF, сканов, книг, отчётов и других документов, где важна не только OCR-часть, но и понимание структуры страницы.
📁 Language: #Python 94.4%
⭐️ Stars: 20к
➡️ Cсылка на GitHub
📱 @git_developer
Surya — open-source OCR-модель на 650 млн параметров, которая показывает 83.3% на olmOCR-bench и обрабатывает до 5 страниц в секунду на RTX 5090.
Что умеет:
• 83.3% на olmOCR-bench — лучший результат среди моделей меньше 3 млрд параметров
• до 5 страниц в секунду на RTX 5090
• 87.2% на мультиязычном бенчмарке для 91 языка
• встроенный анализ структуры документа
• определение порядка чтения текста
• распознавание таблиц без дополнительных моделей
Подходит для извлечения текста из PDF, сканов, книг, отчётов и других документов, где важна не только OCR-часть, но и понимание структуры страницы.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7
ChatTTS-ui
Нужен локальный аналог облачных TTS-сервисов?
ChatTTS-ui оборачивает модель ChatTTS в удобный веб-интерфейс и API, которые можно запускать полностью локально.
Что умеет:
• синтезирует речь из текста с поддержкой китайского, английского языка и чисел в одном запросе;
• есть готовая сборка для Windows, можно запустить без настройки исходников;
• поддерживает запуск через Docker на Linux как с GPU, так и на CPU;
• помимо веб-интерфейса предоставляет API для интеграции в свои проекты.
Удобный вариант, если нужен локальный TTS без зависимости от облачных сервисов.
📁 Language: #Python 90.7%
⭐️ Stars: 7.6к
➡️ Cсылка на GitHub
📱 @git_developer
Нужен локальный аналог облачных TTS-сервисов?
ChatTTS-ui оборачивает модель ChatTTS в удобный веб-интерфейс и API, которые можно запускать полностью локально.
Что умеет:
• синтезирует речь из текста с поддержкой китайского, английского языка и чисел в одном запросе;
• есть готовая сборка для Windows, можно запустить без настройки исходников;
• поддерживает запуск через Docker на Linux как с GPU, так и на CPU;
• помимо веб-интерфейса предоставляет API для интеграции в свои проекты.
Удобный вариант, если нужен локальный TTS без зависимости от облачных сервисов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
agentic-stack
Claude Code, OpenClaw и Hermes Agent теперь могут использовать общий слой памяти и навыков.
Одна папка
Меняете инструмент, а накопленная память, навыки и весь опыт остаются на месте.
По сути, один переносимый слой памяти для разных кодовых агентов. Никакой привязки к конкретному инструменту и никакой потери накопленных знаний при миграции. Open source.
📁 Language: #Python 96.7%
⭐️ Stars: 2.1к
➡️ Cсылка на GitHub
📱 @git_developer
Claude Code, OpenClaw и Hermes Agent теперь могут использовать общий слой памяти и навыков.
Одна папка
.agent/ работает сразу в 8 разных агентных harness'ах для программирования.Меняете инструмент, а накопленная память, навыки и весь опыт остаются на месте.
По сути, один переносимый слой памяти для разных кодовых агентов. Никакой привязки к конкретному инструменту и никакой потери накопленных знаний при миграции. Open source.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🔥1
Back In Time
Графическая оболочка для rsync, которая делает инкрементальные резервные копии и экономит место с помощью жёстких ссылок. В новые бэкапы попадают только изменённые файлы.
- Графический интерфейс на Qt и поддержка командной строки
- Локальные и удалённые резервные копии по SSH
- Планирование резервного копирования и восстановления через файловый менеджер, CLI или встроенный GUI
- Написан на Python 3, доступен для большинства GNU/Linux-дистрибутивов
- Проект активно поддерживается, основной фокус сейчас — стабилизация кодовой базы и исправление критических проблем
Подойдёт тем, кому нужен простой аналог Time Machine для Linux без лишней сложности и с использованием проверенного rsync под капотом.
📁 Language: #Python 99%
⭐️ Stars: 2.6к
➡️ Cсылка на GitHub
📱 @git_developer
Графическая оболочка для rsync, которая делает инкрементальные резервные копии и экономит место с помощью жёстких ссылок. В новые бэкапы попадают только изменённые файлы.
- Графический интерфейс на Qt и поддержка командной строки
- Локальные и удалённые резервные копии по SSH
- Планирование резервного копирования и восстановления через файловый менеджер, CLI или встроенный GUI
- Написан на Python 3, доступен для большинства GNU/Linux-дистрибутивов
- Проект активно поддерживается, основной фокус сейчас — стабилизация кодовой базы и исправление критических проблем
Подойдёт тем, кому нужен простой аналог Time Machine для Linux без лишней сложности и с использованием проверенного rsync под капотом.
Please open Telegram to view this post
VIEW IN TELEGRAM
💊2❤1
SQLModel
SQLModel использует аннотации типов Python для объединения возможностей Pydantic и SQLAlchemy, сокращая дублирование кода при работе с SQL-базами данных.
* Одна аннотация типа заменяет отдельные модели Pydantic и SQLAlchemy
* Разработан с учётом совместимости с FastAPI, Pydantic и SQLAlchemy
* Под капотом использует Pydantic и SQLAlchemy
* Разумные настройки по умолчанию позволяют свести объём шаблонного кода к минимуму
📁 Language: #Python 99.7%
⭐️ Stars: 18к
➡️ Cсылка на GitHub
📱 @git_developer
SQLModel использует аннотации типов Python для объединения возможностей Pydantic и SQLAlchemy, сокращая дублирование кода при работе с SQL-базами данных.
* Одна аннотация типа заменяет отдельные модели Pydantic и SQLAlchemy
* Разработан с учётом совместимости с FastAPI, Pydantic и SQLAlchemy
* Под капотом использует Pydantic и SQLAlchemy
* Разумные настройки по умолчанию позволяют свести объём шаблонного кода к минимуму
Please open Telegram to view this post
VIEW IN TELEGRAM
💊2
This media is not supported in your browser
VIEW IN TELEGRAM
Meetily
Каждую встречу нам приходится одновременно обсуждать и фиксировать ключевые моменты, из-за чего часто что-то упускается.
Представляю открытый и бесплатный AI-помощник для митингов — Meetily, полностью локальное офлайн-решение.
Приложение в реальном времени захватывает аудио, транскрибирует его и формирует сводку — всё обрабатывается локально, без серверов, с сохранением конфиденциальности данных.
🔸 Захват аудио с микрофона и системы в реальном времени
🔸 Мгновенная транскрипция с помощью локальной модели Whisper
🔸 Поддержка нескольких LLM-провайдеров: Anthropic, Groq, Ollama
🔸 Полностью офлайн-обработка без внешних серверов — максимальная приватность
Доступны установщики для Windows и macOS — скачал и сразу работаешь.
📁 Language: #Cpp(49.5%), #TypeScript(17.1%), #Rust(14.5%), #Python(8.3%)
⭐️ Stars: 1.8k
➡️ Cсылка на GitHub
📱 @git_developer
Каждую встречу нам приходится одновременно обсуждать и фиксировать ключевые моменты, из-за чего часто что-то упускается.
Представляю открытый и бесплатный AI-помощник для митингов — Meetily, полностью локальное офлайн-решение.
Приложение в реальном времени захватывает аудио, транскрибирует его и формирует сводку — всё обрабатывается локально, без серверов, с сохранением конфиденциальности данных.
Доступны установщики для Windows и macOS — скачал и сразу работаешь.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍2
knowledge-graph-extractor
Извлекает содержимое любых документов и архивов в интерактивный граф знаний, работая на одной NVIDIA L4 и локально развёрнутой LLM.
На вход можно подать текст, URL или архив
Результаты отображаются в реальном времени в виде force-directed графа. При наведении курсора на узел или связь можно посмотреть подробную информацию.
Под капотом используется самостоятельно развёрнутая квантизированная модель Qwen3.6-35B в связке с llama.cpp. Для работы достаточно одной видеокарты L4. CPU отвечает за семантическую дедупликацию данных, а также за планирование задач и восстановление из контрольных точек (checkpoint recovery).
📁 Language: #Python 94.4%
⭐️ Stars: 186
➡️ Cсылка на GitHub
📱 @git_developer
Извлекает содержимое любых документов и архивов в интерактивный граф знаний, работая на одной NVIDIA L4 и локально развёрнутой LLM.
На вход можно подать текст, URL или архив
.zip, после чего система автоматически построит граф знаний. Каждый факт представляется в виде триплета (субъект, отношение, объект) и содержит заголовок, исходное подтверждение (evidence), оценку достоверности (confidence score) и другие метаданные.Результаты отображаются в реальном времени в виде force-directed графа. При наведении курсора на узел или связь можно посмотреть подробную информацию.
Под капотом используется самостоятельно развёрнутая квантизированная модель Qwen3.6-35B в связке с llama.cpp. Для работы достаточно одной видеокарты L4. CPU отвечает за семантическую дедупликацию данных, а также за планирование задач и восстановление из контрольных точек (checkpoint recovery).
Please open Telegram to view this post
VIEW IN TELEGRAM
winpodx
Работая в Linux, иногда приходится запускать Windows-софт. Виртуальная машина слишком тяжёлая, Wine не всегда справляется с совместимостью.
Нашёл open-source проект WinPodX — он позволяет запускать Windows-приложения прямо в Linux: нажал на иконку и работаешь.
Например, .docx файл открывается сразу в Word. Есть двусторонний буфер обмена, звук, принтеры, можно пробрасывать USB-устройства в Windows.
Внутри поднимается Windows-контейнер. Приложения рендерятся по отдельности через remote app подход и выглядят как обычные Linux-окна — со своими иконками, закреплением в панели задач и переключением как у нативных.
Первичная настройка занимает 5–10 минут. Дальше запуск почти мгновенный. Поддерживаются популярные дистрибутивы Linux, установка — одной командой
📁 Language: #Python 86.6%
⭐️ Stars: 1.2k
➡️ Cсылка на GitHub
📱 @git_developer
Работая в Linux, иногда приходится запускать Windows-софт. Виртуальная машина слишком тяжёлая, Wine не всегда справляется с совместимостью.
Нашёл open-source проект WinPodX — он позволяет запускать Windows-приложения прямо в Linux: нажал на иконку и работаешь.
Например, .docx файл открывается сразу в Word. Есть двусторонний буфер обмена, звук, принтеры, можно пробрасывать USB-устройства в Windows.
Внутри поднимается Windows-контейнер. Приложения рендерятся по отдельности через remote app подход и выглядят как обычные Linux-окна — со своими иконками, закреплением в панели задач и переключением как у нативных.
Первичная настройка занимает 5–10 минут. Дальше запуск почти мгновенный. Поддерживаются популярные дистрибутивы Linux, установка — одной командой
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔12👍1
open-mmlab/Amphion
Набор готовых ИИ-моделей для работы с речью — превращает текст в голос, меняет голос одного человека на другой. Открытый код, готовые модели для скачивания, не нужно обучать с нуля.
📁 Language: #Python 50.6%
⭐️ Stars: 9.9k
➡️ Cсылка на GitHub
📱 @git_developer
Набор готовых ИИ-моделей для работы с речью — превращает текст в голос, меняет голос одного человека на другой. Открытый код, готовые модели для скачивания, не нужно обучать с нуля.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍7
paper-craft-skills
Опубликован open-source проект paper-craft-skills, который одной командой преобразует arXiv-ссылку или PDF в визуальные материалы: блок-схемы методов, презентации или глубокие пояснительные статьи.
Инструмент предлагает три режима: paper-comic генерирует метод-схемы уровня публикации, paper-deck создаёт слайды в академическом, деловом или hand-drawn стиле, а paper-analyzer ищет open-source реализации на GitHub и пишет статьи с посимвольным разбором формул.
Каждый слайд имеет независимый промпт для генерации — правки вносятся точечно без пересборки всей презентации. Проект доступен на GitHub.
📁 Language: #Python 100.0%
⭐️ Stars: 591
➡️ Cсылка на GitHub
📱 @git_developer
Опубликован open-source проект paper-craft-skills, который одной командой преобразует arXiv-ссылку или PDF в визуальные материалы: блок-схемы методов, презентации или глубокие пояснительные статьи.
Инструмент предлагает три режима: paper-comic генерирует метод-схемы уровня публикации, paper-deck создаёт слайды в академическом, деловом или hand-drawn стиле, а paper-analyzer ищет open-source реализации на GitHub и пишет статьи с посимвольным разбором формул.
Каждый слайд имеет независимый промпт для генерации — правки вносятся точечно без пересборки всей презентации. Проект доступен на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🏆1