GitHub Разработчика
17.2K subscribers
611 photos
351 videos
2 files
952 links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
PaddleOCR-VL-1.5.

Только что Baidu мощно опенсорснули новое поколение модели для парсинга документов: PaddleOCR-VL-1.5.

Всего 0.9B параметров, и она заняла первое место в глобальном рейтинге OmniDocBench V1.5. По совокупной производительности обходит Gemini-3-Pro, DeepSeek-OCR-2 и GPT-5.2.

В повседневной работе и жизни фото контрактов или счетов, снятые на телефон, часто получаются с перекосом, изгибом или деформацией.

Если распознавать такое классическими OCR-инструментами, нередко бывает пропуск контента или вообще полный провал распознавания.

С PaddleOCR-VL-1.5 эти проблемы решаются.

Это первая в мире OCR-модель, которая поддерживает “позиционирование по нестандартным рамкам”. Она точно распознаёт трапециевидные, сложенные, изогнутые и другие нерегулярные формы документов.

Даже если документ смяли или он сильно исказился из-за угла съёмки, модель может восстановить структуру таблиц и текста “ячейка за ячейкой” с точностью, близкой к сканеру.

Плюс добавили распознавание печатей и автосклейку таблиц, которые идут на нескольких страницах. Ещё отдельно прокачали редкие иероглифы, древние тексты и 109 языков, чтобы заметно повысить стабильность в сложных рабочих сценариях.

За последние полгода OCR-гонка реально стала очень жёсткой: крупные компании активно выкатывают новые модели и пытаются занять нишу документ-парсинга.

А релиз Baidu PaddleOCR-VL-1.5 попал ровно в боль разработчиков: распознавание “нестандартных документов”, которые обычно хуже всего даются.

То есть OCR перестаёт быть штукой только для идеальных сканов и начинает нормально работать в сложных бизнес-сценариях.

Сейчас веса модели полностью открыты. Разработчики могут скачать или протестировать онлайн на Hugging Face.

Онлайн демо, Скачать модель

📁 Language: #Python 76.3%

⭐️ Stars: 61.9k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
Web-ScreenRec

Запрос на запись экрана это частая история, но большинство рекордеров надо ставить, а если пересел на другое устройство, снова всё ставить и настраивать, что бесит.

Случайно нашёл на GitHub опенсорсный Web ScreenRec: запись прямо в браузере, без установки софта.

Сделано на веб-технологиях: открыл страницу и сразу можно писать. Поддерживает одновременную запись экрана, микрофона и системного аудио.

После записи можно в один клик прогнать через FFmpeg и конвертнуть в MP4, чтобы дальше было удобно монтировать и шарить.

Проект можно деплоить через Docker, либо просто клонировать и открыть локально в браузере. Кроссплатформенно, и на другой комп переехал без повторной конфигурации.

📁 Language: #JavaScript 57.0%

⭐️ Stars: 42

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍1
Docspell

Домашние счета, квитанции и договоры всё копятся и копятся. Даже если всё отсканировать в электронный вид, найти нужный документ потом бывает мучением: приходится долго листать, а теги и заметки вручную проставлять лень.

На GitHub нашёл Docspell, опенсорсную систему управления документами, заточенную под личное и семейное использование. Она умеет автоматически распознавать содержимое документов и умно ставить теги.

В основе библиотека NLP от Стэнфорда: система через машинное обучение подхватывает закономерности из твоих текущих документов и начинает сама предлагать теги, вытаскивать даты, угадывать контрагента, плюс умеет OCR, чтобы распознавать текст.

Есть полнотекстовый поиск, интеграция с почтой (можно импортировать документы прямо из email), Android-приложение для загрузки файлов с телефона. Также поддерживаются кастомные поля, массовое редактирование, дашборды и другие полезные штуки.

Разворачивается одной командой через Docker, плюс есть пакет для Debian и модуль для NixOS. По сути, тремя командами можно поднять локально, и данные полностью остаются под твоим контролем.

📁 Language: #Elm 47.2%, #Scala 44.2%

⭐️ Stars: 2.1k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Search by Image

В сети часто бывает так: увидел картинку и хочешь понять, откуда она, или найти такой же товар. А вручную делать скриншот, потом заливать в поиск по картинке это долго, плюс легко накосячить.

Можно попробовать браузерное расширение Search by Image. Оно поддерживает больше 30 движков для поиска по картинкам, и позволяет делать обратный поиск прямо через правый клик по изображению.

Есть несколько режимов поиска: искать картинку на странице, загружать локальный файл, выделять область на странице, а ещё оно умеет работать с картинками на приватных сайтах.

В настройках можно самому выбрать нужные поисковики и расставить их по приоритету: Google, Bing, Yandex и любые другие, даже менее популярные, запускаются в один клик.

Работает в Chrome, Firefox, Edge, Safari и других популярных браузерах. Удобно, чтобы проверять подлинность изображений, отслеживать, где разошлась работа, или просто искать похожие товары.

📁 Language: #JavaScript 69.7%

⭐️ Stars: 3.1k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2
awesome-os-setup

Каждый раз, когда меняешь комп или переустанавливаешь систему, самое больное это поднимать dev-окружение с нуля. Поставить софт, настроить терминал, поправить конфиги, и вот уже улетело полдня.

На GitHub нашелся open-source проект awesome-os-setup, который пытается закрыть проблему кроссплатформенной настройки окружения одной автоматизированной схемой.

Суть в том, что у них есть TUI-инструмент (терминальный интерфейс) на Python, который единообразно управляет настройками системы на Windows, macOS и Linux.

Можно описать список пакетов одним YAML-файлом, а дальше он сам дернет нужный пакетный менеджер: winget, apt, brew или yay, без ручного ввода команд по одному.

Есть “one-liner” скрипты установки под разные ОС: запускаешь, попадаешь в визуальное меню, где можно и софт пачкой поставить, и настроить WSL2, и тайлинговый оконный менеджер.

Плюс, там даже встроен вариант кастомизации Windows Terminal: автоматом настраиваются шрифты и цветовая схема, что зайдет тем, кто хочет и быстро, и красиво.

📁 Language: #Python 45.2%

⭐️ Stars: 291

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍5
KeepTrack

Когда смотришь на звездное небо, сложно представить, что над головой на самом деле “плавает” десятки тысяч рукотворных объектов: от спутников до космического мусора, и там уже довольно тесно.

Мне всегда было интересно увидеть это наглядно и понять траектории орбит, а обычные 2D-карты чаще всего такого не дают.

В итоге на GitHub откопал опенсорсный проект KeepTrack, который прямо в браузере превращает всё это в профессиональную 3D-лабу по орбитальной механике.

За счет WebGL он может в реальном времени трекать больше 50 000 спутников, а еще на 60 fps симулировать до 2,5 млн фрагментов космического мусора. Выглядит очень мощно.

Есть фича “машина времени”: можно откатываться в прошлое или смотреть прогноз орбит на будущее, плюс проверять покрытие сенсоров и потенциальные предупреждения о столкновениях.

Проект написан на TypeScript, основной пакет всего 5 МБ, поэтому грузится быстро, ничего ставить не надо. Можно запускать офлайн без интернета, что классно для приватности.

Если ты любишь астрономию или тебе нужны жесткие наглядные материалы для научпопа, точно стоит кинуть в закладки.

📁 Language: TypeScript 93.6%

⭐️ Stars: 1.3k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
awesome-openclaw-skills

На GitHub есть аккуратно собранная подборка недавно взлетевших навыков OpenClaw: уже добавлено 700+ полезных команд-плагинов.

Достаточно выполнить одну команду в терминале и дальше ставить и управлять сторонними плагинами и агентами почти как через apt или brew.

Сейчас там уже есть больше десятка категорий: анализ кода, рефакторинг, аудит безопасности, оптимизация производительности, автотесты и т.д.

Внутри также собраны навыки из 30+ областей, включая веб-разработку, браузерную автоматизацию, генерацию изображений, интеграции AI-моделей, управление заметками и разные productivity-инструменты.

⭐️ Stars: 6.2k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥1
beautiful-mermaid

Рисовать блок-схемы и диаграммы последовательностей в Mermaid очень удобно, но дефолтный рендер выглядит так себе, а в терминале это вообще не показать.

На GitHub нашел свежий опенсорсный проект beautiful-mermaid, который как раз решает проблему рендера Mermaid: умеет генерить красивые SVG и выдавать дружелюбную для терминала ASCII-графику.

Сделано на чистом TypeScript, без зависимости от DOM. Поддерживает пять популярных типов диаграмм: flowchart (блок-схемы), state (диаграммы состояний), sequence (последовательности), class (классы) и ER (сущность-связь).

Внутри есть 15 отобранных тем, можно настраивать акцентный цвет, цвет рамок и прочие детали. Плюс можно напрямую использовать палитру любого VS Code-тема.

Еще фишка: все цвета управляются через CSS-переменные, поэтому для переключения темы не нужно перерендеривать диаграмму, достаточно поменять переменные и все обновится сразу.

📁 Language: TypeScript 100.0%

⭐️ Stars: 5.2k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71
difit

Хочешь делать ревью измененного кода, а в терминале сплошная простыня diff: до/после, красно-зеленая каша, глаза быстро устают.

Особенно когда надо “скормить” изменения AI для Review, а ты вручную копируешь и вставляешь контекст. Морока.

Случайно нашел difit, опенсорсный тул, который локально показывает и дает ревьюить git diff в интерфейсе как на GitHub, плюс умеет превращать комментарии прямо в промпт для AI.

Одной командой можно открыть в браузере diff последнего коммита. Поддерживаются разные сценарии: один коммит, сравнение веток, ревью GitHub PR и т.д.

Внутри есть система комментариев: можно оставлять замечания на любой строке кода, а еще генерировать формат AI-подсказки с контекстом, чтобы сразу “кормить” AI и просить поправить код.

Есть подсветка синтаксиса для 30+ языков. Комментарии сохраняются локально в браузере, так что можно вернуться и продолжить ревью позже.

Такой подход, где “локальный code review” и “вопросы к AI” сшиты вместе без лишних движений, отлично заходит тем, кто привык кодить с AI-помощником.

📁 Language: TypeScript 93.7%

⭐️ Stars: 1.9k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
This media is not supported in your browser
VIEW IN TELEGRAM
Latitude

Разрабатывая AI-приложения, самое больное часто не сам код, а то, что после релиза все превращается в ....

Обычно непонятно, почему модель вдруг начинает нести ерунду, и страшно трогать prompt: починишь одно, а вылезут еще три новых бага.

Случайно наткнулся на Latitude, это опенсорсная платформа “про инженерку” для продакшена.

Фишка в сквозной наблюдаемости: можно в реальном времени видеть реальные пользовательские запросы, ответы модели и расход токенов с ценой.

Есть версионирование промптов и песочница. Поймал bad case, сразу воспроизвел и отдебажил, а не гадаешь на кофейной гуще.

Добавили Evals: оценка через AI-скоринг или ручную разметку, чтобы собрать автоматическую регрессию и не ломать все при правках.

Поддерживается приватное развертывание, данные остаются у тебя. Это важно для команд с требованиями по приватности.

Если хочется поднять AI-приложение с уровня “ну вроде работает” до “работает стабильно и предсказуемо”, это прям хороший вариант, который стоит поковырять.

📁 Language: TypeScript 93.6%

⭐️ Stars: 1.3k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
glide-data-grid

На веб-странице при отображении больших объёмов данных стандартные таблицы часто начинают тормозить — при росте количества строк падает FPS, скролл становится дерганым.

Недавно на GitHub наткнулся на Glide Data Grid — open-source компонент таблицы, рендерящий через Canvas, способный плавно работать с миллионами строк.

Он использует рендеринг по требованию: отрисовываются только видимые ячейки, скролл нативный, благодаря чему прокрутка очень плавная. Поддерживает разные типы ячеек и встроенное редактирование.

Функционал: перетаскивание и изменение ширины колонок, настраиваемая высота строк, объединение ячеек, выбор строк/столбцов/ячейки (одиночный и множественный). Полная кастомизация рендеринга ячеек через Canvas — можно рисовать что угодно.

Есть встроенный поиск (поддержка замороженных колонок), совместимость с React 16–19. Если нужно показывать большие данные с плавным UX, этот компонент определённо стоит попробовать.

📁 Language: TypeScript 99.3%

⭐️ Stars: 5k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1