GitHub Разработчика – Telegram

GitHub Разработчика

17K subscribers

842 photos

376 videos

2 files

1.25K links

Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP

Download Telegram

About

Blog

Apps

Platform

GitHub Разработчика

17K subscribers

GitHub Разработчика

DocStrange

Когда делаешь RAG или “скармливаешь” ИИ свои материалы, самая больная тема это таблицы внутри PDF и картинок. Текст из них вытаскивается криво: формат плывет, особенно на сложных макетах, и в таком виде это почти невозможно нормально использовать.

На GitHub как раз нашелся опенсорсный проект DocStrange, который целится ровно в эту проблему: превращать документы в данные без боли.

Он умеет довольно точно конвертировать разные форматы в то, что любят большие модели: Markdown или структурированный JSON.

Поддерживаются PDF, изображения, офисные документы и даже ссылки на веб-страницы. В основе OCR плюс анализ верстки, то есть он не просто распознает текст, а пытается понять структуру документа.

Фишка в том, что он может восстанавливать сложные таблицы, а еще по заданным полям или Schema сразу вытаскивать структурированный JSON.

Есть готовый локальный веб-интерфейс: закинул файл drag-and-drop и получил результат. Плюс поддерживается локальное ускорение на GPU, все крутится у тебя на машине, данные никуда не уезжают, с приватностью спокойнее.

Лучше всего зайдет тем, кто собирает RAG-базу знаний или кому нужно пачками разбирать сканы, счета, инвойсы и другой неструктурированный хлам.

📁 Language: #Python 85.4%

⭐️ Stars: 1.3k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤1

2.72K views06:07

GitHub Разработчика

PDF3MD

Когда работаешь с PDF и хочешь перегнать его в Markdown для нормального редактирования или выгрузить в Word, часто упираешься в то, что инструменты либо слишком примитивные, либо замороченные.

Случайно наткнулся на PDF3MD, опенсорсный тул, который специально конвертит PDF в Markdown и Word. Интерфейс простой, все делается интуитивно.

Сделан на React (фронт) и Flask (бэк). Просто перетаскиваешь PDF в окно, видишь прогресс конвертации в реальном времени, а после завершения можешь сразу скопировать Markdown или скачать Word-документ.

Поддерживает пакетную загрузку нескольких PDF одновременно: показывает для каждого файла исходное имя, размер, количество страниц и таймстамп конвертации.

Есть быстрый деплой через Docker: одной командой запускаешь локально, либо можно повесить за reverse proxy и развернуть на сервере.

📁 Language: #JavaScript 42.6%

⭐️ Stars: 241

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7

2.93K views09:28

GitHub Разработчика

Curses

Стримишь или записываешь видео и хочешь реальные субтитры в реальном времени, чтобы зрителям было проще, но у большинства тулов стили однотипные и почти не настраиваются.

Недавно нашел на GitHub опенсорсный инструмент Curses. Он заточен под субтитры speech-to-text для OBS, VRChat, Twitch и Discord, и при этом дает очень много кастомизации.

Поддерживает разные движки распознавания: Microsoft Azure, Speechly, Deepgram и встроенный браузерный WebSpeechAPI. Плюс умеет в обратную сторону, текст-в-речь, чтобы выводить озвучку.

Оформление субтитров можно докрутить по-взрослому: цвета, шрифты, тени, фоновые текстуры, анимация печати, звуки, частицы, и даже CSS. Можно тянуть тысячи бесплатных шрифтов прямо из Google Fonts.

Еще умеет брать источник из Twitch-чата: отображает эмодзи 7TV/FFZ/BTTV, а результаты распознавания можно отправлять обратно в Twitch-чат или в канал Discord.

Есть система сцен: сохраняешь несколько пресетов дизайна и при переключении сцен в OBS стили субтитров переключаются автоматически. Через плагин obs-websocket можно настроить OBS “в один клик”.

📁 Language: #TypeScript 85.9%

⭐️ Stars: 652

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8💊1

2.76K views06:07

GitHub Разработчика

plexe

Чтобы натренировать ML-модель, обычно надо шарить в алгоритмах, писать код и бесконечно тюнить гиперпараметры. Для большинства это входной барьер, который сразу отбивает желание.

На GitHub есть Plexe, опенсорсный проект, который сильно снижает порог: ты описываешь задачу обычным языком, а он автоматически собирает машинное обучение под это.

Достаточно по-человечески объяснить, что именно хочешь предсказать, какие данные на входе и что должно быть на выходе. Дальше система через связку нескольких агентов сама проходит весь пайплайн: анализ данных, план решения, генерация кода, тесты и оценка качества.

Поддерживает разных провайдеров LLM: OpenAI, Anthropic, Ollama и другие. Плюс умеет автоматически выводить структуру данных или даже генерировать синтетический датасет.

Еще внутри есть распределенное обучение на Ray: можно параллельно прогонять несколько вариантов моделей и сильно ускоряться.

Если тебе нужно быстро проверить ML-идею или дать возможность строить модели не технарям, штука выглядит реально полезной.

📁 Language: #Python 92.0%

⭐️ Stars: 2.3k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤3🔥3

2.94K views16:07

GitHub Разработчика

ai-data-science-team

Когда делаешь проекты по Data Science, львиная доля времени обычно уходит на чистку данных и однотипный код для графиков, а на реальный тюнинг моделей сил остается совсем мало.

Случайно наткнулся на GitHub на проект ai-data-science-team, который по сути собирает тебе универсальную виртуальную команду дата-сайентистов.

Он дает визуальный workflow-инструмент: через интерфейс и в связке с AI можно прогнать весь пайплайн от загрузки данных, очистки и EDA до моделинга.

Внутри несколько специализированных агентов, которые делят работу и берут на себя рутину: автоматом разбираются с пропусками, генерят код для feature engineering, а также могут напрямую дергать H2O и MLflow для обучения и оценки моделей.

Можно подключить OpenAI или локальные модели через Ollama, так что с приватностью данных проще, и все это сделано на Streamlit, в Python ставится и запускается довольно быстро.

Проект сейчас активно пилится и обновляется, так что подойдет тем, кто хочет отдать муторную предобработку AI и больше фокусироваться на бизнес-логике.

📁 Language: #Python 100.0%

⭐️ Stars: 4.6k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍4

3.24K views06:07

GitHub Разработчика

PaddleOCR-VL-1.5.

Только что Baidu мощно опенсорснули новое поколение модели для парсинга документов: PaddleOCR-VL-1.5.

Всего 0.9B параметров, и она заняла первое место в глобальном рейтинге OmniDocBench V1.5. По совокупной производительности обходит Gemini-3-Pro, DeepSeek-OCR-2 и GPT-5.2.

В повседневной работе и жизни фото контрактов или счетов, снятые на телефон, часто получаются с перекосом, изгибом или деформацией.

Если распознавать такое классическими OCR-инструментами, нередко бывает пропуск контента или вообще полный провал распознавания.

С PaddleOCR-VL-1.5 эти проблемы решаются.

Это первая в мире OCR-модель, которая поддерживает “позиционирование по нестандартным рамкам”. Она точно распознаёт трапециевидные, сложенные, изогнутые и другие нерегулярные формы документов.

Даже если документ смяли или он сильно исказился из-за угла съёмки, модель может восстановить структуру таблиц и текста “ячейка за ячейкой” с точностью, близкой к сканеру.

Плюс добавили распознавание печатей и автосклейку таблиц, которые идут на нескольких страницах. Ещё отдельно прокачали редкие иероглифы, древние тексты и 109 языков, чтобы заметно повысить стабильность в сложных рабочих сценариях.

За последние полгода OCR-гонка реально стала очень жёсткой: крупные компании активно выкатывают новые модели и пытаются занять нишу документ-парсинга.

А релиз Baidu PaddleOCR-VL-1.5 попал ровно в боль разработчиков: распознавание “нестандартных документов”, которые обычно хуже всего даются.

То есть OCR перестаёт быть штукой только для идеальных сканов и начинает нормально работать в сложных бизнес-сценариях.

Сейчас веса модели полностью открыты. Разработчики могут скачать или протестировать онлайн на Hugging Face.

Онлайн демо, Скачать модель

📁 Language: #Python 76.3%

⭐️ Stars: 61.9k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤2🔥1

2.97K views16:07

GitHub Разработчика

Web-ScreenRec

Запрос на запись экрана это частая история, но большинство рекордеров надо ставить, а если пересел на другое устройство, снова всё ставить и настраивать, что бесит.

Случайно нашёл на GitHub опенсорсный Web ScreenRec: запись прямо в браузере, без установки софта.

Сделано на веб-технологиях: открыл страницу и сразу можно писать. Поддерживает одновременную запись экрана, микрофона и системного аудио.

После записи можно в один клик прогнать через FFmpeg и конвертнуть в MP4, чтобы дальше было удобно монтировать и шарить.

Проект можно деплоить через Docker, либо просто клонировать и открыть локально в браузере. Кроссплатформенно, и на другой комп переехал без повторной конфигурации.

📁 Language: #JavaScript 57.0%

⭐️ Stars: 42

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍1

2.81K views06:07

GitHub Разработчика

Docspell

Домашние счета, квитанции и договоры всё копятся и копятся. Даже если всё отсканировать в электронный вид, найти нужный документ потом бывает мучением: приходится долго листать, а теги и заметки вручную проставлять лень.

На GitHub нашёл Docspell, опенсорсную систему управления документами, заточенную под личное и семейное использование. Она умеет автоматически распознавать содержимое документов и умно ставить теги.

В основе библиотека NLP от Стэнфорда: система через машинное обучение подхватывает закономерности из твоих текущих документов и начинает сама предлагать теги, вытаскивать даты, угадывать контрагента, плюс умеет OCR, чтобы распознавать текст.

Есть полнотекстовый поиск, интеграция с почтой (можно импортировать документы прямо из email), Android-приложение для загрузки файлов с телефона. Также поддерживаются кастомные поля, массовое редактирование, дашборды и другие полезные штуки.

Разворачивается одной командой через Docker, плюс есть пакет для Debian и модуль для NixOS. По сути, тремя командами можно поднять локально, и данные полностью остаются под твоим контролем.

📁 Language: #Elm 47.2%, #Scala 44.2%

⭐️ Stars: 2.1k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

3.08K views10:17

GitHub Разработчика

Search by Image

В сети часто бывает так: увидел картинку и хочешь понять, откуда она, или найти такой же товар. А вручную делать скриншот, потом заливать в поиск по картинке это долго, плюс легко накосячить.

Можно попробовать браузерное расширение Search by Image. Оно поддерживает больше 30 движков для поиска по картинкам, и позволяет делать обратный поиск прямо через правый клик по изображению.

Есть несколько режимов поиска: искать картинку на странице, загружать локальный файл, выделять область на странице, а ещё оно умеет работать с картинками на приватных сайтах.

В настройках можно самому выбрать нужные поисковики и расставить их по приоритету: Google, Bing, Yandex и любые другие, даже менее популярные, запускаются в один клик.

Работает в Chrome, Firefox, Edge, Safari и других популярных браузерах. Удобно, чтобы проверять подлинность изображений, отслеживать, где разошлась работа, или просто искать похожие товары.

📁 Language: #JavaScript 69.7%

⭐️ Stars: 3.1k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2

2.91K views06:07

GitHub Разработчика

awesome-os-setup

Каждый раз, когда меняешь комп или переустанавливаешь систему, самое больное это поднимать dev-окружение с нуля. Поставить софт, настроить терминал, поправить конфиги, и вот уже улетело полдня.

На GitHub нашелся open-source проект awesome-os-setup, который пытается закрыть проблему кроссплатформенной настройки окружения одной автоматизированной схемой.

Суть в том, что у них есть TUI-инструмент (терминальный интерфейс) на Python, который единообразно управляет настройками системы на Windows, macOS и Linux.

Можно описать список пакетов одним YAML-файлом, а дальше он сам дернет нужный пакетный менеджер: winget, apt, brew или yay, без ручного ввода команд по одному.

Есть “one-liner” скрипты установки под разные ОС: запускаешь, попадаешь в визуальное меню, где можно и софт пачкой поставить, и настроить WSL2, и тайлинговый оконный менеджер.

Плюс, там даже встроен вариант кастомизации Windows Terminal: автоматом настраиваются шрифты и цветовая схема, что зайдет тем, кто хочет и быстро, и красиво.

📁 Language: #Python 45.2%

⭐️ Stars: 291

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6👍6

3.07K views16:07

GitHub Разработчика

KeepTrack

Когда смотришь на звездное небо, сложно представить, что над головой на самом деле “плавает” десятки тысяч рукотворных объектов: от спутников до космического мусора, и там уже довольно тесно.

Мне всегда было интересно увидеть это наглядно и понять траектории орбит, а обычные 2D-карты чаще всего такого не дают.

В итоге на GitHub откопал опенсорсный проект KeepTrack, который прямо в браузере превращает всё это в профессиональную 3D-лабу по орбитальной механике.

За счет WebGL он может в реальном времени трекать больше 50 000 спутников, а еще на 60 fps симулировать до 2,5 млн фрагментов космического мусора. Выглядит очень мощно.

Есть фича “машина времени”: можно откатываться в прошлое или смотреть прогноз орбит на будущее, плюс проверять покрытие сенсоров и потенциальные предупреждения о столкновениях.

Проект написан на TypeScript, основной пакет всего 5 МБ, поэтому грузится быстро, ничего ставить не надо. Можно запускать офлайн без интернета, что классно для приватности.

Если ты любишь астрономию или тебе нужны жесткие наглядные материалы для научпопа, точно стоит кинуть в закладки.

📁 Language: #TypeScript 93.6%

⭐️ Stars: 1.3k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8

2.86K viewsedited 06:07

GitHub Разработчика

awesome-openclaw-skills

На GitHub есть аккуратно собранная подборка недавно взлетевших навыков OpenClaw: уже добавлено 700+ полезных команд-плагинов.

Достаточно выполнить одну команду в терминале и дальше ставить и управлять сторонними плагинами и агентами почти как через apt или brew.

Сейчас там уже есть больше десятка категорий: анализ кода, рефакторинг, аудит безопасности, оптимизация производительности, автотесты и т.д.

Внутри также собраны навыки из 30+ областей, включая веб-разработку, браузерную автоматизацию, генерацию изображений, интеграции AI-моделей, управление заметками и разные productivity-инструменты.

⭐️ Stars: 6.2k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥2

3.12K views16:07

GitHub Разработчика

beautiful-mermaid

Рисовать блок-схемы и диаграммы последовательностей в Mermaid очень удобно, но дефолтный рендер выглядит так себе, а в терминале это вообще не показать.

На GitHub нашел свежий опенсорсный проект beautiful-mermaid, который как раз решает проблему рендера Mermaid: умеет генерить красивые SVG и выдавать дружелюбную для терминала ASCII-графику.

Сделано на чистом TypeScript, без зависимости от DOM. Поддерживает пять популярных типов диаграмм: flowchart (блок-схемы), state (диаграммы состояний), sequence (последовательности), class (классы) и ER (сущность-связь).

Внутри есть 15 отобранных тем, можно настраивать акцентный цвет, цвет рамок и прочие детали. Плюс можно напрямую использовать палитру любого VS Code-тема.

Еще фишка: все цвета управляются через CSS-переменные, поэтому для переключения темы не нужно перерендеривать диаграмму, достаточно поменять переменные и все обновится сразу.

📁 Language: #TypeScript 100.0%

⭐️ Stars: 5.2k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤1

3.1K viewsedited 06:07

GitHub Разработчика

difit

Хочешь делать ревью измененного кода, а в терминале сплошная простыня diff: до/после, красно-зеленая каша, глаза быстро устают.

Особенно когда надо “скормить” изменения AI для Review, а ты вручную копируешь и вставляешь контекст. Морока.

Случайно нашел difit, опенсорсный тул, который локально показывает и дает ревьюить git diff в интерфейсе как на GitHub, плюс умеет превращать комментарии прямо в промпт для AI.

Одной командой можно открыть в браузере diff последнего коммита. Поддерживаются разные сценарии: один коммит, сравнение веток, ревью GitHub PR и т.д.

Внутри есть система комментариев: можно оставлять замечания на любой строке кода, а еще генерировать формат AI-подсказки с контекстом, чтобы сразу “кормить” AI и просить поправить код.

Есть подсветка синтаксиса для 30+ языков. Комментарии сохраняются локально в браузере, так что можно вернуться и продолжить ревью позже.

Такой подход, где “локальный code review” и “вопросы к AI” сшиты вместе без лишних движений, отлично заходит тем, кто привык кодить с AI-помощником.

📁 Language: #TypeScript 93.7%

⭐️ Stars: 1.9k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍4🔥2

2.9K viewsedited 16:07

GitHub Разработчика

This media is not supported in your browser

VIEW IN TELEGRAM

Latitude

Разрабатывая AI-приложения, самое больное часто не сам код, а то, что после релиза все превращается в ....

Обычно непонятно, почему модель вдруг начинает нести ерунду, и страшно трогать prompt: починишь одно, а вылезут еще три новых бага.

Случайно наткнулся на Latitude, это опенсорсная платформа “про инженерку” для продакшена.

Фишка в сквозной наблюдаемости: можно в реальном времени видеть реальные пользовательские запросы, ответы модели и расход токенов с ценой.

Есть версионирование промптов и песочница. Поймал bad case, сразу воспроизвел и отдебажил, а не гадаешь на кофейной гуще.

Добавили Evals: оценка через AI-скоринг или ручную разметку, чтобы собрать автоматическую регрессию и не ломать все при правках.

Поддерживается приватное развертывание, данные остаются у тебя. Это важно для команд с требованиями по приватности.

Если хочется поднять AI-приложение с уровня “ну вроде работает” до “работает стабильно и предсказуемо”, это прям хороший вариант, который стоит поковырять.

📁 Language: #TypeScript 93.6%

⭐️ Stars: 1.3k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍3

2.88K viewsedited 06:07

GitHub Разработчика

glide-data-grid

На веб-странице при отображении больших объёмов данных стандартные таблицы часто начинают тормозить — при росте количества строк падает FPS, скролл становится дерганым.

Недавно на GitHub наткнулся на Glide Data Grid — open-source компонент таблицы, рендерящий через Canvas, способный плавно работать с миллионами строк.

Он использует рендеринг по требованию: отрисовываются только видимые ячейки, скролл нативный, благодаря чему прокрутка очень плавная. Поддерживает разные типы ячеек и встроенное редактирование.

Функционал: перетаскивание и изменение ширины колонок, настраиваемая высота строк, объединение ячеек, выбор строк/столбцов/ячейки (одиночный и множественный). Полная кастомизация рендеринга ячеек через Canvas — можно рисовать что угодно.

Есть встроенный поиск (поддержка замороженных колонок), совместимость с React 16–19. Если нужно показывать большие данные с плавным UX, этот компонент определённо стоит попробовать.

📁 Language: #TypeScript 99.3%

⭐️ Stars: 5k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

2.78K viewsedited 16:07

GitHub Разработчика

PipesHub

На работе важные данные разбросаны по разным сервисам — Google Drive, Slack, Jira, Confluence и так далее. Каждый раз, чтобы найти нужный документ, приходится копаться во всём по отдельности, что сильно тормозит работу.

На GitHub нашёл PipesHub — open-source AI-платформу для поиска, которая умеет собирать разбросанные данные в одном месте и позволяет быстро находить нужную информацию с помощью естественного языка.

Использует граф знаний и технологии ранжирования страниц, поэтому выдаёт не только релевантные результаты, но и помечает источник информации — поиск прозрачный и объяснимый.

Поддерживаются интеграции с Google Workspace, Microsoft 365, Slack, Jira, Notion, GitHub и ещё 27 популярными приложениями. Работает с PDF, Office-документами, изображениями, аудио и видео.

Помимо поиска есть no-code интерфейс для создания кастомных приложений и агентов. Поддерживается реальное или плановое индексирование, при этом соблюдаются все права доступа исходных систем, чтобы данные оставались безопасными.

Развернуть можно через Docker Compose, работает как локально, так и в облаке. Для облачной версии нужно настроить HTTPS-сертификат.

📁 Language: #Python 61.4%

⭐️ Stars: 2.6k

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4💊2

2.74K viewsedited 06:07

GitHub Разработчика

vibe

Сейчас AI-агенты всё лучше пишут код, но запускать их напрямую на локалке всегда немного тревожно.

Особенно в режиме автозапуска — страшно, что AI случайно удалит важные файлы или получит доступ к приватным данным.

Недавно на GitHub наткнулся на Vibe — open source проект для macOS, который поднимает сверхбыструю Linux-виртуалку в песочнице.

Главные плюсы: нулевая конфигурация, изоляция за <10 секунд, можно спокойно «запереть» AI в клетку.

Поддерживается точный контроль доступа к файлам: AI видит только текущий проект, а все остальные чувствительные каталоги полностью изолированы.

Написан на Rust, использует родную виртуализацию Apple, безопаснее Docker и при этом почти не грузит ресурсы.

Если часто юзаешь Claude Code и подобные кодогенераторы, но не хочешь ломать локальную среду — лёгкий и надёжный вариант.

📁 Language: #Rust 95.8%

⭐️ Stars: 518

➡️

Cсылка на GitHub

📱

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍4😁1💊1

2.8K views16:07