GitHub Разработчика
17.3K subscribers
540 photos
347 videos
2 files
881 links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
cocoindex

При разработке RAG-приложений или сборке базы знаний самая больная часть обычно не выбор модели, а дата-пайплайн.

Нужно писать кучу Python-скриптов для очистки данных, чанкинга и векторизации. А как только меняется исходный датасет, приходится гонять полный пересчёт — долго и дорого.

Недавно на GitHub попался CocoIndex — опенсорсный высокопроизводительный фреймворк для трансформации данных, заточенный под AI-сценарии.

Примерно в 100 строках Python можно описать весь процесс: чтение файлов, разбиение на чанки и загрузку эмбеддингов в векторное хранилище.

Поддерживаются разные источники и приёмники данных: локальные файлы, Amazon S3, Google Drive, а также векторные БД вроде Postgres, Qdrant и LanceDB.

Кроме этого, внутри уже есть готовые компоненты для текстового чанкинга, генерации эмбеддингов, парсинга PDF, построения графов знаний и других типовых трансформаций.

В проекте много примеров — больше 20 реальных кейсов: семантический поиск, графы знаний, рекомендации товаров, поиск по изображениям и т.д. Можно брать и использовать как есть.

📁 Language: #Rust 77.4%

⭐️ Stars: 4.6k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
XL Converter

При работе с фотками и изображениями постоянно всплывают две боли: файлы слишком тяжёлые и формат не поддерживается. Найти инструмент, который умеет сжимать без потери качества, на практике не так просто.

На GitHub как раз попался открытый проект XL Converter. В одном интерфейсе он закрывает конвертацию между разными форматами изображений.

Поддерживается взаимное преобразование между JPEG XL, AVIF, WebP, JPEG, PNG и другими форматами. Есть параллельная обработка, так что можно гонять сразу пачку файлов.

Также есть поддержка lossless-транскодинга JPEG: размер JPEG-файлов уменьшается примерно на 16–22% без потери качества, и процесс полностью обратимый.

Помимо конвертации форматов, есть ресайз изображений. Можно менять размер по разрешению, в процентах или по минимальной стороне.

Доступны сборки под Windows и Linux, всё работает из коробки. Если часто приходится массово перегонять картинки между форматами, инструмент точно стоит посмотреть.

📁 Language: #Python 94.6%

⭐️ Stars: 399

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Docus

Писать техдоку в Markdown просто, но когда дело доходит до нормального сайта с документацией, начинается боль. Хочется, чтобы было красиво, с поиском, мультиязычностью, тёмной темой и без ручной сборки всего стека.

На GitHub как раз нашёлся открытый фреймворк Docus, который решает эту задачу. Одна команда — и у тебя готовый, функциональный сайт документации.

Он построен на Nuxt 4 и из коробки даёт адаптивную вёрстку, тёмный режим, полнотекстовый поиск и i18n. Плюс можно прямо в Markdown использовать Vue-компоненты, без костылей.

Внутри уже всё собрано: Nuxt Content для управления контентом, Nuxt UI как компонентная база, Tailwind CSS для стилей, плюс встроенная оптимизация изображений.

Структура проекта понятная и чистая: контент лежит в папке content, свои компоненты и страницы добавляются напрямую. Не нужно с нуля настраивать весь тулчейн — можно сразу писать документацию и расширять проект по мере необходимости.

📁 Language: #TypeScript 54.3%

⭐️ Stars: 2.4k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍21
Serie

Смотреть историю коммитов Git в терминале то еще удовольствие: вывод git log --graph с его символами читается тяжело, а при большом количестве веток вообще превращается в кашу.

Недавно на GitHub попался открытый проект Serie, который прямо в терминале рисует аккуратную и наглядную визуализацию истории коммитов. По ощущениям почти как GUI-инструменты.

Он использует протоколы отображения изображений в терминальных эмуляторах и рендерит граф коммитов как картинки. Поддерживаются протоколы iTerm2 и Kitty, при этом в WezTerm, Ghostty и других терминалах все работает плавно.

Помимо базового просмотра истории, есть поиск и фильтрация, просмотр списков ссылок, кастомные команды вывода (например, вызов difft для просмотра diff), а также куча горячих клавиш и настроек.

Если хочется прокачать Git-логи в терминале с уровня «ну, терпимо» до «удобно и приятно», инструмент точно стоит попробовать.

📁 Language: #Rust 100.0%

⭐️ Stars: 1.5k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Агентный RAG для чайников

Если хочешь собрать рабочую RAG-систему, то большинство гайдов в интернете заканчиваются на самом базовом "retrieval + generation". Как только появляется многотуровый диалог или более сложная логика, качество ответов часто становится просто ужасным.

На GitHub нашел проект Агентный RAG для чайников. Не ведись на слово "для чайников" в названии: по сути это продакшен-уровневое решение agentic RAG, собранное на LangGraph.

Там добавлены память диалога и иерархическая индексация: сначала точный поиск по маленьким чанкам, потом подтягивание больших чанков как полноценного контекста. Это неплохо лечит проблему, когда модель выдирает фразы без нормального окружения.

Поддерживается параллельная работа нескольких агентов для разруливания сложных запросов. Если инструкция расплывчатая, система может сама переспросить, чтобы уточнить намерение, вместо того чтобы уверенно галлюцинировать.

Еще внутри есть Gradio-интерфейс: управление документами, сохранение диалогов, ручное вмешательство (human-in-the-loop) и прочее. Плюс дается полный гайд по конвертации PDF в Markdown, с инструментами и сравнением вариантов.

Есть быстрый деплой через Docker и подробные Notebook-уроки, так что локально поднять все довольно легко. Если хочешь апгрейднуть базовый RAG до уровня продакшена или ищешь кастомизируемую схему умного поиска, проект стоит попробовать.

📁 Language: #Python 32.1%

⭐️ Stars: 1.2k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3
OSINT Framework.

Если нужно глубже копнуть по какому-то объекту в интернете, просто хаотично гонять запросы в поисковике — так себе идея. Получается медленно, а инфа в итоге кусками и без структуры.

Наткнулся на GitHub на классический проект OSINT Framework. Это по сути большая шпаргалка по сбору открытой разведданной (OSINT).

Там собраны куча бесплатных тулов и сервисов. Всё разложено как майнд-мапа: юзернеймы, почты, домены, IP, соцсети и так далее — удобно ориентироваться по категориям.

Есть онлайн-версия, ничего ставить не нужно. Просто кликаешь по нужной ветке и смотришь список инструментов по теме. Быстро и наглядно.

Изначально делали под инфобез, но и для обычного бэкграунд-чека или сбора данных по человеку/компании это вполне годный справочник.

📁 Language: #JavaScript 61.4%

⭐️ Stars: 10.3k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
5🤔2
PDF Document Layout Analysis

Когда возишься с PDF и нужно точно определить, где заголовок, где таблица, где картинка, большинство инструментов либо мажут мимо, либо перегружены до абсурда.

Нашёл на GitHub проект PDF Document Layout Analysis. Это опенсорс, заточенный под разбор сложной структуры документов.

Он различает больше 11 типов элементов: заголовки, основной текст, таблицы, формулы, изображения и так далее. Плюс сам выстраивает корректный порядок чтения.

Есть экспорт в Markdown и HTML. OCR завёрнут через Tesseract, из коробки поддерживается 150+ языков.

Помимо этого, встроен автоперевод — можно выгнать документ сразу в другую языковую версию, сохранив формат и структуру.

Для работы есть визуальный Web UI, а ещё доступен REST API. Весь стек можно поднять локально через Docker одной командой.

📁 Language: #Python 89.2%

⭐️ Stars: 1k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍2
This media is not supported in your browser
VIEW IN TELEGRAM
На Stepik вышел курс по Linux

Внутри 20+ модулей: от установки Linux и работы с файлами до сетей, прав, дисков, процессов, автоматизации на Bash и многого другого. Всё сразу закрепляется на практике (200+ заданий с автопроверкой)

Материал подаётся понятным языком, шаг за шагом, на реальных примерах и с наглядными схемами.

После прохождения вы получите сертификат, который можно добавить в резюме.

Есть бесплатные демо-уроки для ознакомления. В ближайшие 48ч курс доступен со скидкой 25% по промокоду «HNY_LINUX»: открыть курс на Stepik

P.S. Курс можно купить в подарок на Новый год
2💊2👍1🌚1
popcorntime

Сейчас видеоплатформ куча и все вперемешку: чтобы посмотреть один сериал, часто приходится прыгать между несколькими приложениями, а подписки в сумме выходят в приличную сумму.

Недавно на GitHub наткнулся на опенсорс-проект Popcorn Time. Это не просто каталог ссылок, а по сути полностью пересобранная платформа для просмотра контента.

Они каждую неделю выкатывают обновления с актуальными данными по фильмам и сериалам, агрегируют контент, чтобы не бегать и не искать все вручную.

Плюс есть поддержка разных платформ: macOS, Windows, Android, iOS и ТВ-устройства.

Если хочется опенсорс-кинотеатра, который умеет и онлайн-контент смотреть, и локальные файлы нормально менеджить, за проектом стоит последить.

📁 Language: #TypeScript 83.5%

⭐️ Stars: 10.4k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍1💊1
awesome-ai-memory

При разработке AI-агентов самая больная тема это как дать большой модели нормальную "долгую память". На рынке куча вариантов: векторные БД, графовые БД, разные memory-фреймворки. От выбора быстро начинает кипеть голова.

На GitHub попался проект awesome-ai-memory. Это по сути панорама инструментов вокруг AI-памяти, собранная в одном месте.

Инструменты четко разделены на open-source и closed-source, удобно сразу отсеять то, что не хочется тащить в прод по причинам контроля и лицензий.

Есть сравнение по базовой архитектуре хранилища: Graph, Vector или гибрид (и то и другое). Это прям в точку, потому что обычно выбор упирается именно в это.

Дальше все разложено по категориям: memory-компоненты, dev-фреймворки, оптимизаторы и базовые стореджи, чтобы искать не по названию, а по задаче.

Список оформлен таблицей: видно ключевые различия между популярными проектами вроде Cognee, Mem0, Zep и т.д., чтобы не блуждать в выборе инфраструктуры.

Если ты сейчас строишь AI-приложение или копаешь RAG-архитектуру, эту штуку реально стоит сохранить как шпаргалку.

📁 Language: #Python 100%

⭐️ Stars: 434

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64💊1
Ghostty

Все больше людей пересаживается на терминал Ghostty, но настроить его под себя не так-то просто.

Голый текстовый конфиг с кучей параметров: любые правки приходится делать вслепую и каждый раз проверять результат. Довольно муторно.

На GitHub как раз нашёлся полезный тул под названием Ghostty Config, который эту проблему и решает.

Это визуальный генератор конфигов, который позволяет забыть про ручное редактирование конфигурационных файлов.

Он даёт веб-интерфейс, в котором можно наглядно крутить шрифт, цветовую схему, стиль курсора и прозрачность окна.

Самое удобное — справа есть live-превью: сразу видно, как меняются настройки.

Есть онлайн-версия, которой можно пользоваться прямо в браузере, а когда всё настроено — одним кликом экспортировать конфиг.

Также поддерживается локальный деплой: клонируешь репу, поднимаешь у себя, и все данные остаются на твоей машине.

Если ты сейчас ковыряешь Ghostty или просто хочешь освежить тему за счёт новой цветовой схемы, этот инструмент серьёзно экономит время на чтение док и подбор настроек.

📁 Language: #Svelte 53.0%

⭐️ Stars: 2.2k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5💊1
Tabminal

Часто приходится работать вне офиса или прыгать между устройствами. В обычных терминалах сессия закончилась — и все, контекст пропал, дальше работай заново. Неудобно, особенно когда хочешь продолжить с того же места.

На GitHub наткнулся на Tabminal — опенсорс, который переносит терминал в браузер. Сессии хранятся на сервере, так что можно продолжить работу откуда угодно.

Связь держится через WebSocket, есть поддержка сетевого роуминга: можно сменить сеть или обновить страницу, и состояние не потеряется.

Внутри есть AI-помощник, который учитывает текущую директорию, env-переменные и историю команд. Можно задавать вопросы прямо в терминале. Если команда упала, помощник сам разберёт ошибку и подскажет, как починить.

Плюс встроены Monaco Editor и файловый менеджер — можно править файлы на сервере напрямую в браузере. Есть поддержка PWA, можно поставить как приложение на десктоп.

Для мобильных устройств всё адаптировано: есть виртуальная раскладка под HHKB, на iPad или телефоне терминал работает без боли. Полезно тем, кто регулярно работает в движении.

📁 Language: #JavaScript 78.1%

⭐️ Stars: 98

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
1