GitHub Разработчика
17K subscribers
474 photos
331 videos
2 files
800 links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
Varia

Часто приходится использовать разные инструменты для загрузок: обычные файлы через браузер, торренты через отдельный клиент, а для видео вообще отдельный софт. Довольно неудобно.

К счастью, нашёл Varia — open source менеджер загрузок, который объединяет файлы, торренты и видеопотоки в одном интерфейсе.

Он поддерживает не только обычные файлы и BT-загрузки, но и умеет напрямую скачивать видео и аудио с популярных платформ. Есть даже расширения для браузеров, позволяющие в один клик отправлять загрузку в приложение.

Основные возможности:

🔸Единое управление всеми задачами загрузки: файлы, торренты, видеопотоки и т.д.
🔸Поддержка скачивания и конвертации аудио/видео с популярных видеосервисов.
🔸Расширения для Firefox и Chrome — отправляйте загрузки одним кликом.
🔸Основан на aria2 и yt-dlp, что гарантирует стабильность и совместимость.
🔸Поддержка автоматического выключения ПК после завершения загрузок и других удобных функций.

Доступны готовые установочные пакеты для Windows и Linux — можно попробовать прямо сейчас.

📁 Language: #Python 92.5%

⭐️ Stars: 993

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍4
This media is not supported in your browser
VIEW IN TELEGRAM
NeuTTS Air

NeuTTS Air — сверхреалистичный AI-голос на локальной машине

Нужен реалистичный AI-голос без онлайн API и рисков утечки данных? NeuTTS Air — открытая бесплатная модель всего 0,5B параметров, работает прямо на ПК, телефоне или Raspberry Pi.

Особенности:

🔸Голос почти как у человека;
🔸Клонирование голоса по 3 секундам аудио;
🔸Полностью локально — приватность под контролем;
🔸Лёгкая и быстрая генерация даже на средних устройствах;
🔸Встроенные водяные знаки для отслеживаемости аудио.

📁 Language: #Python 100.0%

⭐️ Stars: 2.1k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥5👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Computer Use Preview

Google открыла Computer Use Preview — инструмент для браузерной автоматизации на базе Gemini 2.5

Google выложила в открытый доступ Computer Use Preview — ИИ-инструмент, который управляет браузером по описанию на естественном языке. Он может сам искать, кликать, заполнять формы и выполнять сложные сценарии без кода.

Работает на Playwright и Browserbase, поддерживает скриншоты, подсветку курсора и интеграцию с Gemini API и Vertex AI.

📁 Language: #Python 100.0%

⭐️ Stars: 931

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍3
LeetGPU Challenges

LeetCode для GPU-разработчиков

Если хочешь прокачать навыки GPU-программирования не только по теории, но и на практике — зацени LeetGPU Challenges.

Это подборка задач разной сложности с подробными описаниями, тестами и шаблонами под разные GPU-фреймворки.

📁 Language: #Python 72.1%

⭐️ Stars: 170

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
PaddleOCR

Совсем недавно Baidu выложила в открытый доступ свою самую мощную мультимодальную модель для понимания документов — PaddleOCR-VL.

При размере всего 0,9 млрд параметров она побила рекорд OmniBenchDoc, заняв первое место в мире и показав SOTA по всем четырем основным метрикам, обойдя такие модели, как GPT-4o, Gemini-2.5 Pro, MinerU2.5 и dots.ocr.

Почему это важно

В эпоху ИИ ценность структурированных данных из документов очевидна, но качество распознавания у разных OCR-инструментов сильно разнится.
Многие документы содержат сложные таблицы, формулы или много­колоночные макеты, и традиционные OCR-модели часто выдают мусор, который потом приходится вручную править.
PaddleOCR-VL решает эту проблему кардинально.

Что умеет модель

Это самый мощный производный вариант Wenxin 4.5.
Она набрала 92.6 балла в глобальном тесте OmniDocBench v1.5, заняв 1-е место по совокупной производительности.
Скорость инференса выросла на 14,2% по сравнению с MinerU2.5 и на 253,01% по сравнению с dots.ocr.

Но это не просто OCR, который извлекает текст. Модель реально понимает структуру документа.
Научные статьи, газеты с несколькими колонками, техотчеты — всё это она разбирает корректно, восстанавливая правильный порядок контента.

Что можно извлекать

Модель точно парсит таблицы, математические формулы, рукописные заметки, данные из графиков и диаграмм, конвертируя всё это в готовые к использованию структурированные данные.

Поддерживается 109 языков, включая китайский, английский, французский, японский, русский, арабский, испанский и другие.
Это сильно прокачивает возможности модели при работе с многоязычными документами.

Модель уже выложена в open source, поддерживает несколько вариантов деплоя и доступна для тестирования прямо на HuggingFace.

📁 Language: #Python 77.0%

⭐️ Stars: 57.5k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3