GitHub Разработчика
17.2K subscribers
599 photos
350 videos
2 files
941 links
Здесь ты найдешь полезные репозитории с GitHub

Связь: @devmangx

РКН: https://clck.ru/3FocDP
Download Telegram
Curses

Стримишь или записываешь видео и хочешь реальные субтитры в реальном времени, чтобы зрителям было проще, но у большинства тулов стили однотипные и почти не настраиваются.

Недавно нашел на GitHub опенсорсный инструмент Curses. Он заточен под субтитры speech-to-text для OBS, VRChat, Twitch и Discord, и при этом дает очень много кастомизации.

Поддерживает разные движки распознавания: Microsoft Azure, Speechly, Deepgram и встроенный браузерный WebSpeechAPI. Плюс умеет в обратную сторону, текст-в-речь, чтобы выводить озвучку.

Оформление субтитров можно докрутить по-взрослому: цвета, шрифты, тени, фоновые текстуры, анимация печати, звуки, частицы, и даже CSS. Можно тянуть тысячи бесплатных шрифтов прямо из Google Fonts.

Еще умеет брать источник из Twitch-чата: отображает эмодзи 7TV/FFZ/BTTV, а результаты распознавания можно отправлять обратно в Twitch-чат или в канал Discord.

Есть система сцен: сохраняешь несколько пресетов дизайна и при переключении сцен в OBS стили субтитров переключаются автоматически. Через плагин obs-websocket можно настроить OBS “в один клик”.

📁 Language: #TypeScript 85.9%

⭐️ Stars: 652

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
6💊1
plexe

Чтобы натренировать ML-модель, обычно надо шарить в алгоритмах, писать код и бесконечно тюнить гиперпараметры. Для большинства это входной барьер, который сразу отбивает желание.

На GitHub есть Plexe, опенсорсный проект, который сильно снижает порог: ты описываешь задачу обычным языком, а он автоматически собирает машинное обучение под это.

Достаточно по-человечески объяснить, что именно хочешь предсказать, какие данные на входе и что должно быть на выходе. Дальше система через связку нескольких агентов сама проходит весь пайплайн: анализ данных, план решения, генерация кода, тесты и оценка качества.

Поддерживает разных провайдеров LLM: OpenAI, Anthropic, Ollama и другие. Плюс умеет автоматически выводить структуру данных или даже генерировать синтетический датасет.

Еще внутри есть распределенное обучение на Ray: можно параллельно прогонять несколько вариантов моделей и сильно ускоряться.

Если тебе нужно быстро проверить ML-идею или дать возможность строить модели не технарям, штука выглядит реально полезной.

📁 Language: #Python 92.0%

⭐️ Stars: 2.3k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥3
ai-data-science-team

Когда делаешь проекты по Data Science, львиная доля времени обычно уходит на чистку данных и однотипный код для графиков, а на реальный тюнинг моделей сил остается совсем мало.

Случайно наткнулся на GitHub на проект ai-data-science-team, который по сути собирает тебе универсальную виртуальную команду дата-сайентистов.

Он дает визуальный workflow-инструмент: через интерфейс и в связке с AI можно прогнать весь пайплайн от загрузки данных, очистки и EDA до моделинга.

Внутри несколько специализированных агентов, которые делят работу и берут на себя рутину: автоматом разбираются с пропусками, генерят код для feature engineering, а также могут напрямую дергать H2O и MLflow для обучения и оценки моделей.

Можно подключить OpenAI или локальные модели через Ollama, так что с приватностью данных проще, и все это сделано на Streamlit, в Python ставится и запускается довольно быстро.

Проект сейчас активно пилится и обновляется, так что подойдет тем, кто хочет отдать муторную предобработку AI и больше фокусироваться на бизнес-логике.

📁 Language: #Python 100.0%

⭐️ Stars: 4.6k

➡️ Cсылка на GitHub

📱 @git_developer
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2