GitHub Разработчика

Curses

Стримишь или записываешь видео и хочешь реальные субтитры в реальном времени, чтобы зрителям было проще, но у большинства тулов стили однотипные и почти не настраиваются.

Недавно нашел на GitHub опенсорсный инструмент Curses. Он заточен под субтитры speech-to-text для OBS, VRChat, Twitch и Discord, и при этом дает очень много кастомизации.

Поддерживает разные движки распознавания: Microsoft Azure, Speechly, Deepgram и встроенный браузерный WebSpeechAPI. Плюс умеет в обратную сторону, текст-в-речь, чтобы выводить озвучку.

Оформление субтитров можно докрутить по-взрослому: цвета, шрифты, тени, фоновые текстуры, анимация печати, звуки, частицы, и даже CSS. Можно тянуть тысячи бесплатных шрифтов прямо из Google Fonts.

Еще умеет брать источник из Twitch-чата: отображает эмодзи 7TV/FFZ/BTTV, а результаты распознавания можно отправлять обратно в Twitch-чат или в канал Discord.

Есть система сцен: сохраняешь несколько пресетов дизайна и при переключении сцен в OBS стили субтитров переключаются автоматически. Через плагин obs-websocket можно настроить OBS “в один клик”.

📁 Language: #TypeScript 85.9%

⭐️ Stars: 652

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6💊1

1.4K views06:07

GitHub Разработчика

plexe

Чтобы натренировать ML-модель, обычно надо шарить в алгоритмах, писать код и бесконечно тюнить гиперпараметры. Для большинства это входной барьер, который сразу отбивает желание.

На GitHub есть Plexe, опенсорсный проект, который сильно снижает порог: ты описываешь задачу обычным языком, а он автоматически собирает машинное обучение под это.

Достаточно по-человечески объяснить, что именно хочешь предсказать, какие данные на входе и что должно быть на выходе. Дальше система через связку нескольких агентов сама проходит весь пайплайн: анализ данных, план решения, генерация кода, тесты и оценка качества.

Поддерживает разных провайдеров LLM: OpenAI, Anthropic, Ollama и другие. Плюс умеет автоматически выводить структуру данных или даже генерировать синтетический датасет.

Еще внутри есть распределенное обучение на Ray: можно параллельно прогонять несколько вариантов моделей и сильно ускоряться.

Если тебе нужно быстро проверить ML-идею или дать возможность строить модели не технарям, штука выглядит реально полезной.

📁 Language: #Python 92.0%

⭐️ Stars: 2.3k

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥3

1.2K views16:07

GitHub Разработчика

ai-data-science-team

Когда делаешь проекты по Data Science, львиная доля времени обычно уходит на чистку данных и однотипный код для графиков, а на реальный тюнинг моделей сил остается совсем мало.

Случайно наткнулся на GitHub на проект ai-data-science-team, который по сути собирает тебе универсальную виртуальную команду дата-сайентистов.

Он дает визуальный workflow-инструмент: через интерфейс и в связке с AI можно прогнать весь пайплайн от загрузки данных, очистки и EDA до моделинга.

Внутри несколько специализированных агентов, которые делят работу и берут на себя рутину: автоматом разбираются с пропусками, генерят код для feature engineering, а также могут напрямую дергать H2O и MLflow для обучения и оценки моделей.

Можно подключить OpenAI или локальные модели через Ollama, так что с приватностью данных проще, и все это сделано на Streamlit, в Python ставится и запускается довольно быстро.

Проект сейчас активно пилится и обновляется, так что подойдет тем, кто хочет отдать муторную предобработку AI и больше фокусироваться на бизнес-логике.

📁 Language: #Python 100.0%

⭐️ Stars: 4.6k

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍2

814 views06:07

About

Blog

Apps

Platform