NoLanguageLeftWaiting
Если хочется делать стриминговый перевод для трансляций или прям настоящий синхрон, быстро упираешься в тупняк классических офлайн-моделей: они часто ждут, пока человек договорит фразу целиком, и из-за этого появляется заметная задержка.
На GitHub нашелся опенсорсный проект NoLanguageLeftWaiting. Ребята взяли офлайн-переводчик Meta NLLB и переделали его в режим реального синхронного перевода: модель может переводить на лету, не дожидаясь конца предложения.
Плюс они закрывают типичные боли “псевдо-синхрона”: когда пунктуация вставляется криво, а работа с префиксами и контекстом превращается в кашу.
Что по возможностям:
* перевод между ~200 языками
* два варианта бэкенда: HuggingFace и CTranslate2
* внутри сразу два размера модели: 600M и 1.3B
Сейчас они ещё пилят speculative decoding (спекулятивное декодирование), чтобы ускорить вывод. Идея: часть гипотез быстро “пробрасывать” и потом частично валидировать, чтобы не тормозить на каждом шаге. По их замерам валидация занимает примерно 0.15 секунды.
Если делаешь голосовой перевод, субтитры для стрима или любой кросс-языковой созвон, где задержка решает, проект прям стоит потыкать.
📁 Language: #Python 100.0%
⭐️ Stars: 41
➡️ Cсылка на GitHub
📱 @git_developer
Если хочется делать стриминговый перевод для трансляций или прям настоящий синхрон, быстро упираешься в тупняк классических офлайн-моделей: они часто ждут, пока человек договорит фразу целиком, и из-за этого появляется заметная задержка.
На GitHub нашелся опенсорсный проект NoLanguageLeftWaiting. Ребята взяли офлайн-переводчик Meta NLLB и переделали его в режим реального синхронного перевода: модель может переводить на лету, не дожидаясь конца предложения.
Плюс они закрывают типичные боли “псевдо-синхрона”: когда пунктуация вставляется криво, а работа с префиксами и контекстом превращается в кашу.
Что по возможностям:
* перевод между ~200 языками
* два варианта бэкенда: HuggingFace и CTranslate2
* внутри сразу два размера модели: 600M и 1.3B
Сейчас они ещё пилят speculative decoding (спекулятивное декодирование), чтобы ускорить вывод. Идея: часть гипотез быстро “пробрасывать” и потом частично валидировать, чтобы не тормозить на каждом шаге. По их замерам валидация занимает примерно 0.15 секунды.
Если делаешь голосовой перевод, субтитры для стрима или любой кросс-языковой созвон, где задержка решает, проект прям стоит потыкать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍1
local_ai_ocr
Если нужно вытаскивать текст из документов или PDF, загружать файлы в онлайн-конвертеры всегда как-то стрёмно. А у многих локальных тулов то распознавание так себе, то форматирование превращается в кашу.
Случайно наткнулся на GitHub на open-source проект local_ai_ocr: он собран на модели DeepSeek-OCR и заточен под локальное офлайн-распознавание текста на Windows.
Он умеет с GPU-ускорением обрабатывать картинки и PDF: не просто точно вытягивает текст, но и может сразу экспортировать в Markdown, чтобы сохранить сложные таблицы и верстку.
Работает полностью офлайн: ничего не нужно отправлять в облако. Скачал, распаковал, запустил init-скрипт и можно пользоваться, без сложной настройки окружения.
Если для тебя критична приватность данных или нужна максимально точная “реконструкция” форматирования документа, штука точно стоит того, чтобы попробовать.
📁 Language: #Python 67%
⭐️ Stars: 493
➡️ Cсылка на GitHub
📱 @git_developer
Если нужно вытаскивать текст из документов или PDF, загружать файлы в онлайн-конвертеры всегда как-то стрёмно. А у многих локальных тулов то распознавание так себе, то форматирование превращается в кашу.
Случайно наткнулся на GitHub на open-source проект local_ai_ocr: он собран на модели DeepSeek-OCR и заточен под локальное офлайн-распознавание текста на Windows.
Он умеет с GPU-ускорением обрабатывать картинки и PDF: не просто точно вытягивает текст, но и может сразу экспортировать в Markdown, чтобы сохранить сложные таблицы и верстку.
Работает полностью офлайн: ничего не нужно отправлять в облако. Скачал, распаковал, запустил init-скрипт и можно пользоваться, без сложной настройки окружения.
Если для тебя критична приватность данных или нужна максимально точная “реконструкция” форматирования документа, штука точно стоит того, чтобы попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍2
Neoflow
Когда команда устраивает брейншторм или рисует схемки, за нормальные коммерческие whiteboard-инструменты приходится платить, а бесплатные обычно душат лимитами и пользоваться ими бесит.
На GitHub как раз попался Neoflow — опенсорсный whiteboard, который полностью бесплатный и при этом не урезанный. Заточен под простую коллаборацию.
Собран на базе tldraw, поэтому интерфейс приятный и лёгкий. Есть realtime совместное редактирование — несколько человек могут двигать блоки одновременно без лагов.
Плюс завезли AI-фичи, которые реально помогают в работе — авто-организация канваса, распознавание фигур и прочие полезные штуки.
Лицензия MIT. Можно поднять локально через Docker или npm — без танцев и без привязки к SaaS.
Подходит дизайнерам для набросков и идей, а дев-команде — для обсуждения архитектур и процессов. Хорошая альтернатива коммерческим whiteboard-сервисам.
📁 Language: #JavaScript 87.1%
⭐️ Stars: 142
➡️ Cсылка на GitHub
📱 @git_developer
Когда команда устраивает брейншторм или рисует схемки, за нормальные коммерческие whiteboard-инструменты приходится платить, а бесплатные обычно душат лимитами и пользоваться ими бесит.
На GitHub как раз попался Neoflow — опенсорсный whiteboard, который полностью бесплатный и при этом не урезанный. Заточен под простую коллаборацию.
Собран на базе tldraw, поэтому интерфейс приятный и лёгкий. Есть realtime совместное редактирование — несколько человек могут двигать блоки одновременно без лагов.
Плюс завезли AI-фичи, которые реально помогают в работе — авто-организация канваса, распознавание фигур и прочие полезные штуки.
Лицензия MIT. Можно поднять локально через Docker или npm — без танцев и без привязки к SaaS.
Подходит дизайнерам для набросков и идей, а дев-команде — для обсуждения архитектур и процессов. Хорошая альтернатива коммерческим whiteboard-сервисам.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤4
This media is not supported in your browser
VIEW IN TELEGRAM
json-render
Идея про AI-генерацию UI сейчас реально меняется. Команда Vercel Labs недавно выложила в опенсорс json-render и по сути ломает старые правила.
Вместо привычной (и часто нестабильной) генерации кода они предлагают новый пайплайн: AI → JSON → UI. За какие-то три дня проект собрал 6000+ звезд.
Ключевая мысль: не давать AI “свободно творить”, а заставить работать внутри “ограждений”, чтобы на выходе были полностью предсказуемые структурированные данные.
Тебе нужно лишь описать библиотеку компонентов в нужной директории, а дальше AI заполняет данные. Так можно практически полностью убрать галлюцинации.
Это не только лечит вечную проблему “поплыл стиль”, но и дает стриминговый рендер с задержками на уровне миллисекунд, скорость там прям безумная.
Если хочешь собирать “абсолютно контролируемый” генеративный интерфейс, эту фронтенд-библиотеку точно стоит покопать.
📁 Language: #TypeScript 98.1%
⭐️ Stars: 6.7k
➡️ Cсылка на GitHub
📱 @git_developer
Идея про AI-генерацию UI сейчас реально меняется. Команда Vercel Labs недавно выложила в опенсорс json-render и по сути ломает старые правила.
Вместо привычной (и часто нестабильной) генерации кода они предлагают новый пайплайн: AI → JSON → UI. За какие-то три дня проект собрал 6000+ звезд.
Ключевая мысль: не давать AI “свободно творить”, а заставить работать внутри “ограждений”, чтобы на выходе были полностью предсказуемые структурированные данные.
Тебе нужно лишь описать библиотеку компонентов в нужной директории, а дальше AI заполняет данные. Так можно практически полностью убрать галлюцинации.
Это не только лечит вечную проблему “поплыл стиль”, но и дает стриминговый рендер с задержками на уровне миллисекунд, скорость там прям безумная.
Если хочешь собирать “абсолютно контролируемый” генеративный интерфейс, эту фронтенд-библиотеку точно стоит покопать.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1
web-check
Чтобы нормально разобрать техархитектуру сайта, его security-настройки и потенциальные риски, вручную проверять DNS, SSL, инфу по серверу и т.д. обычно значит открыть кучу разных тулзов. Это реально неудобно.
Случайно наткнулся на Web-Check, опенсорс-проект: на одной странице можно прогнать десятки проверок по сайту, от IP-информации до security-конфига, всё видно сразу.
Он делает и браузерные, и серверные проверки. Вводишь домен, и дальше автоматически запускаются: поиск IP, разбор цепочки SSL-сертификатов, парсинг DNS-записей, проверка cookie, анализ HTTP-заголовков и ещё больше 30 разных тестов.
Помимо базового определения техстека, геолокации/размещения сервера и скана портов, он умеет проверять DNSSEC, тип фаервола, безопасность TLS-наборов шифров и даже считать углеродный след сайта. Плюс есть полезные штуки вроде превью со скриншотом, поиска по историческим снапшотам, глобального рейтинга и т.п.
Проект поддерживает деплой одной командой через Docker, а ещё его можно задеплоить на Netlify или Vercel. Если нужно глубже понять архитектуру сайта или сделать security-оценку, инструмент точно стоит сохранить.
📁 Language: #TypeScript 65.5%
⭐️ Stars: 30.3k
➡️ Cсылка на GitHub
📱 @git_developer
Чтобы нормально разобрать техархитектуру сайта, его security-настройки и потенциальные риски, вручную проверять DNS, SSL, инфу по серверу и т.д. обычно значит открыть кучу разных тулзов. Это реально неудобно.
Случайно наткнулся на Web-Check, опенсорс-проект: на одной странице можно прогнать десятки проверок по сайту, от IP-информации до security-конфига, всё видно сразу.
Он делает и браузерные, и серверные проверки. Вводишь домен, и дальше автоматически запускаются: поиск IP, разбор цепочки SSL-сертификатов, парсинг DNS-записей, проверка cookie, анализ HTTP-заголовков и ещё больше 30 разных тестов.
Помимо базового определения техстека, геолокации/размещения сервера и скана портов, он умеет проверять DNSSEC, тип фаервола, безопасность TLS-наборов шифров и даже считать углеродный след сайта. Плюс есть полезные штуки вроде превью со скриншотом, поиска по историческим снапшотам, глобального рейтинга и т.п.
Проект поддерживает деплой одной командой через Docker, а ещё его можно задеплоить на Netlify или Vercel. Если нужно глубже понять архитектуру сайта или сделать security-оценку, инструмент точно стоит сохранить.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Держи сотни гигабайт свежих уроков, и каждую неделю мы подкидываем ещё!
• 1612 ГБ — DevOps
• 1402 ГБ — Python
• 1300 ГБ — C, C++
• 1815 ГБ — Frontend
• 1515 ГБ — Backend
• 898 ГБ — ИБ, Хакинг
• 996 ГБ — Kotlin, Swift
• 212 ГБ — JavaScript
• 315 ГБ — Flutter
• 820 ГБ — Go, PHP
• 419 ГБ — Java, Rust
• 648 ГБ — GameDev
• 517 ГБ — Windows, Linux
• 998 ГБ — Дизайн (UX/UI)
• 617 ГБ — Нейросети (ML/RL)
• 546 ГБ — БД (SQL & NoSQL)
• 687 ГБ — Аналитика данных
• 115 ГБ — QA-тестирование
Подписывайся и не плати за то, что можно получить бесплатно
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1