PaddleOCR-VL-1.5.
Только что Baidu мощно опенсорснули новое поколение модели для парсинга документов: PaddleOCR-VL-1.5.
Всего 0.9B параметров, и она заняла первое место в глобальном рейтинге OmniDocBench V1.5. По совокупной производительности обходит Gemini-3-Pro, DeepSeek-OCR-2 и GPT-5.2.
В повседневной работе и жизни фото контрактов или счетов, снятые на телефон, часто получаются с перекосом, изгибом или деформацией.
Если распознавать такое классическими OCR-инструментами, нередко бывает пропуск контента или вообще полный провал распознавания.
С PaddleOCR-VL-1.5 эти проблемы решаются.
Это первая в мире OCR-модель, которая поддерживает “позиционирование по нестандартным рамкам”. Она точно распознаёт трапециевидные, сложенные, изогнутые и другие нерегулярные формы документов.
Даже если документ смяли или он сильно исказился из-за угла съёмки, модель может восстановить структуру таблиц и текста “ячейка за ячейкой” с точностью, близкой к сканеру.
Плюс добавили распознавание печатей и автосклейку таблиц, которые идут на нескольких страницах. Ещё отдельно прокачали редкие иероглифы, древние тексты и 109 языков, чтобы заметно повысить стабильность в сложных рабочих сценариях.
За последние полгода OCR-гонка реально стала очень жёсткой: крупные компании активно выкатывают новые модели и пытаются занять нишу документ-парсинга.
А релиз Baidu PaddleOCR-VL-1.5 попал ровно в боль разработчиков: распознавание “нестандартных документов”, которые обычно хуже всего даются.
То есть OCR перестаёт быть штукой только для идеальных сканов и начинает нормально работать в сложных бизнес-сценариях.
Сейчас веса модели полностью открыты. Разработчики могут скачать или протестировать онлайн на Hugging Face.
Онлайн демо, Скачать модель
📁 Language: #Python 76.3%
⭐️ Stars: 61.9k
➡️ Cсылка на GitHub
📱 @git_developer
Только что Baidu мощно опенсорснули новое поколение модели для парсинга документов: PaddleOCR-VL-1.5.
Всего 0.9B параметров, и она заняла первое место в глобальном рейтинге OmniDocBench V1.5. По совокупной производительности обходит Gemini-3-Pro, DeepSeek-OCR-2 и GPT-5.2.
В повседневной работе и жизни фото контрактов или счетов, снятые на телефон, часто получаются с перекосом, изгибом или деформацией.
Если распознавать такое классическими OCR-инструментами, нередко бывает пропуск контента или вообще полный провал распознавания.
С PaddleOCR-VL-1.5 эти проблемы решаются.
Это первая в мире OCR-модель, которая поддерживает “позиционирование по нестандартным рамкам”. Она точно распознаёт трапециевидные, сложенные, изогнутые и другие нерегулярные формы документов.
Даже если документ смяли или он сильно исказился из-за угла съёмки, модель может восстановить структуру таблиц и текста “ячейка за ячейкой” с точностью, близкой к сканеру.
Плюс добавили распознавание печатей и автосклейку таблиц, которые идут на нескольких страницах. Ещё отдельно прокачали редкие иероглифы, древние тексты и 109 языков, чтобы заметно повысить стабильность в сложных рабочих сценариях.
За последние полгода OCR-гонка реально стала очень жёсткой: крупные компании активно выкатывают новые модели и пытаются занять нишу документ-парсинга.
А релиз Baidu PaddleOCR-VL-1.5 попал ровно в боль разработчиков: распознавание “нестандартных документов”, которые обычно хуже всего даются.
То есть OCR перестаёт быть штукой только для идеальных сканов и начинает нормально работать в сложных бизнес-сценариях.
Сейчас веса модели полностью открыты. Разработчики могут скачать или протестировать онлайн на Hugging Face.
Онлайн демо, Скачать модель
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤1🔥1
Web-ScreenRec
Запрос на запись экрана это частая история, но большинство рекордеров надо ставить, а если пересел на другое устройство, снова всё ставить и настраивать, что бесит.
Случайно нашёл на GitHub опенсорсный Web ScreenRec: запись прямо в браузере, без установки софта.
Сделано на веб-технологиях: открыл страницу и сразу можно писать. Поддерживает одновременную запись экрана, микрофона и системного аудио.
После записи можно в один клик прогнать через FFmpeg и конвертнуть в MP4, чтобы дальше было удобно монтировать и шарить.
Проект можно деплоить через Docker, либо просто клонировать и открыть локально в браузере. Кроссплатформенно, и на другой комп переехал без повторной конфигурации.
📁 Language: #JavaScript 57.0%
⭐️ Stars: 42
➡️ Cсылка на GitHub
📱 @git_developer
Запрос на запись экрана это частая история, но большинство рекордеров надо ставить, а если пересел на другое устройство, снова всё ставить и настраивать, что бесит.
Случайно нашёл на GitHub опенсорсный Web ScreenRec: запись прямо в браузере, без установки софта.
Сделано на веб-технологиях: открыл страницу и сразу можно писать. Поддерживает одновременную запись экрана, микрофона и системного аудио.
После записи можно в один клик прогнать через FFmpeg и конвертнуть в MP4, чтобы дальше было удобно монтировать и шарить.
Проект можно деплоить через Docker, либо просто клонировать и открыть локально в браузере. Кроссплатформенно, и на другой комп переехал без повторной конфигурации.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍1
На Stepik вышел курс «Linux с нуля»
Этот курс закрывает всю обязательную Linux-базу для работы в IT: от установки Linux и работы с файлами до сетей, прав, дисков, процессов, автоматизации на Bash и многого другого. Всё сразу закрепляется на практике (200+ заданий с автопроверкой)
Материал подаётся понятным языком, шаг за шагом, на реальных примерах и с наглядными схемами
После прохождения вы получите сертификат, который можно добавить в резюме.
Есть бесплатные демо-уроки для ознакомления. В ближайшие 24ч курс доступен со скидкой 25% по промокоду «
Этот курс закрывает всю обязательную Linux-базу для работы в IT: от установки Linux и работы с файлами до сетей, прав, дисков, процессов, автоматизации на Bash и многого другого. Всё сразу закрепляется на практике (200+ заданий с автопроверкой)
Материал подаётся понятным языком, шаг за шагом, на реальных примерах и с наглядными схемами
После прохождения вы получите сертификат, который можно добавить в резюме.
Есть бесплатные демо-уроки для ознакомления. В ближайшие 24ч курс доступен со скидкой 25% по промокоду «
GITHUB»: открыть курс на Stepik❤7😁2💊1
Docspell
Домашние счета, квитанции и договоры всё копятся и копятся. Даже если всё отсканировать в электронный вид, найти нужный документ потом бывает мучением: приходится долго листать, а теги и заметки вручную проставлять лень.
На GitHub нашёл Docspell, опенсорсную систему управления документами, заточенную под личное и семейное использование. Она умеет автоматически распознавать содержимое документов и умно ставить теги.
В основе библиотека NLP от Стэнфорда: система через машинное обучение подхватывает закономерности из твоих текущих документов и начинает сама предлагать теги, вытаскивать даты, угадывать контрагента, плюс умеет OCR, чтобы распознавать текст.
Есть полнотекстовый поиск, интеграция с почтой (можно импортировать документы прямо из email), Android-приложение для загрузки файлов с телефона. Также поддерживаются кастомные поля, массовое редактирование, дашборды и другие полезные штуки.
Разворачивается одной командой через Docker, плюс есть пакет для Debian и модуль для NixOS. По сути, тремя командами можно поднять локально, и данные полностью остаются под твоим контролем.
📁 Language: #Elm 47.2%, #Scala 44.2%
⭐️ Stars: 2.1k
➡️ Cсылка на GitHub
📱 @git_developer
Домашние счета, квитанции и договоры всё копятся и копятся. Даже если всё отсканировать в электронный вид, найти нужный документ потом бывает мучением: приходится долго листать, а теги и заметки вручную проставлять лень.
На GitHub нашёл Docspell, опенсорсную систему управления документами, заточенную под личное и семейное использование. Она умеет автоматически распознавать содержимое документов и умно ставить теги.
В основе библиотека NLP от Стэнфорда: система через машинное обучение подхватывает закономерности из твоих текущих документов и начинает сама предлагать теги, вытаскивать даты, угадывать контрагента, плюс умеет OCR, чтобы распознавать текст.
Есть полнотекстовый поиск, интеграция с почтой (можно импортировать документы прямо из email), Android-приложение для загрузки файлов с телефона. Также поддерживаются кастомные поля, массовое редактирование, дашборды и другие полезные штуки.
Разворачивается одной командой через Docker, плюс есть пакет для Debian и модуль для NixOS. По сути, тремя командами можно поднять локально, и данные полностью остаются под твоим контролем.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Search by Image
В сети часто бывает так: увидел картинку и хочешь понять, откуда она, или найти такой же товар. А вручную делать скриншот, потом заливать в поиск по картинке это долго, плюс легко накосячить.
Можно попробовать браузерное расширение Search by Image. Оно поддерживает больше 30 движков для поиска по картинкам, и позволяет делать обратный поиск прямо через правый клик по изображению.
Есть несколько режимов поиска: искать картинку на странице, загружать локальный файл, выделять область на странице, а ещё оно умеет работать с картинками на приватных сайтах.
В настройках можно самому выбрать нужные поисковики и расставить их по приоритету: Google, Bing, Yandex и любые другие, даже менее популярные, запускаются в один клик.
Работает в Chrome, Firefox, Edge, Safari и других популярных браузерах. Удобно, чтобы проверять подлинность изображений, отслеживать, где разошлась работа, или просто искать похожие товары.
📁 Language: #JavaScript 69.7%
⭐️ Stars: 3.1k
➡️ Cсылка на GitHub
📱 @git_developer
В сети часто бывает так: увидел картинку и хочешь понять, откуда она, или найти такой же товар. А вручную делать скриншот, потом заливать в поиск по картинке это долго, плюс легко накосячить.
Можно попробовать браузерное расширение Search by Image. Оно поддерживает больше 30 движков для поиска по картинкам, и позволяет делать обратный поиск прямо через правый клик по изображению.
Есть несколько режимов поиска: искать картинку на странице, загружать локальный файл, выделять область на странице, а ещё оно умеет работать с картинками на приватных сайтах.
В настройках можно самому выбрать нужные поисковики и расставить их по приоритету: Google, Bing, Yandex и любые другие, даже менее популярные, запускаются в один клик.
Работает в Chrome, Firefox, Edge, Safari и других популярных браузерах. Удобно, чтобы проверять подлинность изображений, отслеживать, где разошлась работа, или просто искать похожие товары.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2
awesome-os-setup
Каждый раз, когда меняешь комп или переустанавливаешь систему, самое больное это поднимать dev-окружение с нуля. Поставить софт, настроить терминал, поправить конфиги, и вот уже улетело полдня.
На GitHub нашелся open-source проект awesome-os-setup, который пытается закрыть проблему кроссплатформенной настройки окружения одной автоматизированной схемой.
Суть в том, что у них есть TUI-инструмент (терминальный интерфейс) на Python, который единообразно управляет настройками системы на Windows, macOS и Linux.
Можно описать список пакетов одним YAML-файлом, а дальше он сам дернет нужный пакетный менеджер:
Есть “one-liner” скрипты установки под разные ОС: запускаешь, попадаешь в визуальное меню, где можно и софт пачкой поставить, и настроить WSL2, и тайлинговый оконный менеджер.
Плюс, там даже встроен вариант кастомизации Windows Terminal: автоматом настраиваются шрифты и цветовая схема, что зайдет тем, кто хочет и быстро, и красиво.
📁 Language: #Python 45.2%
⭐️ Stars: 291
➡️ Cсылка на GitHub
📱 @git_developer
Каждый раз, когда меняешь комп или переустанавливаешь систему, самое больное это поднимать dev-окружение с нуля. Поставить софт, настроить терминал, поправить конфиги, и вот уже улетело полдня.
На GitHub нашелся open-source проект awesome-os-setup, который пытается закрыть проблему кроссплатформенной настройки окружения одной автоматизированной схемой.
Суть в том, что у них есть TUI-инструмент (терминальный интерфейс) на Python, который единообразно управляет настройками системы на Windows, macOS и Linux.
Можно описать список пакетов одним YAML-файлом, а дальше он сам дернет нужный пакетный менеджер:
winget, apt, brew или yay, без ручного ввода команд по одному.Есть “one-liner” скрипты установки под разные ОС: запускаешь, попадаешь в визуальное меню, где можно и софт пачкой поставить, и настроить WSL2, и тайлинговый оконный менеджер.
Плюс, там даже встроен вариант кастомизации Windows Terminal: автоматом настраиваются шрифты и цветовая схема, что зайдет тем, кто хочет и быстро, и красиво.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍4
KeepTrack
Когда смотришь на звездное небо, сложно представить, что над головой на самом деле “плавает” десятки тысяч рукотворных объектов: от спутников до космического мусора, и там уже довольно тесно.
Мне всегда было интересно увидеть это наглядно и понять траектории орбит, а обычные 2D-карты чаще всего такого не дают.
В итоге на GitHub откопал опенсорсный проект KeepTrack, который прямо в браузере превращает всё это в профессиональную 3D-лабу по орбитальной механике.
За счет WebGL он может в реальном времени трекать больше 50 000 спутников, а еще на 60 fps симулировать до 2,5 млн фрагментов космического мусора. Выглядит очень мощно.
Есть фича “машина времени”: можно откатываться в прошлое или смотреть прогноз орбит на будущее, плюс проверять покрытие сенсоров и потенциальные предупреждения о столкновениях.
Проект написан на TypeScript, основной пакет всего 5 МБ, поэтому грузится быстро, ничего ставить не надо. Можно запускать офлайн без интернета, что классно для приватности.
Если ты любишь астрономию или тебе нужны жесткие наглядные материалы для научпопа, точно стоит кинуть в закладки.
📁 Language: TypeScript 93.6%
⭐️ Stars: 1.3k
➡️ Cсылка на GitHub
📱 @git_developer
Когда смотришь на звездное небо, сложно представить, что над головой на самом деле “плавает” десятки тысяч рукотворных объектов: от спутников до космического мусора, и там уже довольно тесно.
Мне всегда было интересно увидеть это наглядно и понять траектории орбит, а обычные 2D-карты чаще всего такого не дают.
В итоге на GitHub откопал опенсорсный проект KeepTrack, который прямо в браузере превращает всё это в профессиональную 3D-лабу по орбитальной механике.
За счет WebGL он может в реальном времени трекать больше 50 000 спутников, а еще на 60 fps симулировать до 2,5 млн фрагментов космического мусора. Выглядит очень мощно.
Есть фича “машина времени”: можно откатываться в прошлое или смотреть прогноз орбит на будущее, плюс проверять покрытие сенсоров и потенциальные предупреждения о столкновениях.
Проект написан на TypeScript, основной пакет всего 5 МБ, поэтому грузится быстро, ничего ставить не надо. Можно запускать офлайн без интернета, что классно для приватности.
Если ты любишь астрономию или тебе нужны жесткие наглядные материалы для научпопа, точно стоит кинуть в закладки.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
awesome-openclaw-skills
На GitHub есть аккуратно собранная подборка недавно взлетевших навыков OpenClaw: уже добавлено 700+ полезных команд-плагинов.
Достаточно выполнить одну команду в терминале и дальше ставить и управлять сторонними плагинами и агентами почти как через apt или brew.
Сейчас там уже есть больше десятка категорий: анализ кода, рефакторинг, аудит безопасности, оптимизация производительности, автотесты и т.д.
Внутри также собраны навыки из 30+ областей, включая веб-разработку, браузерную автоматизацию, генерацию изображений, интеграции AI-моделей, управление заметками и разные productivity-инструменты.
⭐️ Stars: 6.2k
➡️ Cсылка на GitHub
📱 @git_developer
На GitHub есть аккуратно собранная подборка недавно взлетевших навыков OpenClaw: уже добавлено 700+ полезных команд-плагинов.
Достаточно выполнить одну команду в терминале и дальше ставить и управлять сторонними плагинами и агентами почти как через apt или brew.
Сейчас там уже есть больше десятка категорий: анализ кода, рефакторинг, аудит безопасности, оптимизация производительности, автотесты и т.д.
Внутри также собраны навыки из 30+ областей, включая веб-разработку, браузерную автоматизацию, генерацию изображений, интеграции AI-моделей, управление заметками и разные productivity-инструменты.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1