Media is too big
VIEW IN TELEGRAM
OpenContracts
Когда работаешь с юридическими документами и договорами, боль обычно не в самом чтении, а в том, чтобы из сотен и тысяч файлов вытащить ключевую инфу, разметить важные пункты и при этом привести данные к единому формату, чтобы потом нормально анализировать.
Недавно на GitHub попался OpenContracts, опенсорсная платформа для анализа документов, заточенная под knowledge-intensive задачи, чтобы управление документами и извлечение данных было проще и быстрее.
Поддерживает загрузку, разметку и анализ PDF и текстовых документов. Внутри есть плагинный движок парсинга, который может автоматически извлекать признаки лейаута документа и строить векторные эмбеддинги для дальнейшего поиска/ретривала.
Главная фича это пакетное извлечение данных: можно одновременно задавать вопросы по сотням документов и вытаскивать структурированные данные, а результаты сразу подсвечиваются прямо в исходнике. Ещё есть поддержка кастомных схем метаданных, совместной разметки, управления доступами и прочих enterprise-историй.
Платформа построена на фреймворке PydanticAI: там собрана полноценная LLM-система с управлением диалогом и стримингом ответов в реальном времени. Разворачивается быстро через Docker.
Если у тебя много контрактов, юрдоков или другой “тяжёлой” по знаниям документации, и хочется превратить анализ из ручной рутины в более системный воркфлоу, платформу стоит попробовать.
📁 Language: #Python 52.0%
⭐️ Stars: 1.1k
➡️ Cсылка на GitHub
📱 @git_developer
Когда работаешь с юридическими документами и договорами, боль обычно не в самом чтении, а в том, чтобы из сотен и тысяч файлов вытащить ключевую инфу, разметить важные пункты и при этом привести данные к единому формату, чтобы потом нормально анализировать.
Недавно на GitHub попался OpenContracts, опенсорсная платформа для анализа документов, заточенная под knowledge-intensive задачи, чтобы управление документами и извлечение данных было проще и быстрее.
Поддерживает загрузку, разметку и анализ PDF и текстовых документов. Внутри есть плагинный движок парсинга, который может автоматически извлекать признаки лейаута документа и строить векторные эмбеддинги для дальнейшего поиска/ретривала.
Главная фича это пакетное извлечение данных: можно одновременно задавать вопросы по сотням документов и вытаскивать структурированные данные, а результаты сразу подсвечиваются прямо в исходнике. Ещё есть поддержка кастомных схем метаданных, совместной разметки, управления доступами и прочих enterprise-историй.
Платформа построена на фреймворке PydanticAI: там собрана полноценная LLM-система с управлением диалогом и стримингом ответов в реальном времени. Разворачивается быстро через Docker.
Если у тебя много контрактов, юрдоков или другой “тяжёлой” по знаниям документации, и хочется превратить анализ из ручной рутины в более системный воркфлоу, платформу стоит попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
awesome-ai-for-science
В научных исследованиях чаще всего выматывают не сами эксперименты, а бесконечное чтение статей, бесконечная чистка данных и нескончаемые презентации для отчетов.
На GitHub нашлась отличная подборка Awesome AI for Science — это систематизированный список инструментов и ресурсов, показывающий, как ИИ применяется на всех этапах научной работы.
Внутри — десятки категорий: управление литературой, анализ данных, превращение статей в постеры, автоматизация экспериментов и многое другое. Есть и специализированные инструменты для биологии, химии, физики и других областей.
В коллекции есть, например, Paper2Poster, который автоматически превращает научные статьи в постеры, MinerU — мощный инструмент для парсинга документов, и The AI Scientist — система для полностью автоматизированных исследований.
Также собраны современные научные статьи, датасеты, вычислительные фреймворки и образовательные материалы. По сути, это полный toolchain для AI-ассистированного ресерча. Определенно стоит сохранить.
⭐️ Stars: 674
➡️ Cсылка на GitHub
📱 @git_developer
В научных исследованиях чаще всего выматывают не сами эксперименты, а бесконечное чтение статей, бесконечная чистка данных и нескончаемые презентации для отчетов.
На GitHub нашлась отличная подборка Awesome AI for Science — это систематизированный список инструментов и ресурсов, показывающий, как ИИ применяется на всех этапах научной работы.
Внутри — десятки категорий: управление литературой, анализ данных, превращение статей в постеры, автоматизация экспериментов и многое другое. Есть и специализированные инструменты для биологии, химии, физики и других областей.
В коллекции есть, например, Paper2Poster, который автоматически превращает научные статьи в постеры, MinerU — мощный инструмент для парсинга документов, и The AI Scientist — система для полностью автоматизированных исследований.
Также собраны современные научные статьи, датасеты, вычислительные фреймворки и образовательные материалы. По сути, это полный toolchain для AI-ассистированного ресерча. Определенно стоит сохранить.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤3
Constrict
Нужно сжать видео до заданного размера для загрузки. Ручная подгонка битрейта с кучей проб и ошибок отнимает время, а онлайн-сервисы вызывают вопросы к приватности и скорости.
На GitHub нашелся Constrict — open-source инструмент для сжатия видео. Ты просто задаешь целевой размер файла, а он сам рассчитывает оптимальные параметры кодирования. Все обрабатывается локально, без загрузок в облако.
Инструмент построен на FFmpeg и автоматически подбирает битрейт, разрешение, FPS и качество аудио, стараясь сохранить максимум качества при нужном размере.
Поддерживает пакетную обработку в одну директорию, ограничение FPS для баланса четкости и плавности, а также кодеки H.264, HEVC, AV1 и VP9.
Если часто приходится ужимать видео под конкретный лимит и не хочется возиться с настройками или онлайн-сервисами, стоит попробовать.
📁 Language: #Python 94.2%
⭐️ Stars: 323
➡️ Cсылка на GitHub
📱 @git_developer
Нужно сжать видео до заданного размера для загрузки. Ручная подгонка битрейта с кучей проб и ошибок отнимает время, а онлайн-сервисы вызывают вопросы к приватности и скорости.
На GitHub нашелся Constrict — open-source инструмент для сжатия видео. Ты просто задаешь целевой размер файла, а он сам рассчитывает оптимальные параметры кодирования. Все обрабатывается локально, без загрузок в облако.
Инструмент построен на FFmpeg и автоматически подбирает битрейт, разрешение, FPS и качество аудио, стараясь сохранить максимум качества при нужном размере.
Поддерживает пакетную обработку в одну директорию, ограничение FPS для баланса четкости и плавности, а также кодеки H.264, HEVC, AV1 и VP9.
Если часто приходится ужимать видео под конкретный лимит и не хочется возиться с настройками или онлайн-сервисами, стоит попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤2
aio-usb-drive
Когда с компьютером что-то идёт не так, больше всего бесит не сама поломка, а отсутствие под рукой нормальной загрузочной флешки. Каждый раз заново скачивать образы, форматировать USB, рисковать данными — сплошная потеря времени.
На GitHub попался проект aio-usb-drive, цель которого -» сделать универсальную флешку для обслуживания систем.
Достаточно просто закинуть ISO-образы прямо на USB -» и с одной флешки можно загружать сразу несколько систем и утилит. По ощущениям как обычный накопитель, без лишней магии.
В проекте уже подобран набор полезных инструментов: SystemRescue для восстановления, Rescuezilla для клонирования дисков, установочные образы разных Linux-дистрибутивов, а также установщики Windows 11 и Office 365.
Есть подробные инструкции по подготовке флешки и использованию, вплоть до скриптов активации продуктов Microsoft. Флешки на 32 ГБ хватает для большинства задач, на 64 ГБ — помещается полный набор.
Если нужен переносной набор инструментов для администрирования или ты регулярно помогаешь друзьям с установкой системы и ремонтом ПК — проект точно стоит добавить в закладки.
⭐️ Stars: 2.2k
➡️ Cсылка на GitHub
📱 @git_developer
Когда с компьютером что-то идёт не так, больше всего бесит не сама поломка, а отсутствие под рукой нормальной загрузочной флешки. Каждый раз заново скачивать образы, форматировать USB, рисковать данными — сплошная потеря времени.
На GitHub попался проект aio-usb-drive, цель которого -» сделать универсальную флешку для обслуживания систем.
Достаточно просто закинуть ISO-образы прямо на USB -» и с одной флешки можно загружать сразу несколько систем и утилит. По ощущениям как обычный накопитель, без лишней магии.
В проекте уже подобран набор полезных инструментов: SystemRescue для восстановления, Rescuezilla для клонирования дисков, установочные образы разных Linux-дистрибутивов, а также установщики Windows 11 и Office 365.
Есть подробные инструкции по подготовке флешки и использованию, вплоть до скриптов активации продуктов Microsoft. Флешки на 32 ГБ хватает для большинства задач, на 64 ГБ — помещается полный набор.
Если нужен переносной набор инструментов для администрирования или ты регулярно помогаешь друзьям с установкой системы и ремонтом ПК — проект точно стоит добавить в закладки.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3