Media is too big
VIEW IN TELEGRAM
MLE-agent
Когда делаешь ML-проект, весь цикл обычно разваливается на постоянные прыжки между инструментами: подготовка данных, обучение модели, отладка, оптимизация. В итоге теряется куча времени.
На GitHub попался MLE-Agent — опенсорсный AI-ассистент, сделанный специально под задачи ML-инженеров.
Он умеет по нечётким требованиям собирать базовый ML-пайплайн, а ещё способен самостоятельно участвовать в Kaggle: от подготовки данных и тренировки модели до финальной отправки сабмита.
Внутри есть интеграция с Arxiv и Papers with Code, так что он может искать релевантные статьи. При ошибках пробует сам разобраться и подсказать фикс. Может даже генерировать недельные отчёты по проделанной работе.
Есть интерактивный CLI-чат, и можно подключить OpenAI, Claude или локальную модель через Ollama.
Если ты регулярно работаешь с ML-процессами и хочешь помощника, который соберёт базовую модель, подправит код и найдёт нужные статьи — этот проект стоит попробовать.
📁 Language: #Python 96.0%
⭐️ Stars: 1.4k
➡️ Cсылка на GitHub
📱 @git_developer
Когда делаешь ML-проект, весь цикл обычно разваливается на постоянные прыжки между инструментами: подготовка данных, обучение модели, отладка, оптимизация. В итоге теряется куча времени.
На GitHub попался MLE-Agent — опенсорсный AI-ассистент, сделанный специально под задачи ML-инженеров.
Он умеет по нечётким требованиям собирать базовый ML-пайплайн, а ещё способен самостоятельно участвовать в Kaggle: от подготовки данных и тренировки модели до финальной отправки сабмита.
Внутри есть интеграция с Arxiv и Papers with Code, так что он может искать релевантные статьи. При ошибках пробует сам разобраться и подсказать фикс. Может даже генерировать недельные отчёты по проделанной работе.
Есть интерактивный CLI-чат, и можно подключить OpenAI, Claude или локальную модель через Ollama.
Если ты регулярно работаешь с ML-процессами и хочешь помощника, который соберёт базовую модель, подправит код и найдёт нужные статьи — этот проект стоит попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥4👍2
qxresearch-event-1
При изучении Python часто становится скучно: сидишь перед толстыми туториалами, строчишь код, а ощущения быстрого результата почти нет. Хотя на самом деле многие полезные вещи делаются буквально в несколько строк.
Как раз на GitHub наткнулся на проект qxresearch-event-1, который продвигает идею «минимализма». В нём собрано 50+ Python-приложений, каждое из которых запускается примерно из 10 строк кода.
Покрытие очень широкое: от базовых задач вроде шифрования PDF и объединения файлов до более продвинутых вещей — GUI-интерфейсы, диктофон, а также автоматизация почты и голосовой ассистент на базе ChatGPT.
Такой короткий и плотный код отлично подходит для чтения и разбора. Плюс к каждому примеру есть видеоразбор, который помогает быстро понять логику каждой строки.
Достаточно простой настройки окружения, и всё сразу запускается. Подойдёт и новичкам, которые ищут практику, и опытным разработчикам, которым нужен набор удобных скриптов на каждый день.
📁 Language: #Python 100%
⭐️ Stars: 2.1k
➡️ Cсылка на GitHub
📱 @git_developer
При изучении Python часто становится скучно: сидишь перед толстыми туториалами, строчишь код, а ощущения быстрого результата почти нет. Хотя на самом деле многие полезные вещи делаются буквально в несколько строк.
Как раз на GitHub наткнулся на проект qxresearch-event-1, который продвигает идею «минимализма». В нём собрано 50+ Python-приложений, каждое из которых запускается примерно из 10 строк кода.
Покрытие очень широкое: от базовых задач вроде шифрования PDF и объединения файлов до более продвинутых вещей — GUI-интерфейсы, диктофон, а также автоматизация почты и голосовой ассистент на базе ChatGPT.
Такой короткий и плотный код отлично подходит для чтения и разбора. Плюс к каждому примеру есть видеоразбор, который помогает быстро понять логику каждой строки.
Достаточно простой настройки окружения, и всё сразу запускается. Подойдёт и новичкам, которые ищут практику, и опытным разработчикам, которым нужен набор удобных скриптов на каждый день.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤5🔥4
python-markdownify
Когда делаешь парсер или переносишь сайт, на экране часто лежит куча рваной HTML-разметки. Привести это в аккуратный Markdown обычно та еще морока.
В опенсорсе нашелся удобный инструмент python-markdownify, который как раз решает задачу конвертации HTML в Markdown.
Логика у него проста: берешь громоздкий HTML, на выходе получаешь понятный и чисто структурированный Markdown.
Инструмент хорошо настраивается. Можно вычищать нужные теги, менять формат заголовков, аккуратно обрабатывать таблицы и картинки. Все это конфигурируется.
Ставится через pip. Им можно пользоваться как из Python-кода, так и из командной строки, конвертируя файлы пачками.
При желании можно унаследоваться и переопределить правила преобразования под свои кейсы. С расширяемостью там все ок.
Если приходится гонять большие объемы текста или переносить блог, библиотека экономит кучу времени, которое обычно уходит на ковыряние регулярок.
📁 Language: #Python 100%
⭐️ Stars: 1.9k
➡️ Cсылка на GitHub
📱 @git_developer
Когда делаешь парсер или переносишь сайт, на экране часто лежит куча рваной HTML-разметки. Привести это в аккуратный Markdown обычно та еще морока.
В опенсорсе нашелся удобный инструмент python-markdownify, который как раз решает задачу конвертации HTML в Markdown.
Логика у него проста: берешь громоздкий HTML, на выходе получаешь понятный и чисто структурированный Markdown.
Инструмент хорошо настраивается. Можно вычищать нужные теги, менять формат заголовков, аккуратно обрабатывать таблицы и картинки. Все это конфигурируется.
Ставится через pip. Им можно пользоваться как из Python-кода, так и из командной строки, конвертируя файлы пачками.
При желании можно унаследоваться и переопределить правила преобразования под свои кейсы. С расширяемостью там все ок.
Если приходится гонять большие объемы текста или переносить блог, библиотека экономит кучу времени, которое обычно уходит на ковыряние регулярок.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤4
Media is too big
VIEW IN TELEGRAM
OpenContracts
Когда работаешь с юрдоками и контрактами, сама по себе читка не так напрягает, как необходимость выгребать из сотен файлов ключевые пункты, помечать важные места и при этом держать формат данных единым для последующей аналитики.
На GitHub попался OpenContracts — опенсорсный анализатор документов, заточенный под знания-интенсивные задачи. Он заметно упрощает управление файлами и вытягивание данных.
Поддерживает загрузку PDF и обычного текста, разметку и анализ. Внутри стоит плагиноподобный парсер, который автоматически вытаскивает структурные особенности документа и делает векторные представления для удобного поиска.
Главная фича — массовое извлечение данных. Можно задать вопрос сразу к сотне документов, получить структурированный ответ и увидеть подсветку прямо в исходниках. Есть настройка схемы метаданных, совместная разметка, управление доступами и прочие корпоративные возможности.
Система построена на PydanticAI. Там есть и управление диалогом, и стриминговые ответы. Развернуть можно через Docker.
Если приходится разбирать горы контрактов, юрбумаг или любых материалов с высоким порогом знаний, этот инструмент хорошо переводит работу из ручной рутины в нормальный поток.
📁 Language: #TypeScript 52.3%, #Python 46.9%
⭐️ Stars: 985
➡️ Cсылка на GitHub
📱 @git_developer
Когда работаешь с юрдоками и контрактами, сама по себе читка не так напрягает, как необходимость выгребать из сотен файлов ключевые пункты, помечать важные места и при этом держать формат данных единым для последующей аналитики.
На GitHub попался OpenContracts — опенсорсный анализатор документов, заточенный под знания-интенсивные задачи. Он заметно упрощает управление файлами и вытягивание данных.
Поддерживает загрузку PDF и обычного текста, разметку и анализ. Внутри стоит плагиноподобный парсер, который автоматически вытаскивает структурные особенности документа и делает векторные представления для удобного поиска.
Главная фича — массовое извлечение данных. Можно задать вопрос сразу к сотне документов, получить структурированный ответ и увидеть подсветку прямо в исходниках. Есть настройка схемы метаданных, совместная разметка, управление доступами и прочие корпоративные возможности.
Система построена на PydanticAI. Там есть и управление диалогом, и стриминговые ответы. Развернуть можно через Docker.
Если приходится разбирать горы контрактов, юрбумаг или любых материалов с высоким порогом знаний, этот инструмент хорошо переводит работу из ручной рутины в нормальный поток.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍7🔥2
inksight
Когда фотографируешь рукописные заметки и хочешь превратить их в редактируемый цифровой документ, обычный OCR распознаёт только текст и теряет сами штрихи письма. А профессиональные планшеты для рукописного ввода требуют отдельного оборудования.
Недавно на GitHub появился InkSight — это опенсорсный проект от Google для преобразования рукописных заметок. Он умеет превращать фото рукописного текста в векторные штрихи, сохраняя траекторию письма, с поддержкой редактирования и поиска.
Система построена на архитектуре ViT + mT5 (encoder–decoder). Модель проходит двойное обучение через этапы «чтения» и «письма», благодаря чему она не только понимает рукописный текст, но и умеет восстанавливать сам процесс письма.
Поддерживается многоязычное распознавание, разные фоны и стили письма. Есть два режима конвертации:
на уровне слов,
и на уровне всей страницы.
На выходе получается векторный цифровой почерк, который можно напрямую редактировать, искать по нему или импортировать в заметочные приложения.
Также есть онлайн-демо на Hugging Face, выложен полный датасет и примеры кода в Jupyter для локального запуска.
📁 Language: #Python 13.2%
⭐️ Stars: 759
➡️ Cсылка на GitHub
📱 @git_developer
Когда фотографируешь рукописные заметки и хочешь превратить их в редактируемый цифровой документ, обычный OCR распознаёт только текст и теряет сами штрихи письма. А профессиональные планшеты для рукописного ввода требуют отдельного оборудования.
Недавно на GitHub появился InkSight — это опенсорсный проект от Google для преобразования рукописных заметок. Он умеет превращать фото рукописного текста в векторные штрихи, сохраняя траекторию письма, с поддержкой редактирования и поиска.
Система построена на архитектуре ViT + mT5 (encoder–decoder). Модель проходит двойное обучение через этапы «чтения» и «письма», благодаря чему она не только понимает рукописный текст, но и умеет восстанавливать сам процесс письма.
Поддерживается многоязычное распознавание, разные фоны и стили письма. Есть два режима конвертации:
на уровне слов,
и на уровне всей страницы.
На выходе получается векторный цифровой почерк, который можно напрямую редактировать, искать по нему или импортировать в заметочные приложения.
Также есть онлайн-демо на Hugging Face, выложен полный датасет и примеры кода в Jupyter для локального запуска.
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤8👍8🔥3