GitHub Разработчика

MLE-agent

Когда делаешь ML-проект, весь цикл обычно разваливается на постоянные прыжки между инструментами: подготовка данных, обучение модели, отладка, оптимизация. В итоге теряется куча времени.

На GitHub попался MLE-Agent — опенсорсный AI-ассистент, сделанный специально под задачи ML-инженеров.

Он умеет по нечётким требованиям собирать базовый ML-пайплайн, а ещё способен самостоятельно участвовать в Kaggle: от подготовки данных и тренировки модели до финальной отправки сабмита.

Внутри есть интеграция с Arxiv и Papers with Code, так что он может искать релевантные статьи. При ошибках пробует сам разобраться и подсказать фикс. Может даже генерировать недельные отчёты по проделанной работе.

Есть интерактивный CLI-чат, и можно подключить OpenAI, Claude или локальную модель через Ollama.

Если ты регулярно работаешь с ML-процессами и хочешь помощника, который соберёт базовую модель, подправит код и найдёт нужные статьи — этот проект стоит попробовать.

📁 Language: #Python 96.0%

⭐️ Stars: 1.4k

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥4👍2

2.99K views06:07

GitHub Разработчика

qxresearch-event-1

При изучении Python часто становится скучно: сидишь перед толстыми туториалами, строчишь код, а ощущения быстрого результата почти нет. Хотя на самом деле многие полезные вещи делаются буквально в несколько строк.

Как раз на GitHub наткнулся на проект qxresearch-event-1, который продвигает идею «минимализма». В нём собрано 50+ Python-приложений, каждое из которых запускается примерно из 10 строк кода.

Покрытие очень широкое: от базовых задач вроде шифрования PDF и объединения файлов до более продвинутых вещей — GUI-интерфейсы, диктофон, а также автоматизация почты и голосовой ассистент на базе ChatGPT.

Такой короткий и плотный код отлично подходит для чтения и разбора. Плюс к каждому примеру есть видеоразбор, который помогает быстро понять логику каждой строки.

Достаточно простой настройки окружения, и всё сразу запускается. Подойдёт и новичкам, которые ищут практику, и опытным разработчикам, которым нужен набор удобных скриптов на каждый день.

📁 Language: #Python 100%

⭐️ Stars: 2.1k

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤5🔥4

3.05K views06:07

GitHub Разработчика

python-markdownify

Когда делаешь парсер или переносишь сайт, на экране часто лежит куча рваной HTML-разметки. Привести это в аккуратный Markdown обычно та еще морока.

В опенсорсе нашелся удобный инструмент python-markdownify, который как раз решает задачу конвертации HTML в Markdown.

Логика у него проста: берешь громоздкий HTML, на выходе получаешь понятный и чисто структурированный Markdown.

Инструмент хорошо настраивается. Можно вычищать нужные теги, менять формат заголовков, аккуратно обрабатывать таблицы и картинки. Все это конфигурируется.

Ставится через pip. Им можно пользоваться как из Python-кода, так и из командной строки, конвертируя файлы пачками.

При желании можно унаследоваться и переопределить правила преобразования под свои кейсы. С расширяемостью там все ок.

Если приходится гонять большие объемы текста или переносить блог, библиотека экономит кучу времени, которое обычно уходит на ковыряние регулярок.

📁 Language: #Python 100%

⭐️ Stars: 1.9k

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12❤4

3.13K views13:17

OpenContracts

Когда работаешь с юрдоками и контрактами, сама по себе читка не так напрягает, как необходимость выгребать из сотен файлов ключевые пункты, помечать важные места и при этом держать формат данных единым для последующей аналитики.

На GitHub попался OpenContracts — опенсорсный анализатор документов, заточенный под знания-интенсивные задачи. Он заметно упрощает управление файлами и вытягивание данных.

Поддерживает загрузку PDF и обычного текста, разметку и анализ. Внутри стоит плагиноподобный парсер, который автоматически вытаскивает структурные особенности документа и делает векторные представления для удобного поиска.

Главная фича — массовое извлечение данных. Можно задать вопрос сразу к сотне документов, получить структурированный ответ и увидеть подсветку прямо в исходниках. Есть настройка схемы метаданных, совместная разметка, управление доступами и прочие корпоративные возможности.

Система построена на PydanticAI. Там есть и управление диалогом, и стриминговые ответы. Развернуть можно через Docker.

Если приходится разбирать горы контрактов, юрбумаг или любых материалов с высоким порогом знаний, этот инструмент хорошо переводит работу из ручной рутины в нормальный поток.

📁 Language: #TypeScript 52.3%, #Python 46.9%

⭐️ Stars: 985

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍7🔥2

3.15K views06:07

GitHub Разработчика

inksight

Когда фотографируешь рукописные заметки и хочешь превратить их в редактируемый цифровой документ, обычный OCR распознаёт только текст и теряет сами штрихи письма. А профессиональные планшеты для рукописного ввода требуют отдельного оборудования.

Недавно на GitHub появился InkSight — это опенсорсный проект от Google для преобразования рукописных заметок. Он умеет превращать фото рукописного текста в векторные штрихи, сохраняя траекторию письма, с поддержкой редактирования и поиска.

Система построена на архитектуре ViT + mT5 (encoder–decoder). Модель проходит двойное обучение через этапы «чтения» и «письма», благодаря чему она не только понимает рукописный текст, но и умеет восстанавливать сам процесс письма.

Поддерживается многоязычное распознавание, разные фоны и стили письма. Есть два режима конвертации:

на уровне слов,

и на уровне всей страницы.

На выходе получается векторный цифровой почерк, который можно напрямую редактировать, искать по нему или импортировать в заметочные приложения.

Также есть онлайн-демо на Hugging Face, выложен полный датасет и примеры кода в Jupyter для локального запуска.

📁 Language: #Python 13.2%

⭐️ Stars: 759

➡️

Cсылка на GitHub

📱

@git_developer

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤8👍8🔥3

2.89K views06:07

About

Blog

Apps

Platform