This media is not supported in your browser
VIEW IN TELEGRAM
PageLM
Материалов для учебы куча: PDF, доки, заметки, все раскидано где попало. Когда садишься повторять, вообще непонятно, с чего начать. Задачи решать, карточки учить тоже приходится самому собирать и раскладывать, времени и сил уходит море.
Случайно наткнулся на PageLM, это опенсорсная платформа для обучения, которая сама превращает твои материалы в интерактив: квизы, флешкарты, подкасты и т.п.
Загружаешь PDF, Word или Markdown, дальше можно сразу “общаться” с содержимым, задавать вопросы, генерить аккуратно структурированные конспекты, а еще она автоматически вытаскивает карточки под интервальное повторение.
Плюс есть режимы типа пробного экзамена, планирования домашки, тренировки дебатов. И даже умеет конвертить заметки в подкаст-аудио, чтобы учиться по дороге.
Поддерживает разные модели: Google Gemini, OpenAI, Claude, Ollama и другие. Можно выбрать облако или локальный запуск, есть вариант деплоя одной командой через Docker.
Если тебя уже накрывает волной учебных материалов или хочется сделать повторение реально эффективнее, PageLM точно стоит попробовать.
📁 Language: #TypeScript 97.4%
⭐️ Stars: 1.1k
➡️ Cсылка на GitHub
📱 @git_developer
Материалов для учебы куча: PDF, доки, заметки, все раскидано где попало. Когда садишься повторять, вообще непонятно, с чего начать. Задачи решать, карточки учить тоже приходится самому собирать и раскладывать, времени и сил уходит море.
Случайно наткнулся на PageLM, это опенсорсная платформа для обучения, которая сама превращает твои материалы в интерактив: квизы, флешкарты, подкасты и т.п.
Загружаешь PDF, Word или Markdown, дальше можно сразу “общаться” с содержимым, задавать вопросы, генерить аккуратно структурированные конспекты, а еще она автоматически вытаскивает карточки под интервальное повторение.
Плюс есть режимы типа пробного экзамена, планирования домашки, тренировки дебатов. И даже умеет конвертить заметки в подкаст-аудио, чтобы учиться по дороге.
Поддерживает разные модели: Google Gemini, OpenAI, Claude, Ollama и другие. Можно выбрать облако или локальный запуск, есть вариант деплоя одной командой через Docker.
Если тебя уже накрывает волной учебных материалов или хочется сделать повторение реально эффективнее, PageLM точно стоит попробовать.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Text Grab
Иногда видишь текст на картинке, в видео или прямо в интерфейсе какого-нибудь приложения, а скопировать нельзя: не выделяется. Остается только вбивать руками, и если там длинный кусок, это прям боль.
Недавно на GitHub попался Text Grab, опенсорсный OCR-инструмент, который вытаскивает любой видимый на экране текст и дает сразу скопировать.
Он завязан на встроенный Windows OCR-движок: распознает локально, без интернета, не держит постоянно фоновый процесс, запускаешь по необходимости. Работает шустро.
Есть четыре режима:
▪️ полноэкранный захват: можно выделить область или кликнуть по слову и сразу распознать;
▪️ режим плавающего окна: закрепляешь где угодно и оно постоянно распознает;
▪️ окно редактирования текста: внутри есть разные инструменты обработки текста;
▪️ быстрые запросы: сохраняешь часто используемые куски и вызываешь их одним действием.
Еще есть поддержка CLI: можно делать OCR по файлу картинки или прогонять пакетно всю папку с изображениями.
Кому надо, можно поставить из Microsoft Store или скачать с GitHub. Также поддерживается установка через менеджеры пакетов scoop и choco.
📁 Language: #Csharp 99.5%
⭐️ Stars: 4.5k
➡️ Cсылка на GitHub
📱 @git_developer
Иногда видишь текст на картинке, в видео или прямо в интерфейсе какого-нибудь приложения, а скопировать нельзя: не выделяется. Остается только вбивать руками, и если там длинный кусок, это прям боль.
Недавно на GitHub попался Text Grab, опенсорсный OCR-инструмент, который вытаскивает любой видимый на экране текст и дает сразу скопировать.
Он завязан на встроенный Windows OCR-движок: распознает локально, без интернета, не держит постоянно фоновый процесс, запускаешь по необходимости. Работает шустро.
Есть четыре режима:
Еще есть поддержка CLI: можно делать OCR по файлу картинки или прогонять пакетно всю папку с изображениями.
Кому надо, можно поставить из Microsoft Store или скачать с GitHub. Также поддерживается установка через менеджеры пакетов scoop и choco.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤5💊1
Clawdbot
Сейчас ИИ умеет и код писать, и картинки рисовать, и в роли собеседника выступать, но есть одна проблема: чтобы всем этим пользоваться, почти всегда нужно идти в отдельную веб-страницу или отдельный клиент.
Как только хочется, чтобы он помог с рабочей задачей или обсудить с ним требования и решение, приходится открывать нужное окно ИИ и постоянно прыгать между разными интерфейсами. Это реально неудобно.
И вот на GitHub как раз попался очень хайповый open-source проект Clawdbot, который закрывает эту боль. Буквально за несколько дней он набрал 20000+ звёзд.
В отличие от простых AI-чатиков, Clawdbot это приватный AI-ассистент, который может полностью работать локально и у которого есть условные “руки и ноги”.
Внутри у него есть инструменты вроде управления браузером, Canvas-холста, планировщика задач и т.д. Он может как человек автоматом ходить по сайтам, заполнять формы, читать и писать файлы и даже выполнять shell-команды.
Его можно подключить к популярным большим моделям вроде Gemini и Claude, а также завести в разные мессенджеры и соц-чаты.
В итоге можно прямо в привычных чат-приложениях отдавать ему команды, чтобы он сам автоматизировал и выполнял задачи, без постоянного переключения между приложениями.
У проекта есть пошаговая установка: одной командой можно быстро развернуть. Запускается и локально на Mac, и на Linux-сервере для удалённого доступа.
📁 Language: #TypeScript 82.5%
⭐️ Stars: 60k
➡️ Cсылка на GitHub
📱 @git_developer
Сейчас ИИ умеет и код писать, и картинки рисовать, и в роли собеседника выступать, но есть одна проблема: чтобы всем этим пользоваться, почти всегда нужно идти в отдельную веб-страницу или отдельный клиент.
Как только хочется, чтобы он помог с рабочей задачей или обсудить с ним требования и решение, приходится открывать нужное окно ИИ и постоянно прыгать между разными интерфейсами. Это реально неудобно.
И вот на GitHub как раз попался очень хайповый open-source проект Clawdbot, который закрывает эту боль. Буквально за несколько дней он набрал 20000+ звёзд.
В отличие от простых AI-чатиков, Clawdbot это приватный AI-ассистент, который может полностью работать локально и у которого есть условные “руки и ноги”.
Внутри у него есть инструменты вроде управления браузером, Canvas-холста, планировщика задач и т.д. Он может как человек автоматом ходить по сайтам, заполнять формы, читать и писать файлы и даже выполнять shell-команды.
Его можно подключить к популярным большим моделям вроде Gemini и Claude, а также завести в разные мессенджеры и соц-чаты.
В итоге можно прямо в привычных чат-приложениях отдавать ему команды, чтобы он сам автоматизировал и выполнял задачи, без постоянного переключения между приложениями.
У проекта есть пошаговая установка: одной командой можно быстро развернуть. Запускается и локально на Mac, и на Linux-сервере для удалённого доступа.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥5👍2💊1
DocStrange
Когда делаешь RAG или “скармливаешь” ИИ свои материалы, самая больная тема это таблицы внутри PDF и картинок. Текст из них вытаскивается криво: формат плывет, особенно на сложных макетах, и в таком виде это почти невозможно нормально использовать.
На GitHub как раз нашелся опенсорсный проект DocStrange, который целится ровно в эту проблему: превращать документы в данные без боли.
Он умеет довольно точно конвертировать разные форматы в то, что любят большие модели: Markdown или структурированный JSON.
Поддерживаются PDF, изображения, офисные документы и даже ссылки на веб-страницы. В основе OCR плюс анализ верстки, то есть он не просто распознает текст, а пытается понять структуру документа.
Фишка в том, что он может восстанавливать сложные таблицы, а еще по заданным полям или Schema сразу вытаскивать структурированный JSON.
Есть готовый локальный веб-интерфейс: закинул файл drag-and-drop и получил результат. Плюс поддерживается локальное ускорение на GPU, все крутится у тебя на машине, данные никуда не уезжают, с приватностью спокойнее.
Лучше всего зайдет тем, кто собирает RAG-базу знаний или кому нужно пачками разбирать сканы, счета, инвойсы и другой неструктурированный хлам.
📁 Language: #Python 85.4%
⭐️ Stars: 1.3k
➡️ Cсылка на GitHub
📱 @git_developer
Когда делаешь RAG или “скармливаешь” ИИ свои материалы, самая больная тема это таблицы внутри PDF и картинок. Текст из них вытаскивается криво: формат плывет, особенно на сложных макетах, и в таком виде это почти невозможно нормально использовать.
На GitHub как раз нашелся опенсорсный проект DocStrange, который целится ровно в эту проблему: превращать документы в данные без боли.
Он умеет довольно точно конвертировать разные форматы в то, что любят большие модели: Markdown или структурированный JSON.
Поддерживаются PDF, изображения, офисные документы и даже ссылки на веб-страницы. В основе OCR плюс анализ верстки, то есть он не просто распознает текст, а пытается понять структуру документа.
Фишка в том, что он может восстанавливать сложные таблицы, а еще по заданным полям или Schema сразу вытаскивать структурированный JSON.
Есть готовый локальный веб-интерфейс: закинул файл drag-and-drop и получил результат. Плюс поддерживается локальное ускорение на GPU, все крутится у тебя на машине, данные никуда не уезжают, с приватностью спокойнее.
Лучше всего зайдет тем, кто собирает RAG-базу знаний или кому нужно пачками разбирать сканы, счета, инвойсы и другой неструктурированный хлам.
Please open Telegram to view this post
VIEW IN TELEGRAM
Вот 14 авторских обучающих IT каналов по самым востребованным областям программирования:
Выбирай своё направление:
Please open Telegram to view this post
VIEW IN TELEGRAM