Grass forever
Тут читаем как подключить https://hermes-agent.nousresearch.com/docs/guides/xai-grok-oauth
можно сразу тулзы поменять на грока, буду тестировать
можно сразу тулзы поменять на грока, буду тестировать
👍6
Grass forever
Photo
После обновы грока(добавление подписки в агентов официально)
Грок начал чувствовать себя очень плохо
Грок начал чувствовать себя очень плохо
Нашёл прикольную штуку для тех, кто давно страдает от того, что агент забывает всё через 10 сообщений. Гит: https://github.com/Tencent/TencentDB-Agent-Memory
TencentDB Agent Memory - это локальная долгосрочная память для AI-агентов. Никаких внешних API, ноль зависимости от облачных сервисов типа Mem0 или чего-то подобного. Всё хранится у тебя на диске, в читаемом виде, с возможностью копать до самых глубоких слоёв.
Суть в 4-уровневой прогрессивной памяти (L0–L3):
🔵 L0 - сырые разговоры
🔵 L1 - атомарные факты
🔵 L2 - сценарии
🔵 L3 - полноценные персоны + SOP
Плюс короткосрочная память сделана через Mermaid canvas + умный offload. Вместо того чтобы пихать в контекст тонны логов, система выносит их в файлы, оставляет в промпте только лёгкий граф связей, а при необходимости по node_id мгновенно подтягивает нужное.
На длинных сессиях (типа 50 задач подряд):
🔵 Short-term память: +51% успех на WideSearch, +9.93% на SWE-bench, при этом экономия токенов до 61%
🔵 Long-term (PersonaMem): +59% к успеху
💻 Это white-box система, где ты в любой момент можешь зайти в папку
Короче, если ты уже устал от того, что агент каждый раз заново спрашивает «а что мы делали в прошлый раз?», или когда контекст раздувается до 100k токенов - это один из самых вменяемых решений на рынке прямо сейчас.
Продолжение второй части?
TencentDB Agent Memory - это локальная долгосрочная память для AI-агентов. Никаких внешних API, ноль зависимости от облачных сервисов типа Mem0 или чего-то подобного. Всё хранится у тебя на диске, в читаемом виде, с возможностью копать до самых глубоких слоёв.
Суть в 4-уровневой прогрессивной памяти (L0–L3):
Плюс короткосрочная память сделана через Mermaid canvas + умный offload. Вместо того чтобы пихать в контекст тонны логов, система выносит их в файлы, оставляет в промпте только лёгкий граф связей, а при необходимости по node_id мгновенно подтягивает нужное.
На длинных сессиях (типа 50 задач подряд):
~/.hermes/memory-tdai/ и посмотреть, что агент на самом деле запомнил, на каком уровне и почему.Короче, если ты уже устал от того, что агент каждый раз заново спрашивает «а что мы делали в прошлый раз?», или когда контекст раздувается до 100k токенов - это один из самых вменяемых решений на рынке прямо сейчас.
Продолжение второй части?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Grass forever
Вышел 3.5 флеш от Гугла 👀👀 Вот почему акки решили побанить, что бы меньше халявщиков было
Ебать она ещё и стоит 1.5/3
Ахуй
Ахуй
25 мая в 16:00 UTC выходит первый сезон с 7.7M $BCN в наградах
Короче, два пути, оба ведут к токену:
Игра F2P по сути, но с премиум-фишками. В сезоне будут мифические скины и косметика, которых после конца сезона уже не будет - чисто сезон эксклюзив.
Pre-register уже открыт. По рефке дают 50 Gobloonz + 1 Umbra Chest на старте.
Плюс реферер получает % от трат приглашённого в игре.
Ссылка: https://app.thebeacon.gg/pre-register?referralCode=UTV3GNB6J2
Кто планирует тратить свое время?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Grass forever
Нашёл прикольную штуку для тех, кто давно страдает от того, что агент забывает всё через 10 сообщений. Гит: https://github.com/Tencent/TencentDB-Agent-Memory TencentDB Agent Memory - это локальная долгосрочная память для AI-агентов. Никаких внешних API, ноль…
Теперь самое интересное - интеграция с Hermes.
В репе есть отдельный hermes-plugin/memory/memory_tencentdb. Недавно добавили полноценный адаптер, context offload и кучу улучшений. То есть это не просто «можно прикрутить», а уже есть нативная поддержка.
Как быстро поднять:
1. Через Docker (рекомендуют для Hermes):
Есть готовый образ с volume mount, healthcheck и передачей MODEL_API_KEY.
2. Плагин ставится примерно так же, как другие memory-провайдеры в Hermes.
3. В конфиге можно включить offload (чтобы тяжёлые логи не жрали контекст), настроить hybrid retrieval (BM25 + вектора), частоту сжатия сценариев и триггер создания персоны (например каждые 50 разговоров).
Плюс есть CLI-команды для восстановления, warm-up, дедупликации и т.д. Всё конфигурится на трёх уровнях - от "поставил и забыл" до глубокого тюнинга под длинные задачи.
Кому это реально зайдёт:
🔵 Тем, кто использует Hermes как основной инструмент и хочет, чтобы агент помнил контекст проекта неделями
🔵 Тем, кто делает сложные многошаговые задачи (SWE-bench style, research, long-horizon coding)
🔵 Тем, кому важно, чтобы память была полностью локальной и прозрачной (без отправки данных куда-то в облако)
🔵 Тем, кто хочет потом генерировать из памяти готовые SOP и personas
Если ты на Hermes и постоянно заебываешься в "агент забыл что мы обсуждали 20 сообщений назад" - поставь эту память. Разница будет очень заметна, особенно на длинных сессиях.
Репа: https://github.com/Tencent/TencentDB-Agent-Memory
В репе есть отдельный hermes-plugin/memory/memory_tencentdb. Недавно добавили полноценный адаптер, context offload и кучу улучшений. То есть это не просто «можно прикрутить», а уже есть нативная поддержка.
Как быстро поднять:
1. Через Docker (рекомендуют для Hermes):
Есть готовый образ с volume mount, healthcheck и передачей MODEL_API_KEY.
2. Плагин ставится примерно так же, как другие memory-провайдеры в Hermes.
3. В конфиге можно включить offload (чтобы тяжёлые логи не жрали контекст), настроить hybrid retrieval (BM25 + вектора), частоту сжатия сценариев и триггер создания персоны (например каждые 50 разговоров).
Плюс есть CLI-команды для восстановления, warm-up, дедупликации и т.д. Всё конфигурится на трёх уровнях - от "поставил и забыл" до глубокого тюнинга под длинные задачи.
Кому это реально зайдёт:
Если ты на Hermes и постоянно заебываешься в "агент забыл что мы обсуждали 20 сообщений назад" - поставь эту память. Разница будет очень заметна, особенно на длинных сессиях.
Репа: https://github.com/Tencent/TencentDB-Agent-Memory
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Есть нейросеть с всего 1 миллиардом параметров (это очень мало по сегодняшним меркам), которая решает сложные задачи почти так же хорошо, как большие модели в 3–7 раз больше неё
Называется HRM-Text-1B. И она не просто "ещё одна модель". У неё совсем другая технология
Обычные нейросети (типа ChatGPT или Llama) читают текст по одному разу и пытаются "думать" словами в ответе.
А эта модель:
Из-за этого она глубоко думает, хотя сама маленькая.
Результаты:
Для такой крошечной модели - это ПИЗДЕЦ АХУЕТЬ! Она обгоняет некоторые модели в 3–7 раз больше.
Плюсы
Вы прикиньте
Только недавно обсуждали в чате, о нейронках в телефоне и что это в далёком будущем, но по факту телефоны уже имеют 12+ RAM памяти, и можно спокойно её туда засунуть, вы даже не поймёте что там нейронка сидит)
Что может быть дальше? Будущее нейросетей
Это важный сигнал: «больше параметров» - не единственный путь. (Вспомним Glm 5.1 у которой 700B параметров и вес 1.5 терабайта без квантизации, что бы у себя локально её запустить вам нужно 8 видюх H200 минимум... А это около 200к баксов)
Это как переход от огромных грузовиков к умным маленьким электрокарам. Меньше, умнее, доступнее.
Ссылки, чтобы попробовать самому:
- GitHub: https://github.com/sapientinc/HRM-Text
- HuggingFace: https://huggingface.co/sapientinc/HRM-Text-1B
Чат | Канал | Proxy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Grass forever
На самом деле это ебанутый прорыв будет в нейронках
ты ж прикинь если получится оптимизировать все опенсорс нейронки под эту технологию?
glm 5.1 от 1.5 терабайта сможет упасть до 300 гигов без квантизации, а то и ещё меньше.
Цены конечно не упадут на нейронки, ибо зачем цены опускать? верно? вот. но зато такие как GLM\Kimi\ollama смогут остаться в конкуренции.
Я очень доволен такими новостями
ты ж прикинь если получится оптимизировать все опенсорс нейронки под эту технологию?
glm 5.1 от 1.5 терабайта сможет упасть до 300 гигов без квантизации, а то и ещё меньше.
Цены конечно не упадут на нейронки, ибо зачем цены опускать? верно? вот. но зато такие как GLM\Kimi\ollama смогут остаться в конкуренции.
Я очень доволен такими новостями
NVIDIA раздаёт тестовый стенд DSX Air. 10 000 бесплатных часов, можно выкрутить аж до 96 ядер и 500 ГБ. Реально жир для тестов сетей, ИИ-инфраструктуры и всего тяжёлого.
Главный косяк - пускает только с корпоративной почтой. Gmail и одноразовые сразу в бан.
Вот как забрать за 15 минут без лишних трат:
Берём любой дешёвый домен (.xyz, .site, .space) на Namecheap / Spaceship / Tencent.
Кидаем его в Cloudflare, меняем NS.
В Email Routing создаём nvidia-admin@твойдомен и пересылаем на свой Gmail. Жмём «Add records automatically».
Всё, теперь у тебя официальная доменная почта, а письма падают в обычный ящик.
Открываем инкогнито, идём на ngc.nvidia.com или dsx-air.nvidia.com.
Создаём NVIDIA Cloud Account на новую доменную почту.
Обязательно создаём Организацию (любое английское название). Без этого триал не стартует.
Жмём Start Trial → забираем 10 000 часов.
⚠️ Важные моменты, чтобы не потерять акк:
🔗 Ссылка на регистрацию: dsx-air.nvidia.com
Чат | Канал | Proxy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
GLM сам по себе - пиздатая модель, но без vision-модуля. (он не видит картиночки совсем)
Чтобы он мог анализировать скрины, графики, документы и фото, нужно отдавать ему текстовое описание изображения. Это делается через внешний vision-провайдер, который превращает картинку в текст, а потом этот текст подкладывается в промпт GLM.
Самый простой и бесплатный вариант - использовать уже подключённый openai-codex (ChatGPT Plus по OAuth).
Как это работает технически:
Hermes забирает фото из Telegram → отправляет в GPT-4o через codex auth → получает подробное описание или OCR → вставляет результат в контекст GLM. GLM при этом продолжает отвечать, но уже "видит" картинку через текст
Просто включаешь toolset vision, и Hermes начинает использовать GPT-4o как внешний глаз.
Есть и другие бесплатные не-локальные варианты:
Gemini 1.5 Flash и Pro хорошо работают с изображениями. Бесплатный лимит generous, можно использовать для скринов и документов. Подключается как custom provider или через OpenRouter.
Иногда там бывают бесплатные лимиты на Qwen-VL, LLaVA и подобные модели. Можно настроить Hermes на OpenRouter и выбрать vision-модель с нулевой или низкой стоимостью.
Сам GLM имеет vision-версию. Если у тебя есть доступ к GLM-4V через их API или платформу, можно настроить его как vision-провайдер и не тащить чужие модели.
Если codex уже подключён - начинай с него. Это самый быстрый и бесплатный путь для большинства задач в Telegram.
Документация
Чат | Канал | Proxy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Фри 100$ или я тебя наебал? 🤔
AMD бесплатно раздаёт 50 часов на MI300X 192GB.
Пока все сидят на CUDA, можно быстро получить AMD-карту (192 ГБ HBM3). ROCm + MI300X сильно выделяет, особенно если ты ищешь работу в inference, multi-vendor инфраструктуре или просто хочешь понять альтернативы CUDA.
Что дают:
🔵 $100 кредитов (~50 часов на MI300X)
🔵 1 месяц DeepLearning.AI Pro (курсы Andrew Ng)
🔵 Сертификаты AMD AI Academy
🔵 Доступ в закрытый Discord с AMD-экспертами
💰 💰 💰 Как забрать за 5-10 минут:
1. Регистрируйся в AMD AI Developer Program. Пиши цель примерно так: "AI prototype development, LLM inference & ROCm benchmarking"
2. В разделе Perks выбирай AMD Developer Cloud $100 (не Fireworks).
3. Через 1-3 дня приходит ссылка. Создаёшь VM на их облаке (DigitalOcean под капотом), берёшь 1x MI300X + официальный ROCm/vLLM образ.
Важно: кредит сгорает примерно за 30 дней. После работы всегда выключай и удаляй инстанс, иначе будет биллинг.
Бери, пока дают. Регистрация тут: https://www.amd.com/en/developer/ai-dev-program.html
Запусти хотя бы один инстанс, сделай vLLM. УЧУСЬ ПОКА ДАЮТ!
Чат | Канал | Proxy
AMD бесплатно раздаёт 50 часов на MI300X 192GB.
Пока все сидят на CUDA, можно быстро получить AMD-карту (192 ГБ HBM3). ROCm + MI300X сильно выделяет, особенно если ты ищешь работу в inference, multi-vendor инфраструктуре или просто хочешь понять альтернативы CUDA.
Что дают:
1. Регистрируйся в AMD AI Developer Program. Пиши цель примерно так: "AI prototype development, LLM inference & ROCm benchmarking"
2. В разделе Perks выбирай AMD Developer Cloud $100 (не Fireworks).
3. Через 1-3 дня приходит ссылка. Создаёшь VM на их облаке (DigitalOcean под капотом), берёшь 1x MI300X + официальный ROCm/vLLM образ.
Важно: кредит сгорает примерно за 30 дней. После работы всегда выключай и удаляй инстанс, иначе будет биллинг.
Бери, пока дают. Регистрация тут: https://www.amd.com/en/developer/ai-dev-program.html
Запусти хотя бы один инстанс, сделай vLLM. УЧУСЬ ПОКА ДАЮТ!
Чат | Канал | Proxy
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5 1