Grass forever

Нашёл прикольную штуку для тех, кто давно страдает от того, что агент забывает всё через 10 сообщений. Гит: https://github.com/Tencent/TencentDB-Agent-Memory

TencentDB Agent Memory - это локальная долгосрочная память для AI-агентов. Никаких внешних API, ноль зависимости от облачных сервисов типа Mem0 или чего-то подобного. Всё хранится у тебя на диске, в читаемом виде, с возможностью копать до самых глубоких слоёв.

Суть в 4-уровневой прогрессивной памяти (L0–L3):

🔵 L0 - сырые разговоры
🔵 L1 - атомарные факты
🔵 L2 - сценарии
🔵 L3 - полноценные персоны + SOP

Плюс короткосрочная память сделана через Mermaid canvas + умный offload. Вместо того чтобы пихать в контекст тонны логов, система выносит их в файлы, оставляет в промпте только лёгкий граф связей, а при необходимости по node_id мгновенно подтягивает нужное.

На длинных сессиях (типа 50 задач подряд):

🔵 Short-term память: +51% успех на WideSearch, +9.93% на SWE-bench, при этом экономия токенов до 61%
🔵 Long-term (PersonaMem): +59% к успеху

💻 Это white-box система, где ты в любой момент можешь зайти в папку ~/.hermes/memory-tdai/ и посмотреть, что агент на самом деле запомнил, на каком уровне и почему.

Короче, если ты уже устал от того, что агент каждый раз заново спрашивает «а что мы делали в прошлый раз?», или когда контекст раздувается до 100k токенов - это один из самых вменяемых решений на рынке прямо сейчас.

Продолжение второй части?

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

524 views18:07

Grass forever

Вышел 3.5 флеш от Гугла 👀👀

Вот почему акки решили побанить, что бы меньше халявщиков было

👍2

444 views18:47

Grass forever

Вышел 3.5 флеш от Гугла 👀👀 Вот почему акки решили побанить, что бы меньше халявщиков было

Ебать она ещё и стоит 1.5/3
Ахуй

440 views18:50

Grass forever

Ладно glm 5.1 все равно пизже

👍6

440 viewsedited 18:51

Grass forever

🐱

The Beacon - Season 1: Goblin's Gambit

25 мая в 16:00 UTC выходит первый сезон с 7.7M $BCN в наградах

Короче, два пути, оба ведут к токену:

⚪️ Бегаешь данжи → фармишь Umbra Shards → либо спокойно открываешь сундуки, либо рискуешь и конвертишь

⚪️ Второй путь - Kraken Klash. Tribute'ишь Gobloonz, качаешь Kraken Favor и играешь в бордовую минigame (Chest Blast и прочее)

Игра F2P по сути, но с премиум-фишками. В сезоне будут мифические скины и косметика, которых после конца сезона уже не будет - чисто сезон эксклюзив.

Pre-register уже открыт. По рефке дают 50 Gobloonz + 1 Umbra Chest на старте.

Плюс реферер получает % от трат приглашённого в игре.

Ссылка: https://app.thebeacon.gg/pre-register?referralCode=UTV3GNB6J2

Кто планирует тратить свое время?

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

460 viewsedited 19:48

Grass forever

Нашёл прикольную штуку для тех, кто давно страдает от того, что агент забывает всё через 10 сообщений. Гит: https://github.com/Tencent/TencentDB-Agent-Memory TencentDB Agent Memory - это локальная долгосрочная память для AI-агентов. Никаких внешних API, ноль…

Теперь самое интересное - интеграция с Hermes.

В репе есть отдельный hermes-plugin/memory/memory_tencentdb. Недавно добавили полноценный адаптер, context offload и кучу улучшений. То есть это не просто «можно прикрутить», а уже есть нативная поддержка.

Как быстро поднять:

1. Через Docker (рекомендуют для Hermes):
Есть готовый образ с volume mount, healthcheck и передачей MODEL_API_KEY.

2. Плагин ставится примерно так же, как другие memory-провайдеры в Hermes.

3. В конфиге можно включить offload (чтобы тяжёлые логи не жрали контекст), настроить hybrid retrieval (BM25 + вектора), частоту сжатия сценариев и триггер создания персоны (например каждые 50 разговоров).

Плюс есть CLI-команды для восстановления, warm-up, дедупликации и т.д. Всё конфигурится на трёх уровнях - от "поставил и забыл" до глубокого тюнинга под длинные задачи.

Кому это реально зайдёт:

🔵 Тем, кто использует Hermes как основной инструмент и хочет, чтобы агент помнил контекст проекта неделями
🔵 Тем, кто делает сложные многошаговые задачи (SWE-bench style, research, long-horizon coding)
🔵 Тем, кому важно, чтобы память была полностью локальной и прозрачной (без отправки данных куда-то в облако)
🔵 Тем, кто хочет потом генерировать из памяти готовые SOP и personas

Если ты на Hermes и постоянно заебываешься в "агент забыл что мы обсуждали 20 сообщений назад" - поставь эту память. Разница будет очень заметна, особенно на длинных сессиях.

Репа: https://github.com/Tencent/TencentDB-Agent-Memory

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4

451 views21:01

Grass forever

Интересно попробовать 😁

444 views21:24

Grass forever

🧠

Маленькая нейронка HRM-Text-1B, которая думает как ты

Есть нейросеть с всего 1 миллиардом параметров (это очень мало по сегодняшним меркам), которая решает сложные задачи почти так же хорошо, как большие модели в 3–7 раз больше неё

Называется HRM-Text-1B. И она не просто "ещё одна модель". У неё совсем другая технология

⌨️

Как она работает

Обычные нейросети (типа ChatGPT или Llama) читают текст по одному разу и пытаются "думать" словами в ответе.

А эта модель:
🔵 Сначала молча думает внутри себя несколько раз (в скрытом режиме).
🔵 У неё два «мозга»: один думает медленно и о главном (высокий уровень), второй - быстро и в деталях.
🔵 Они работают вместе, как в настоящем человеческом мозге (у всех же есть раздвоение личности да?)

Из-за этого она глубоко думает, хотя сама маленькая.

🔵 Обучена всего на 40 миллиардах токенов (это в сотни раз меньше, чем у больших моделей).
🔵 Полное обучение стоит около 1000–1500 долларов и занимает 1–2 дня на мощных видеокартах.

Результаты:
🔵 Математика (MATH): 56.5%
🔵 Логика и чтение (DROP): 82.3%
🔵 Общие знания (MMLU): 60.7%
🔵 Наука и рассуждения (ARC): 81.9%

Для такой крошечной модели - это ПИЗДЕЦ АХУЕТЬ! Она обгоняет некоторые модели в 3–7 раз больше.

Плюсы

🔵

Дешёвая и доступная - любой исследователь или маленькая компания может обучить свою версию.

🔵

Экономит электричество и деньги - не нужно миллиарды долларов и тысячи видеокарт.

🔵

Хорошо думает - особенно математика, логика, задачи с шагами.

🔵

Маленькая - после сжатия весит меньше 1 ГБ, можно запустить даже на слабом компьютере или телефоне.

Вы прикиньте
Только недавно обсуждали в чате, о нейронках в телефоне и что это в далёком будущем, но по факту телефоны уже имеют 12+ RAM памяти, и можно спокойно её туда засунуть, вы даже не поймёте что там нейронка сидит)

🔵 Полностью открытая (Apache 2.0) - бери и делай что хочешь

🤡

Минусы

🔵 Пока не очень хорошо болтает как чат-бот. Это «сырая» модель, её нужно ещё доучить для нормального общения.
🔵 Лучше всего работает на английском. Русский - хуже.
🔵 Сложный код и творческие тексты - пока слабовато.
🔵 Чтобы сделать из неё удобного помощника, нужно дополнительно обучать.

Что может быть дальше? Будущее нейросетей

Это важный сигнал: «больше параметров» - не единственный путь. (Вспомним Glm 5.1 у которой 700B параметров и вес 1.5 терабайта без квантизации, что бы у себя локально её запустить вам нужно 8 видюх H200 минимум... А это около 200к баксов)

💰

В будущем мы, скорее всего, увидим:
🔵 Ещё более умные маленькие модели, которые работают на телефоне без интернета
🔵 Нейросети, которые думают глубоко внутри, а не тратят кучу токенов
🔵 Дешёвый ИИ для блогеров\криптанов\скамеров - каждый сможет сделать свою специализированную модель
🔵 Гибрид: маленькая быстрая модель + большая для сложных задач
🔵 Новая архитектура

Это как переход от огромных грузовиков к умным маленьким электрокарам. Меньше, умнее, доступнее.

Ссылки, чтобы попробовать самому:
- GitHub: https://github.com/sapientinc/HRM-Text
- HuggingFace: https://huggingface.co/sapientinc/HRM-Text-1B

Чат | Канал | Proxy

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

423 viewsedited 09:11

Grass forever

🧠 Маленькая нейронка HRM-Text-1B, которая думает как ты Есть нейросеть с всего 1 миллиардом параметров (это очень мало по сегодняшним меркам), которая решает сложные задачи почти так же хорошо, как большие модели в 3–7 раз больше неё Называется HRM-Text…

На самом деле это ебанутый прорыв будет в нейронках

ты ж прикинь если получится оптимизировать все опенсорс нейронки под эту технологию?

glm 5.1 от 1.5 терабайта сможет упасть до 300 гигов без квантизации, а то и ещё меньше.

Цены конечно не упадут на нейронки, ибо зачем цены опускать? верно? вот. но зато такие как GLM\Kimi\ollama смогут остаться в конкуренции.

Я очень доволен такими новостями

419 viewsedited 09:15

Grass forever

на базу фри доступ

426 views10:25

Grass forever

😘 ХАЛЯВА: 60 vCPU + 60GB RAM от NVIDIA на год бесплатно (DSX Air)

NVIDIA раздаёт тестовый стенд DSX Air. 10 000 бесплатных часов, можно выкрутить аж до 96 ядер и 500 ГБ. Реально жир для тестов сетей, ИИ-инфраструктуры и всего тяжёлого.

Главный косяк - пускает только с корпоративной почтой. Gmail и одноразовые сразу в бан.

Вот как забрать за 15 минут без лишних трат:

🙏 Делаем доменную почту за $1

Берём любой дешёвый домен (.xyz, .site, .space) на Namecheap / Spaceship / Tencent.
Кидаем его в Cloudflare, меняем NS.
В Email Routing создаём nvidia-admin@твойдомен и пересылаем на свой Gmail. Жмём «Add records automatically».
Всё, теперь у тебя официальная доменная почта, а письма падают в обычный ящик.

🙏 Регистрируемся у NVIDIA

Открываем инкогнито, идём на ngc.nvidia.com или dsx-air.nvidia.com.
Создаём NVIDIA Cloud Account на новую доменную почту.
Обязательно создаём Организацию (любое английское название). Без этого триал не стартует.
Жмём Start Trial → забираем 10 000 часов.

⚠️ Важные моменты, чтобы не потерять акк:
🔵 Каждые 7 дней нужно вручную продлевать подписку.
🔵 С Cloudflare-пересылкой это делается за 5 секунд.
🔵 Ресурсы считают в кредитах (1 vCPU/час = 1 кредит). Если поднимешь 96 ядер — сожжёшь баланс быстро. Убивай неиспользуемые лабы сразу.

🔗 Ссылка на регистрацию: dsx-air.nvidia.com

Чат | Канал | Proxy

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7

554 viewsedited 10:29

Grass forever

Опять в чатике гемы закидывают, а вы ещё даже не вступили

https://t.iss.one/+i1wyZkzD9Ek4ZTU6

👍51

496 views11:05

Grass forever

Утречко всем

101

479 views07:05

Grass forever

🤟

🙏 У вас есть GLM, но он не видит ваши картинки?

GLM сам по себе - пиздатая модель, но без vision-модуля. (он не видит картиночки совсем)
Чтобы он мог анализировать скрины, графики, документы и фото, нужно отдавать ему текстовое описание изображения. Это делается через внешний vision-провайдер, который превращает картинку в текст, а потом этот текст подкладывается в промпт GLM.

Самый простой и бесплатный вариант - использовать уже подключённый openai-codex (ChatGPT Plus по OAuth).

Как это работает технически:

Hermes забирает фото из Telegram → отправляет в GPT-4o через codex auth → получает подробное описание или OCR → вставляет результат в контекст GLM. GLM при этом продолжает отвечать, но уже "видит" картинку через текст

Просто включаешь toolset vision, и Hermes начинает использовать GPT-4o как внешний глаз.

Есть и другие бесплатные не-локальные варианты:

🔵 Google Gemini (через Google AI Studio / Gemini API free tier)
Gemini 1.5 Flash и Pro хорошо работают с изображениями. Бесплатный лимит generous, можно использовать для скринов и документов. Подключается как custom provider или через OpenRouter.

🔵 OpenRouter с бесплатными vision-моделями
Иногда там бывают бесплатные лимиты на Qwen-VL, LLaVA и подобные модели. Можно настроить Hermes на OpenRouter и выбрать vision-модель с нулевой или низкой стоимостью.

🔵 GLM-4V напрямую (если аккаунт Zhipu даёт бесплатные кредиты)
Сам GLM имеет vision-версию. Если у тебя есть доступ к GLM-4V через их API или платформу, можно настроить его как vision-провайдер и не тащить чужие модели.

Если codex уже подключён - начинай с него. Это самый быстрый и бесплатный путь для большинства задач в Telegram.

Документация

Чат | Канал | Proxy

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

497 viewsedited 09:43

Grass forever

кажется я собрался парсить не то что нужно...

463 viewsedited 10:33

Grass forever

Фри 100$ или я тебя наебал?

🤔

AMD бесплатно раздаёт 50 часов на MI300X 192GB.

Пока все сидят на CUDA, можно быстро получить AMD-карту (192 ГБ HBM3). ROCm + MI300X сильно выделяет, особенно если ты ищешь работу в inference, multi-vendor инфраструктуре или просто хочешь понять альтернативы CUDA.

Что дают:

🔵 $100 кредитов (~50 часов на MI300X)
🔵 1 месяц DeepLearning.AI Pro (курсы Andrew Ng)
🔵 Сертификаты AMD AI Academy
🔵 Доступ в закрытый Discord с AMD-экспертами

💰

Как забрать за 5-10 минут:

1. Регистрируйся в AMD AI Developer Program. Пиши цель примерно так: "AI prototype development, LLM inference & ROCm benchmarking"
2. В разделе Perks выбирай AMD Developer Cloud $100 (не Fireworks).
3. Через 1-3 дня приходит ссылка. Создаёшь VM на их облаке (DigitalOcean под капотом), берёшь 1x MI300X + официальный ROCm/vLLM образ.

Важно: кредит сгорает примерно за 30 дней. После работы всегда выключай и удаляй инстанс, иначе будет биллинг.

Бери, пока дают. Регистрация тут: https://www.amd.com/en/developer/ai-dev-program.html

Запусти хотя бы один инстанс, сделай vLLM. УЧУСЬ ПОКА ДАЮТ!

Чат | Канал | Proxy

Please open Telegram to view this post

VIEW IN TELEGRAM

👍51

483 views11:59

About

Blog

Apps

Platform