SimpleAGI – Telegram

SimpleAGI

232 subscribers

49 photos

2 files

43 links

Здесь ты найдешь понятные лайфхаки и примеры использования LLM в повседневной жизни и бизнесе.

Подпишись, чтобы вместе шаг за шагом разбираться в технологиях, которые уже меняют наше будущее.

Download Telegram

About

Blog

Apps

Platform

232 subscribers

Только-только закрыл рабочий ноут.

А всему причина мысль(идея) сотрудника на работе, что можно сделать имитацию вопросов по документации и имитацию ответов похожие на боевые вопросы сотрудников во время работы.

Мол такое тестирование не займет много времени, но можно будет уже оттолкнуться по расчету метрик.

Ух каким я чудом пытался добиться от модели список вопросов и ответов по документу в формате json, которые еще и будет корректно парситься.

На малом объеме документов получилось выполнить задачу через цепочку из двух запросов по документу и все ради того, чтоб вывод был структурированный. Ведь наша модель не умеет в SO.

Всем спасибо, доброй ночи

1❤4

142 views20:37

Дошел до того, что пришлось обновить мышку, а то кисть болит.

Кажется я буду очень долго привыкать.
Ничего не понятно, но очень интересно.

❤3🔥1

142 views19:50

Наконец-то поставил vllm на свою NVIDIA 5090! Делюсь пошаговой инструкцией в своём стиле – чтобы вы не наступали на грабли и сразу начали тестить модели.

1. Создаём локальную среду

python3 -m venv .venv
source .venv/bin/activate

2. Устанавливаем ночную сборку PyTorch

pip3 install --pre torch torchvision torchaudio \
  --index-url https://download.pytorch.org/whl/nightly/cu128

3. Клонируем репозиторий vllm

git clone https://github.com/vllm-project/vllm.git
cd vllm

4. Собираем и устанавливаем vllm

python use_existing_torch.py
pip install -r requirements/build.txt
export MAX_JOBS=6     # подберите под своё железо, без этого — риск зависаний
pip install --no-build-isolation -e .

5. Организуем структуру проекта

/home/nikita/PROJECTS/
├── my_project/      # ваш основной проект
└── vllm/            # клон репозитория vllm
    ├── vllm/        # исходники библиотеки
    ├── setup.py
    └── …

Так удобно держать всё раздельно и подключать vllm как локальный пакет.

⏱️ Установка заняла у меня ~20 минут. Чертовски рад, теперь можно запускать агентов и гонять модели.

⌨️

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4❤3😱1

197 views13:41

в этой картинке 10 часов времени. Томный субботний день.
Надеюсь, что вы "веселитесь" иначе.

🔥72

182 views18:32

Я тут пропал на долго. Сначала пытался проект выше довести до ума и даже что-то получилось.

API сервис по работе с локальными LLM
Есть возможность загружать модели с HF в хранилище.
Выбирать модель для инициализации.
Выгружать модель из памяти.
Передавать вопросы, как с chat_template, так и просто текстом.

В целом доволен, Я умничка 😎

А для работы сделал:
Бот в корп. месседжере для сотрудников
- html файлы конвертирует в Markdown,
- Из .md через LLM создает базу вопросов и ответов по документации.
- Заполняет 2 JSON базы со связью между вопросами и путями до файлов.
- Проверяет все дубликаты файлов и не обрабатывает их.
- Обновляет файлы если они изменились.
- Пользователь прям из бота может загрузить новый html файл и он попадет в базу.
- И сам RAG , хоть и простенький, но достаточный.
- Пользователь задает вопрос по документациям - бот отвечает исходя из контекста.

Надеюсь этот ад скоро закончится.
С понедельника отпуск и жду его как никогда)

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥3🔥3❤21

148 views18:55

Канал то действительно называется SimpleAGI,
Так что сегодня разбираемся, как потрогать RAG и попробовать самому поиграть с Markdown файлами.

Написал проект, с подробными комментариями, ссылками на полезные странички, постарался максимально подробно на примере продемонстрировать работу системы обращения к внешним данным.
Сплиттер,
FAISS,
модель FRIDA,
BM25s,
Ollama,

Столько интересного, мама-мия))

P.S.
Пост и проект сделан по предложению из чата.
Так что заходите и друзей приглашайте)

GitHub

GitHub - nikitaCodeSave/SimpleAgi_RAG

Contribute to nikitaCodeSave/SimpleAgi_RAG development by creating an account on GitHub.

12🔥7❤4

152 viewsedited 04:47

Please open Telegram to view this post

VIEW IN TELEGRAM

10

05:21

Тут важное обновление вышло у Google Gemini.
Если у вас есть какие-то сложные задачи или объемные, то попробуйте.
Я пока что очень доволен.

Ну и жду, когда в VSCode перестанет 500 ошибка на gemini выпадать за 30 баксов в месяц)

‎Google Gemini

Meet Gemini, Google’s AI assistant. Get help with writing, planning, brainstorming, and more. Experience the power of generative AI.

❤4🔥22

133 views18:33

Попытался восстановить промпт Gemini, а если точнее, её рассуждений перед финальным ответом.

Не сказал бы, что рассуждения идеальны, но вектор точно верный.

Как же хочется выжать хоть из какого-то решения максимум для своих задач.

3🔥2❤1

143 views19:17

На днях вышла Qwen3-Embedding-0.6B,
Весит 1.2 Гб

Решил сравнить её с топовой моделью для русского языка: FRIDA
Весит 3 Гб

Сравнивал на своем датасете из юридический, банковских, законодательных статьях.

Результат интересен, хоть и выборка не очень большая.

Единственное ограничение - Qwen показывает хорошие результаты только с flash_attention_2, а его не на каждую машину получится поставить

🔥43🤔21

185 viewsedited 13:56

Правильно говорят, чем больше данных, тем точнее ответ.
FRIDA всё же ТОП для своего размера в RU сегменте.

Зря хайпанул)

3❤2🔥2🤩1

149 views19:52

Собрал системную инструкцию для агентов в IDE.
Чисто питонячая и, как по мне, рабочая.

Кажись уже нет большой разницы на каком языке взаимодействовать с моделями, так что на русском языке.

Если кто будет пробовать, оставьте отзыв, мне прям интересно!👍
GitHub

Please open Telegram to view this post

VIEW IN TELEGRAM

Instruction_copilot/big_python_06_2025.md at main · nikitaCodeSave/Instruction_copilot

Описания инструкция для работы с проектом используя агента - nikitaCodeSave/Instruction_copilot

🔥4❤1🤩1

156 views05:56

как-то очень тяжело с теорией дообучения моделей.
Надеюсь, что какая-то часть информации в голове сохранится.

Ну и хочется верить, что лучше учиться,
чем Не учиться😐

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥31

146 views05:38

https://www.youtube.com/live/0_DjDdfqtUE
Трансляция APPLE по своим продуктам. Потенциально должны представить собственную LLM.
Может быть интересно.

Ставлю на то, что бесполезно)

WWDC 2025 — June 9 | Apple

Watch the WWDC25 keynote introducing our broadest design update ever and a more helpful Apple Intelligence. You’ll also learn about exciting features coming with iOS 26, iPadOS 26, macOS 26, watchOS 26, visionOS 26, and tvOS 26.

To watch the event interpreted…

🔥42👏11

152 views17:03

эйай ньюз

Самая интересная ИИ фича с WWDC — Foundation Models Framework Apple теперь дают доступ к LLM в Apple Intelligence сторонним разработчикам. Хоть и LLM у эппла не лучшие, но они доступны оффлайн, на куче устройств и абсолютно бесплатно. Из фич в фреймворке…

А вот это интересно. Чего, а вот настолько "open Source" от Apple никто не ожидал.

🤯2

142 views19:41

Моя, в определенном смысле гордость.
Скрипт для выгрузки проекта в единый markdown файл.
Чем это полезно?

- Ты можешь собрать весь свой проект и грузануть в любую LLM которая поможет тебе в нем разобраться и завайбкодиться по самые уши.

Так же можно использовать и для других проектов, в которых нужно разобраться.

Вряд ли это из "Simple", но это безумно полезно

https://github.com/nikitaCodeSave/save_project_for_vibe/blob/main/create_all_repo_md.py

save_project_for_vibe/create_all_repo_md.py at main · nikitaCodeSave/save_project_for_vibe

Contribute to nikitaCodeSave/save_project_for_vibe development by creating an account on GitHub.

🔥5❤22

143 views21:22

Канал то действительно называется SimpleAGI, Так что сегодня разбираемся, как потрогать RAG и попробовать самому поиграть с Markdown файлами. Написал проект, с подробными комментариями, ссылками на полезные странички, постарался максимально подробно на примере…

В продолжение к исходному Двухступенчатому RAG,
Который рассмотрели в прошлый раз, написал чуть обновленную версию уже с полноценной логикой гибридного поиска.
Разница в том, что результаты векторного и полнотекстового поиска определяются параллельно, на выбор по двум логикам:
RRF фокус на ранги(места в топе) по двум подходам и определяет итоговый top_k чанков.

Взвешенное суммирование расстояний(преобразованных) - суммируются Скоры по каждому поиску и ранжируется уже исходя из финального скора.

Всё так же много комментариев, пояснений.
Размещен в соседней ветке, так что можно прыгать от базовой версии к гибриду.

GitHub

GitHub - nikitaCodeSave/SimpleAgi_RAG at hybrid-search

Contribute to nikitaCodeSave/SimpleAgi_RAG development by creating an account on GitHub.

❤3🔥32

160 views14:02

Сегодня выйдет o3 pro.

Будем тыкать с удовольствием.
Нужно только придумать под какие задачи)

1😁1

160 views18:39

Собрал системную инструкцию для агентов в IDE. Чисто питонячая и, как по мне, рабочая. Кажись уже нет большой разницы на каком языке взаимодействовать с моделями, так что на русском языке. Если кто будет пробовать, оставьте отзыв, мне прям интересно!👍 GitHub

Очередное обновление промпта для агентов в IDE, попытка найти тот самый, чтоб агент помогал решать проблемы, а не создавал новые)

Новый подход с отсылками на топовые модели и общие, но важные правила.
В целом, выглядит, как плакат в опенспейсе)

GitHub

Instruction_copilot/rus_python_10-06-2025.md at main · nikitaCodeSave/Instruction_copilot

Описания инструкция для работы с проектом используя агента - nikitaCodeSave/Instruction_copilot

1🔥2😁1🤣1

189 views19:57

Пу-пу-пу, Приятности)

1😁2

174 views20:23

Сегодня завершились все круги ада по повышению Грейда на работе.
Вроде бы я рад, но утверждение данного повышения, внимание(!!!), 3 месяца.

Эх бюрократия бюрократичная)

10🔥6

144 views15:56