SimpleAGI
232 subscribers
49 photos
2 files
42 links
Здесь ты найдешь понятные лайфхаки и примеры использования LLM в повседневной жизни и бизнесе.

Подпишись, чтобы вместе шаг за шагом разбираться в технологиях, которые уже меняют наше будущее.
Download Telegram
Канал то действительно называется SimpleAGI,
Так что сегодня разбираемся, как потрогать RAG и попробовать самому поиграть с Markdown файлами.

Написал проект, с подробными комментариями, ссылками на полезные странички, постарался максимально подробно на примере продемонстрировать работу системы обращения к внешним данным.
Сплиттер,
FAISS,
модель FRIDA,
BM25s,
Ollama,

Столько интересного, мама-мия))

P.S.
Пост и проект сделан по предложению из чата.
Так что заходите и друзей приглашайте)

GitHub
12🔥74
Please open Telegram to view this post
VIEW IN TELEGRAM
10
Тут важное обновление вышло у Google Gemini.
Если у вас есть какие-то сложные задачи или объемные, то попробуйте.
Я пока что очень доволен.

Ну и жду, когда в VSCode перестанет 500 ошибка на gemini выпадать за 30 баксов в месяц)
4🔥22
Попытался восстановить промпт Gemini, а если точнее, её рассуждений перед финальным ответом.

Не сказал бы, что рассуждения идеальны, но вектор точно верный.

Как же хочется выжать хоть из какого-то решения максимум для своих задач.
3🔥21
На днях вышла Qwen3-Embedding-0.6B,
Весит 1.2 Гб

Решил сравнить её с топовой моделью для русского языка: FRIDA
Весит 3 Гб

Сравнивал на своем датасете из юридический, банковских, законодательных статьях.

Результат интересен, хоть и выборка не очень большая.

Единственное ограничение - Qwen показывает хорошие результаты только с flash_attention_2, а его не на каждую машину получится поставить
🔥43🤔21
Правильно говорят, чем больше данных, тем точнее ответ.
FRIDA всё же ТОП для своего размера в RU сегменте.

Зря хайпанул)
32🔥2🤩1
Собрал системную инструкцию для агентов в IDE.
Чисто питонячая и, как по мне, рабочая.

Кажись уже нет большой разницы на каком языке взаимодействовать с моделями, так что на русском языке.

Если кто будет пробовать, оставьте отзыв, мне прям интересно!👍
GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41🤩1
как-то очень тяжело с теорией дообучения моделей.
Надеюсь, что какая-то часть информации в голове сохранится.

Ну и хочется верить, что лучше учиться,
чем Не учиться😐
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥31
https://www.youtube.com/live/0_DjDdfqtUE
Трансляция APPLE по своим продуктам. Потенциально должны представить собственную LLM.
Может быть интересно.

Ставлю на то, что бесполезно)
🔥42👏11
Моя, в определенном смысле гордость.
Скрипт для выгрузки проекта в единый markdown файл.
Чем это полезно?

- Ты можешь собрать весь свой проект и грузануть в любую LLM которая поможет тебе в нем разобраться и завайбкодиться по самые уши.

Так же можно использовать и для других проектов, в которых нужно разобраться.

Вряд ли это из "Simple", но это безумно полезно

https://github.com/nikitaCodeSave/save_project_for_vibe/blob/main/create_all_repo_md.py
🔥522
SimpleAGI
Канал то действительно называется SimpleAGI, Так что сегодня разбираемся, как потрогать RAG и попробовать самому поиграть с Markdown файлами. Написал проект, с подробными комментариями, ссылками на полезные странички, постарался максимально подробно на примере…
В продолжение к исходному Двухступенчатому RAG,
Который рассмотрели в прошлый раз, написал чуть обновленную версию уже с полноценной логикой гибридного поиска.
Разница в том, что результаты векторного и полнотекстового поиска определяются параллельно, на выбор по двум логикам:
RRF фокус на ранги(места в топе) по двум подходам и определяет итоговый top_k чанков.

Взвешенное суммирование расстояний(преобразованных) - суммируются Скоры по каждому поиску и ранжируется уже исходя из финального скора.

Всё так же много комментариев, пояснений.
Размещен в соседней ветке, так что можно прыгать от базовой версии к гибриду.

GitHub
3🔥32
Сегодня выйдет o3 pro.

Будем тыкать с удовольствием.
Нужно только придумать под какие задачи)
1😁1
Пу-пу-пу, Приятности)
1😁2
Сегодня завершились все круги ада по повышению Грейда на работе.
Вроде бы я рад, но утверждение данного повышения, внимание(!!!), 3 месяца.

Эх бюрократия бюрократичная)
10🔥6
Надеюсь, что в канале есть весомая часть действительно далеких от глубин AI и со стороны наблюдающих.

Есть популярное в медиа мнение, что AI могут заменить работников, перестроить экономику и избавиться от слоев профессий.

Я понимаю из-за чего появляются такие новости, и как влияют кликбейтные новости на людей.
Но задница моя горит и ничего с этим не поделать.

Система мульти-агентов, которые совершают взаимодействие между моделями и совершают рабочие сценарии в роли каких-либо работников - по факту, в данный момент миф.
Огромное количество компаний автоматизирует бизнес процессы, но основная цель этой автоматизации - повысить производительность отделов, но никак не заменить.
Всё, что пытается заменить человека в b2b сфере идет в ногу с потерей стабильности и качества. Люди всё так же нужны и будут нужны в любой профессии, только лишь появляются новые инструменты для повышения КПД деятельности.

Такое развитие технологий усложняет ли поиск работы ?
Вероятно - да. Нужно набираться навыков взаимодействия с этой технологией и изучить на базовом уровне, как работать и увеличивать свою продуктивность.
Но не более того.
Из любопытного:
Разработка автоматизации решений конкретного бизнеса под замену отделов сотрудников будет стоить многих годовых расходов на "людей" и не со 100% вероятностью будет успех.
Да и такие попытки могут себе позволить только мировые гиганты.
Как правило, мы не работаем в таких компаниях, хоть и очень хочется)

То, с какими проблемами встречаются разработчики, пытаясь применить новые технологии - это кринж и смех, так что делите на 100 всё, что читаете в новостях.
105❤‍🔥322
Очень часто в локальных моделях возникают проблемы при генерации. Модель может переключиться на другой язык, как правило китайский.

Данная проблема кажется логичной, так как в обучающем датасете китайских моделей действительно много локальных данных.

Но подобной подставы от GPT o3-pro Я точно не ожидал)
10😁4
Меня долго не было, так как бегаю по собеседованиям.
Пытаюсь к каждому готовиться и собирать инфу по вакансии.

Особенность моего путешествия - попытка сменить должность. Это достаточно сложный процесс из-за вопросов, которые просто нереально ожидать и никакой GPT мне так и не помог попасть " в точку")
Впереди еще 2 собеседования в 2GIS и ВБ.

После этих собеседований, если ничего не сложится, вернусь к повышениям внутри команды и прохождений курсов по новой специальности.

Сегодня был первый этап собеса в классную команду, фидбек получу во вторник, очень хочу попасть и пройти второй этап и после расскажу(надеюсь), куда я попал и почему настолько доволен.

В целом было бы интересно узнать про ваш опыт "роста" и смены должности.
Истории успеха и небольших провалов👍
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥83🔥2👏1
Вероятно завершается моя итерация путешествий по собесам.

Посетил уйму встреч, получил опыт и чертовски устал.

Краткие выводы:
- Служба безопасности те ещё засранцы 😱

- самые требуемые навыки: деплой, построение архитектуры и логики проекта под задачу, умение быстро строить пайплайны под задачи. В меньшей степени теперь требуется глубокое понимание теории, но сессии лайв коддинга не делись. Алгоритмы нужны всё меньше - поздравляю 😎

- бизнес задачи и требования на "одинаковые" должности сильно разнятся от компании к компании и заранее подготовиться к собесу не получится.

- научился ловить дзен и перестал волноваться как перед собеседованием, так и в процессе.

Классный подход подготовки к собеседованию, это связка obsidian и какой-нибудь gpt. Разбираешься в сфере и темах с llm, пишешь заметки в папочку с собесами и реально многое запоминаешь и понимаешь.

Что можно ещё сказать?
Опыт неудач, тоже опыт)
Please open Telegram to view this post
VIEW IN TELEGRAM
106💯22🤔1