Neural Deep
7.65K subscribers
308 photos
44 videos
3 files
199 links
Head of AI redmadrobot.ru

6 лет: 0>>>Head of AI
AI Infrastructure | Production RAG

Local inference
RAG (2M+ книг)
RAG chat bot (5М+ токенов)
B2B платформа (10+ клиентов)
B2C gptdaisy.com (100k MAU)

Код, кейсы
github.com/vakovalskii | @neuraldeepchat
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Пока что единственная модель которая смогла в задачу по ТРИЗ про Марсоход

Условие:
Во время научной экспедиции на Марс, космический корабль произвёл посадку в долине. Астронавты снарядили марсоход для лучшего изучения планеты, но как только покинули корабль, столкнулись с проблемой. Дело в том, что по поверхности было сложно передвигаться - этому мешали многочисленные холмы, ямы, большие камни. На первом же склоне колёсный вездеход с надувными шинами перевернулся на бок. С этой проблемой астронавты справились - они прицепили снизу груз, что усилило устойчивость машины, но стало причиной новой проблемы
- груз задевал неровности, что усложняло движение. Итак, что нужно сделать, чтобы повысить проходимость марсохода? При этом у космонавтов нет возможности изменять его конструкцию.



Решение:
Техническое противоречие сформулировано в условии задачи. Идеальный конечный результат - достичь абсолютной проходимости. При этом космонавты действуют в условиях Марса, у них нет возможности изменять конструкцию марсохода. Исходя из этого, ресурсом выступает груз. Не стоит также забывать и о законах развития технических систем, и следить за тем, чтобы изменение одной части не влияло на функционирование других элементов. Памятуя об этом, становится очевидным, что поднять груз в кабину или на крышу невозможно, так как произойдёт смещение центра тяжести и проблему решить не удастся. Спустить воздух из шин также нельзя - устойчивость немного повысится, но пострадает проходимость, усилится тряска.
Чтобы понять, как поступить с грузом, и получить сильное решение, нужно вспомнить, как мы обычно поступаем в условиях нехватки места? Стараемся разместить всё максимально компактно: объединить, сложить одно в другое. В ТРИЗ такой приём получил название «матрёшка». С её помощью задача про марсоход легко решаема: груз (металлические шарики, тяжёлая жидкость) нужно поместить внутрь шин. Этот способ имеет применение на практике, его предложил использовать японский изобретатель П. Шохо, для повышения устойчивости и проходимости кранов и погрузчиков.


СoT:
Изучаю проблему

Астронавты сталкиваются с трудностью передвижения по Марсу из-за неровного рельефа. Марсоход с надувными шинами не справляется, поэтому они устанавливают груз для повышения устойчивости, что приводит к новым трудностям.

Изучаю трудности

Астронавты сталкиваются с неровной почвой. Прицеп наталкивается на препятствия. Это подсказывает, что стабильность и проходимость важны.

Предлагаю улучшить пассажиропроходимость робота, решив проблему с гравитацией.

Преодолевая препятствия

Я размышляю о том, как улучшить проходимость ровера без изменения его конструкции. Перевести груз на другое место, которое бы понизило центр тяжести и не мешало движению по неровной местности.

Ищу решения

Пытаюсь перераспределить нагрузку, использовать тросы или кабели для стабилизации роувера.

Ищу оптимальные решения

Рассматриваю возможность планирования маршрута для повышения проходимости роувера, привлечения дополнительной стабильности и уменьшения веса.

Перемещение груза

Я думаю о том, что может быть целесообразным перемещать груз на нижние стороны автомобиля, чтобы снизить центр тяжести, избегая при этом контакта с землей.

Перераспределяю груз

Астронавты могут улучшить проходимость марсохода, перераспределяя вес, чтобы снизить центр тяжести, не меняя его конструкцию.

Ищу новые подходы

Пожалуй, рассматриваю снижение центра тяжести автомобиля, спуская шины или заполняя их жидкостью.

Заполняю шины песком

Астронавты заполняют надувные шины марсохода песком или реголитом. Это помогает снизить центр тяжести, увеличить стабильность и избежать прикасания груза к неровной поверхности.



На данный момент это единственная модель, которая смогла справиться с задачей по ТРИЗ. Самое крутое — это видимость цепочки Chain of Thought (CoT) рассуждений

Ну и на фоне этого OpenAI ведет переговоры о привлечении от инвесторов $6,5 млрд при оценке более чем в $150 млрд.

Компания TikTok: она оценивалась в $268 млрд. На втором месте — SpaceX, которая в декабре 2023 года оценивалась в $180 млрд.
🔥8
Нашел окно провести kick off встречу по RAG интенсиву на следующей неделе
17 Сентября вторник в 11:30
все кто записался получат приглашение
Запись для тех кто не сможет подключится пришлем отдельно

Так же нарезки выложу отдельно в канал

#intensive
10🔥16
Forwarded from Data Secrets
Буквально каждый из нас сегодня:
🔥92
Утечка дорожной карты по достижению AGI от OpenAI

OpenAI представила пятиуровневую систему достижения AGI. Вот как выглядит этот путь:

1. Уровень 1: Чат-боты — ИИ с разговорным языком.
2. Уровень 2: Рассуждения — Решение проблем на уровне человека.
3. Уровень 3: Агенты — Системы, способные выполнять действия.
4. Уровень 4: Инноваторы — ИИ, помогающий в изобретениях.
5. Уровень 5: Организации — ИИ, выполняющий работу целой компании.

С релизом o1 мы находимся на пороге Уровня 2.

Следующий большой шаг может означать ИИ, умнее вашего самого гениального друга.

Последние 10 лет стоим на пороге открытия AGI 😂
🔥7😁3
Посвящается моим друзьям которые занимаются CV
😁117
Уже завтра стартует первый онлайн звонок по Self RAG

Все кто успел записаться в августе в первый поток получили приглашения на почту жду вас там проведем вводную встречу!

#RAG #intensive
🔥115
Media is too big
VIEW IN TELEGRAM
RAG что это?

Не кидайте тапками, я пробую такой формат первый раз!

Как и обещал, присылаю полную запись сегодняшнего интро по Self RAG. Мы начали с самого простого: что такое RAG и как он работает!

На следующем занятии мы рассмотрим, как создать такой RAG на базе нашей платформы в режиме онлайн. В будущем я планирую сделать полноценный интеснив по созданию RAG с нуля – от аренды виртуальной машины до запуска Lama-3.1 под vllm.

Как сказал один из участников сегодняшнего интенсива:

"Вы первый, кто не льет воду про RAG и реально рассказываете, как оно работает."

И действительно, я просмотрел множество курсов про RAG и LLM агентов, и у меня возникло легкое раздражение.

Информацию берут либо текст от ChatGPT или из статей Azure, либо, на худой конец, попробовали "Ассистентов от ChatGPT" и считают что это можно упаковывать и распространять в массы.

Мой опыт подтверждается реализованными кейсами, разработанной платформой и огромным количеством проведенных экспериментов.

На вопросы из из файла текста чата вы найдете ответы в конце видео!

Дисклеймер
Все, что вы увидите и услышите в данном видео, является моим личным мнением, основанным на опыте работы с проектами, клиентами и реализации платформы. Мои советы и рекомендации могут не подойти для всех ситуаций и не претендуют на абсолютную истину. Перед тем как принять какое-либо решение, настоятельно рекомендуется провести собственное исследование и проконсультироваться с профессионалами в вашей области.


P.S
Вам я предоставил очень сумбурный, но очень подробный технический ввод про то, что такое RAG!

А всем, кто заинтересовался, пишите в комментариях – интенсив абсолютно бесплатный. Записывайтесь на следующую волну.

#intensive
50🔥2711👍93
Привет! Тут свежие новости: Runway и Luma AI запустили API для создания видео. Теперь у всех есть доступ к API Luma AI, которая позволяет делать видео из текста или картинок. Это стоит всего ~0.4$ за пятисекундное видео 720p.

И главное: скоро вы сможете пользоваться этим в @fastpixel_bot! Нахожусь в процессе подсчёта экономики для LumaAI

Ranway пока только по запросу выдает доступ =(

Подробнее читайте здесь: https://the-decoder.com/runway-and-luma-ai-release-apis-for-ai-video-generation/
👍84🔥3
Neural Deep
Привет! Тут свежие новости: Runway и Luma AI запустили API для создания видео. Теперь у всех есть доступ к API Luma AI, которая позволяет делать видео из текста или картинок. Это стоит всего ~0.4$ за пятисекундное видео 720p. И главное: скоро вы сможете пользоваться…
This media is not supported in your browser
VIEW IN TELEGRAM
LumaAI API

Жесткая экономика от Luma AI: за 4 видео, одно из которых не удалось, с меня сняли 700 рублей за API. Да, я генерировал видео в формате Full HD продолжительностью 5 секунд.

В интерфейсе можно купить подписку за 30 долларов и получить 120 генераций, что в пересчете составляет примерно 25 рублей за видео. API кусается по цене чуть сильнее

API опробовано. Начинаю встраивать в бота платежи и генерацию видео из изображений!
👍8😁42
Automatic для меня теперь в прошлом
Теперь я все собираю на СomfyUI
Тут кстати эксперименты с IP adapter + FLUX

workflow и ссылка на модели в комментариях
🔥11👍6
Еще сегодня провожу эксперименты по локальной анимации

Запустил на своей 4090 скажу я так что в целом за 9 минут генерации я получил то что хотел)

Как советовали мне в комментариях собрал этот репо себе локально
https://huggingface.co/THUDM/CogVideoX-5b-I2V

В целом результатом я доволен
10🔥8👍64
OpenAI завершает очередной раунд финансирования на сумму $6,5 миллиарда

OpenAI, ведущий стартап в области искусственного интеллекта, завершает очередной раунд финансирования на сумму $6,5 миллиарда, сообщает Bloomberg. Инвесторы ожидают узнать в пятницу, станет ли их участие в сделке возможным, согласно источникам, знакомым с ситуацией.

Раунд финансирования оказался переподписанным, то есть сумма заявок от инвесторов превышает сумму, которую компания готова принять. Со слов источников, пожелавших остаться анонимными, спрос на участие в инвестиции исчисляется миллиардами долларов, и некоторые инвесторы в пятницу узнают, что не прошли отбор.

OpenAI отказалась от комментариев .

Некоторые стратегические инвесторы, включая основного партнера OpenAI - корпорацию Microsoft, а также новых участников, таких как Nvidia и Apple, скорее всего, получат возможность принять участие в сделке.

Последний раунд финансирования оценивает OpenAI в $150 миллиардов, не учитывая новой инвестиции, сообщили Bloomberg знакомые с ситуацией источники. Ранее компания оценивалась в $86 миллиардов.
👍73🔥3
Neural Deep
RAG что это? Не кидайте тапками, я пробую такой формат первый раз! Как и обещал, присылаю полную запись сегодняшнего интро по Self RAG. Мы начали с самого простого: что такое RAG и как он работает! На следующем занятии мы рассмотрим, как создать такой RAG…
Всем привет!

И так уже через 10 минут стартуем продолжение курса по RAG

Сегодня мы в режиме онлайн создадим с вами RAG через интерфейс и через код на базе нашей платформы
Загрузим и разметим данные
Создадим промпт
И протестируем телеграм бота
🔥94👍2
Media is too big
VIEW IN TELEGRAM
Ура! прошел наш второй интеснив по RAG

Self RAG на базе платформы NDT

Рассмотрели как загрузить данные
Как управлять промптов и какие есть настройки

Все кто был записан получили материалы и аккаунт на 3 недели

Так же рассмотрели как создать подключение через python к своему RAG
- Как выбрать модель
- Как правильно разметить данные
- Как разбить на чанки по методу "Скользящего окна"
- Как подобрать промпт под ваш RAG
- Как создать простого телеграм бота который будет отвечать по вашему RAG

#intensive
2.55K🔥176
*треск костра*
😁105
"Они не знают, что у нас лучшее регулирование ИИ."
😁11🔥221
Совпадение?
😁207🔥3
Тебе не нужен нетворк

Все говорят: надо расширять нетворк! Знакомиться с людьми, кофе с ними пить, с днем рождения поздравлять. А чтобы что? 🤔

Я понаехал в Москву из Сибири в 2017 году. Продавал ИТ в гос.сектор, потом делал консалтинг для корпоратов. Но в моей записной книжке не осталось ни одного министра или большого начальника из числа многих, с кем довелось поработать. Я даже пробовал такой нетворк проворачивать. Вот знаешь человека по работе, зовешь его на кофе, встречаетесь, глядите друг на друга, а разговора содержательного не получается. Потому что и сказать особо нечего.

Почему так? Да потому что нет содержания, которое можно положить в ядро этой коммуникации. А люди без содержания и позиции мало кому интересны, кофе тут не поможет. У меня есть парочка таких нетворкеров в окружении, регулярно зовут куда-нибудь повстречаться. Я пару раз сходил, больше не хожу. Потому что не интересно.

Но даже если есть содержание, его надо куда-то положить. Должна быть готовность человека с тобой это содержание обсуждать. Это значит, у вас должен быть определенный бэкграунд, который эту готовность формирует с обоих сторон. И я не знаю другого способа этим бэкграундом обзавестись, кроме как с человеком какое-то дело вместе поделать. Чтобы:

А - прояснить позиции друг друга и понять, вы на одной волне, или нет. А то бывает так, что с человеком в одном поле **** не сядешь.
Б - прояснить супер-силы друг друга. Поработать над конкретным содержанием и посмотреть, не расходятся ли слова с делом.

Вот когда есть эти три штуки: содержание, позиция и супер-силы, тогда и нетворк есть. А всё остальное - это коллекционирование мертвых душ в записной книжке.
5👍82😁2
Всем привет! Что-то я давно не писал лонгридов, а только пересылал посты из моего наблюдения.

И накопилось порядком много тем которые я прорабатывал последний месяц, вот пришел спросить у вас, что вам было бы интересно почитать.
Проголосовать можно в комментариях про что рассказать первым

1) Эксперименты с этой статьей, а именно Контекстуальный RAG (честно, гибридный поиск примерно так же дает по приросту качества bm25 + vector но добавлена контекстуальная разметка)

2) Провел полный цикл разработки агентского GuardRails (кратко: защитник от галлюцинаций в RAG)

3) Провел эксперименты с продуктом на базе FLUX + Luma и собрал интересную статистику

4) Развернул-таки Llama-3.2-11B-Vision на одной 4090 FP16

5) Собрал мультиагентную сеть супервизора с RAG агента, SQL агента + Response агента на базе vllm + lm-format-enforcer, и фишка тут, наверное, что все локально на llama-70b

6) Доработал свою систему тестирования RAGAS на базе локального агента llama-70-b, получил хорошую визуализацию и отчеты

О, ну и самое главное, что в написании кода и решение всех рабочих задач я переехал на Claude-3.5-sonnet, про это тоже отдельно расскажу.
5510🔥7👍1