Forwarded from Data Secrets
Понравилось новое эссе знаменитой Фей-Фей Ли о пространственном интеллекте
Пространственный интеллект – это как раз то, чего, по мнению ученой, так не хватает современным LLM. Да, они хорошо работают с текстом, но spatial intelligence – это следующий шаг. Это про способность воспринимать, понимать, рассуждать о пространстве, объектах, движении и взаимодействии предметов.
Ли пишет, что именно связка восприятие-действие (perception + action) с самого начала эволюции лежала в основе интеллекта у живых существ. Другими словами, это база, без которой настоящий интеллект существовать не может.
В общем, пока у нас не появятся реально качественные world models (привет Лекуну!), AGI нам не видать. А «реально качественные» – это значит обладающие следующими свойствами:
1. Генеративность. Модель должна уметь создавать целые связные и правдоподобные с точки зрения физики сцены или миры.
2. Мультимодальность. Тут все понятно.
3. Интерактивность. Это должен быть не пассивный генератор, а модель, которая изменяет состояние мира и может предсказать последствия, если агент совершает какое-то действие.
По описанию напоминает Genie. И да, это и должно быть что-то подобное, но все-таки концептуально более продуманное и точное. Ли пишет, что сейчас на достаточном уровне не решена даже сама постановка задачи: это должно быть что-то универсальное, типа предсказания следующего токена, но для пространства.
Почитать полностью советуем тут
Пространственный интеллект – это как раз то, чего, по мнению ученой, так не хватает современным LLM. Да, они хорошо работают с текстом, но spatial intelligence – это следующий шаг. Это про способность воспринимать, понимать, рассуждать о пространстве, объектах, движении и взаимодействии предметов.
Ли пишет, что именно связка восприятие-действие (perception + action) с самого начала эволюции лежала в основе интеллекта у живых существ. Другими словами, это база, без которой настоящий интеллект существовать не может.
В общем, пока у нас не появятся реально качественные world models (привет Лекуну!), AGI нам не видать. А «реально качественные» – это значит обладающие следующими свойствами:
1. Генеративность. Модель должна уметь создавать целые связные и правдоподобные с точки зрения физики сцены или миры.
2. Мультимодальность. Тут все понятно.
3. Интерактивность. Это должен быть не пассивный генератор, а модель, которая изменяет состояние мира и может предсказать последствия, если агент совершает какое-то действие.
По описанию напоминает Genie. И да, это и должно быть что-то подобное, но все-таки концептуально более продуманное и точное. Ли пишет, что сейчас на достаточном уровне не решена даже сама постановка задачи: это должно быть что-то универсальное, типа предсказания следующего токена, но для пространства.
Почитать полностью советуем тут
👍2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Вайб-кодинг веб дизайна от Gemini 3.0 ⚡️⚡️⚡️
prompt: make a swiss design inspired website
Вайб-кодинг веб дизайна от Gemini 3.0 ⚡️⚡️⚡️
prompt: make a swiss design inspired website
⚡5❤3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Еще одна крутая svg анимация, сгенерированная Gemini 3.0 ✨
Еще одна крутая svg анимация, сгенерированная Gemini 3.0 ✨
❤5👍2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #ЛабораторияИИ #PIKAIDAY
14 ноября прошло наше внутреннее мероприятие PIK AI Day
Это было очень атмосферное увлекательное путешествие в мир AI технологий, теории и практики ⚡️⚡️⚡️
Спасибо всем, было очень круто ✨
P.S. Если вам интересно узнать подробности или заглянуть внутрь лекций, то жду лайки 🙂
14 ноября прошло наше внутреннее мероприятие PIK AI Day
Это было очень атмосферное увлекательное путешествие в мир AI технологий, теории и практики ⚡️⚡️⚡️
Спасибо всем, было очень круто ✨
P.S. Если вам интересно узнать подробности или заглянуть внутрь лекций, то жду лайки 🙂
❤31⚡13👍10🥱1
#unrealneural
Сравниваем генерации Gemini 2.5 pro и Gemini 3.0
Prompt:
Сравниваем генерации Gemini 2.5 pro и Gemini 3.0
Prompt:
Create a SVG of IPhone 16 Purple color🔥4👍1🥰1😱1
#unrealneural
3D объекты можно превратить в редактируемый код ⚡️⚡️⚡️
MeshCoder преобразует облака точек в скрипты Blender Python.
https://github.com/InternRobotics/MeshCoder
3D объекты можно превратить в редактируемый код ⚡️⚡️⚡️
MeshCoder преобразует облака точек в скрипты Blender Python.
https://github.com/InternRobotics/MeshCoder
16⚡3👍2🤣1
Forwarded from ИИ и роботы в стройке
Media is too big
VIEW IN TELEGRAM
Илон Маск заявил, что через 20 лет, возможно, можно будет скопировать ваше сознание и загрузить его в робота Tesla Optimus с помощью чипа Neuralink
Это будете не вы, а ваш бессмертный двойник с почти идентичной личностью. Но нужен прорыв.
Слышите, айтишники и робототехники? Нам всем нужен прорыв😁
Это будете не вы, а ваш бессмертный двойник с почти идентичной личностью. Но нужен прорыв.
Слышите, айтишники и робототехники? Нам всем нужен прорыв😁
🥴7⚡3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Qwen-Edit-2509-Multi-angle lighting LoRA
Управляем освещением на изображении 💥
https://huggingface.co/dx8152/Qwen-Edit-2509-Multi-Angle-Lighting
Qwen-Edit-2509-Multi-angle lighting LoRA
Управляем освещением на изображении 💥
https://huggingface.co/dx8152/Qwen-Edit-2509-Multi-Angle-Lighting
👍3🔥2
Forwarded from МАТЕРИЯ
To the Moon and Back
Мероприятие пройдёт 28 ноября в 19:00 в лектории 4 этажа Центра «Зотов» — на английском языке с доступом к синхронному переводу для желающих.
Вход свободный, по регистрации.
#материя_события
| | |
◻️ Materia.city
Материя и Центр «Зотов» приглашают на лекцию корейского архитектора Мун Хуна "To the Moon and Back" про смелость, отсутствие рамок и фантазию в архитектуре.
Мун Хун известен умением размывать традиционные границы архитектуры, сочетать и смешивать её с другими дисциплинами для создания собственного нового языка. Его проекты отличаются необычными формами, материалами и неожиданным символизмом.На лекции Мун Хун представит свои рисунки и покажет, какой путь они проходят от скетчбука до реальных архитектурных проектов по всему миру. После лекции состоится круглый стол с участием креативного директора Материи Андрея Фомичёва, на котором поговорим о видах архитектурного мышления.Мероприятие пройдёт 28 ноября в 19:00 в лектории 4 этажа Центра «Зотов» — на английском языке с доступом к синхронному переводу для желающих.
Вход свободный, по регистрации.
#материя_события
| | |
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡3❤1👍1
#unrealneural
Микроскопические волокна в тканях имеют решающее значение для понимания заболеваний, но их изучение было сложным. Исследователи из Стэнфордского медицинского университета разработали простой способ их визуализации.
brnw.ch/21wXwrP
Микроскопические волокна в тканях имеют решающее значение для понимания заболеваний, но их изучение было сложным. Исследователи из Стэнфордского медицинского университета разработали простой способ их визуализации.
brnw.ch/21wXwrP
👍4❤2🔥1👌1
Forwarded from Институт AIRI
Учёные Института AIRI создали открытую платформу VLA Arena, чтобы исследователи, инженеры и даже любители могли сравнивать и оценивать современные модели управления роботами ⤵️
VLA Arena поддерживает компактные манипуляторы, доступные для самостоятельной сборки или в готовом виде, которые используются в образовательных и исследовательских целях.
На платформе можно:
⚫️ Тестировать модели в симуляции и на реальных роботах
⚫️ Следить за объективной таблицей лидеров с оценками пользователей
⚫️ Поддерживать модели с открытым исходным кодом, включая адаптированные для русского языка версии
⚫️ Найти датасеты и инструменты для обучения собственных моделей
Первый запуск платформы продлится три месяца.
📎 VLA Arena доступна по ссылке.
VLA Arena поддерживает компактные манипуляторы, доступные для самостоятельной сборки или в готовом виде, которые используются в образовательных и исследовательских целях.
На платформе можно:
Первый запуск платформы продлится три месяца.
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #вайбпроектирование
От вайб-кодинга к вайб-проектированию
Все уже знакомы с таким понятием как вайб-кодинг, когда ты программируешь через диалог с ИИ, правя результат маленькими шагами в живом режиме. Этот подход очень актуален, возможно даже самый эффективный способ использования языковых моделей.
Ключевые признаки трушного вайб-кодинга по А.Карпатому:
1. Работа через разговор, а не через ТЗ
2. Микро-итерации: написал промпт -> посмотрел результат -> написал промпт и т.д.
3. ИИ Модель сама предлагает следующий шаг
4. Всё работает в реальном времени, без перезапусков
5. ИИ - активный напарник, а не инструмент
6. Есть ошибка - загрузил в контекст и исправляешь тоже с помощью ИИ
Если перенести этот подход на архитектурное проектирование, моделирование - получается «вайб-проектирование»: когда архитектор "разговаривает" с ИИ прямо внутри 3D-сцены и моделирует через диалоговое окно, имеет возможность менять как всю сцену так и отдельные ее части, подгружать ошибки формы и менять их.
Реальные инструменты вайб-кодинга подразумевают вмешательство в процесс и переход на классическое программирование. Подобное предусматривают и существующие попытки реализовать подобное в проектировании. Snaptrude, Twinmaster и MCP плагины для программ 3д моделирования.
От вайб-кодинга к вайб-проектированию
Все уже знакомы с таким понятием как вайб-кодинг, когда ты программируешь через диалог с ИИ, правя результат маленькими шагами в живом режиме. Этот подход очень актуален, возможно даже самый эффективный способ использования языковых моделей.
Ключевые признаки трушного вайб-кодинга по А.Карпатому:
1. Работа через разговор, а не через ТЗ
2. Микро-итерации: написал промпт -> посмотрел результат -> написал промпт и т.д.
3. ИИ Модель сама предлагает следующий шаг
4. Всё работает в реальном времени, без перезапусков
5. ИИ - активный напарник, а не инструмент
6. Есть ошибка - загрузил в контекст и исправляешь тоже с помощью ИИ
Если перенести этот подход на архитектурное проектирование, моделирование - получается «вайб-проектирование»: когда архитектор "разговаривает" с ИИ прямо внутри 3D-сцены и моделирует через диалоговое окно, имеет возможность менять как всю сцену так и отдельные ее части, подгружать ошибки формы и менять их.
Реальные инструменты вайб-кодинга подразумевают вмешательство в процесс и переход на классическое программирование. Подобное предусматривают и существующие попытки реализовать подобное в проектировании. Snaptrude, Twinmaster и MCP плагины для программ 3д моделирования.
👍3🔥1👏1