Forwarded from Институт AIRI
Учёные Института AIRI создали открытую платформу VLA Arena, чтобы исследователи, инженеры и даже любители могли сравнивать и оценивать современные модели управления роботами ⤵️
VLA Arena поддерживает компактные манипуляторы, доступные для самостоятельной сборки или в готовом виде, которые используются в образовательных и исследовательских целях.
На платформе можно:
⚫️ Тестировать модели в симуляции и на реальных роботах
⚫️ Следить за объективной таблицей лидеров с оценками пользователей
⚫️ Поддерживать модели с открытым исходным кодом, включая адаптированные для русского языка версии
⚫️ Найти датасеты и инструменты для обучения собственных моделей
Первый запуск платформы продлится три месяца.
📎 VLA Arena доступна по ссылке.
VLA Arena поддерживает компактные манипуляторы, доступные для самостоятельной сборки или в готовом виде, которые используются в образовательных и исследовательских целях.
На платформе можно:
Первый запуск платформы продлится три месяца.
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #вайбпроектирование
От вайб-кодинга к вайб-проектированию
Все уже знакомы с таким понятием как вайб-кодинг, когда ты программируешь через диалог с ИИ, правя результат маленькими шагами в живом режиме. Этот подход очень актуален, возможно даже самый эффективный способ использования языковых моделей.
Ключевые признаки трушного вайб-кодинга по А.Карпатому:
1. Работа через разговор, а не через ТЗ
2. Микро-итерации: написал промпт -> посмотрел результат -> написал промпт и т.д.
3. ИИ Модель сама предлагает следующий шаг
4. Всё работает в реальном времени, без перезапусков
5. ИИ - активный напарник, а не инструмент
6. Есть ошибка - загрузил в контекст и исправляешь тоже с помощью ИИ
Если перенести этот подход на архитектурное проектирование, моделирование - получается «вайб-проектирование»: когда архитектор "разговаривает" с ИИ прямо внутри 3D-сцены и моделирует через диалоговое окно, имеет возможность менять как всю сцену так и отдельные ее части, подгружать ошибки формы и менять их.
Реальные инструменты вайб-кодинга подразумевают вмешательство в процесс и переход на классическое программирование. Подобное предусматривают и существующие попытки реализовать подобное в проектировании - Snaptrude, Twinmaster и MCP плагины для программ 3д моделирования.
От вайб-кодинга к вайб-проектированию
Все уже знакомы с таким понятием как вайб-кодинг, когда ты программируешь через диалог с ИИ, правя результат маленькими шагами в живом режиме. Этот подход очень актуален, возможно даже самый эффективный способ использования языковых моделей.
Ключевые признаки трушного вайб-кодинга по А.Карпатому:
1. Работа через разговор, а не через ТЗ
2. Микро-итерации: написал промпт -> посмотрел результат -> написал промпт и т.д.
3. ИИ Модель сама предлагает следующий шаг
4. Всё работает в реальном времени, без перезапусков
5. ИИ - активный напарник, а не инструмент
6. Есть ошибка - загрузил в контекст и исправляешь тоже с помощью ИИ
Если перенести этот подход на архитектурное проектирование, моделирование - получается «вайб-проектирование»: когда архитектор "разговаривает" с ИИ прямо внутри 3D-сцены и моделирует через диалоговое окно, имеет возможность менять как всю сцену так и отдельные ее части, подгружать ошибки формы и менять их.
Реальные инструменты вайб-кодинга подразумевают вмешательство в процесс и переход на классическое программирование. Подобное предусматривают и существующие попытки реализовать подобное в проектировании - Snaptrude, Twinmaster и MCP плагины для программ 3д моделирования.
👍5🔥1👏1
Forwarded from Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Андрей Карпатый высказался о том, как лучше всего понимать влияние ИИ на экономику и рынок труда.
Недавно он жестко высказался про агенты, AGI и тд.
Экс-глава AI в Tesla и со-основатель OpenAI говорит, что самые популярные аналогии (ИИ = электричество, ИИ = промышленная революция и т.д.) не самые точные.
По его мнению, самая сильная и точная аналогия — это то, что современный ИИ — это новая парадигма программирования, которую он много лет назад назвал Software 2.0.
Что изменилось с ИИ (Software 2.0)?
Сейчас мы больше не пишем программы вручную строчка за строчкой. Мы задаём цель, например, «максимально точно классифицировать картинки» или «получить максимальный счёт в игре» и запускаем градиентный спуск, который сам в миллиардах параметров нейронной сети находит работающую программу.
Это меняет то, какие задачи становятся автоматизируемыми.
Теперь главный вопрос уже не «смогу ли я чётко описать алгоритм?», а «смогу ли я проверить, правильно ли выполнена задача?», то есть верифицируемость.
Три ключевых условия, чтобы задача была легко автоматизируема в эпоху Software 2.0:
1. Среда должна быть перезапускаемой — можно быстро начать новую попытку.
2. Попытки должны быть быстрыми и дешёвыми.
3. Должна быть автоматическая награда/оценка.
Если эти три условия выполнены — задача обречена на сверхчеловеческий уровень автоматизации.
Примеры задач, которые идеально подходят под Software 2.0 (быстро прогрессируют):
- Математика (есть правильный ответ → легко проверить)
- Программирование (можно автоматически запустить тесты)
- Шахматы, го, StarCraft, Dota (симуляция перезапускается, есть счёт)
- Решение головоломок, CAPTCHA, доказательство теорем
- Просмотр видео до конца (YouTube точно знает, досмотрел ты или нет — это тоже верифицируемый сигнал!)
На таких задачах ИИ уже сейчас часто превосходит лучших людей на планете.
Примеры задач, которые пока отстают (потому что плохо верифицируемы):
- Творчество (как объективно оценить, что картина или рассказ «хорошие»?)
- Стратегическое мышление в реальном мире (слишком много скрытого состояния, долгосрочные последствия)
- Задачи, требующие глубокого понимания физического мира, здравого смысла, социального контекста
- Работа с реальными людьми, переговорами, эмпатией и т.д.
Для них пока приходится полагаться либо на «магию обобщения» нейронок, либо на более слабые методы вроде имитации человека.
Главный тезис Карпатого - Software 1.0 легко автоматизирует то, что ты можешь задать. Software 2.0 легко автоматизирует то, что ты можешь проверить.
Карпатый предлагает смотреть на будущее рынка труда через эту призму:
Чем больше в твоей работе задач, которые можно объективно и автоматически проверить и на которых можно «натренироваться» миллиарды раз в симуляции, тем выше вероятность, что они будут автоматизированы в ближайшие 5–10 лет.
Недавно он жестко высказался про агенты, AGI и тд.
Экс-глава AI в Tesla и со-основатель OpenAI говорит, что самые популярные аналогии (ИИ = электричество, ИИ = промышленная революция и т.д.) не самые точные.
По его мнению, самая сильная и точная аналогия — это то, что современный ИИ — это новая парадигма программирования, которую он много лет назад назвал Software 2.0.
Что изменилось с ИИ (Software 2.0)?
Сейчас мы больше не пишем программы вручную строчка за строчкой. Мы задаём цель, например, «максимально точно классифицировать картинки» или «получить максимальный счёт в игре» и запускаем градиентный спуск, который сам в миллиардах параметров нейронной сети находит работающую программу.
Это меняет то, какие задачи становятся автоматизируемыми.
Теперь главный вопрос уже не «смогу ли я чётко описать алгоритм?», а «смогу ли я проверить, правильно ли выполнена задача?», то есть верифицируемость.
Три ключевых условия, чтобы задача была легко автоматизируема в эпоху Software 2.0:
1. Среда должна быть перезапускаемой — можно быстро начать новую попытку.
2. Попытки должны быть быстрыми и дешёвыми.
3. Должна быть автоматическая награда/оценка.
Если эти три условия выполнены — задача обречена на сверхчеловеческий уровень автоматизации.
Примеры задач, которые идеально подходят под Software 2.0 (быстро прогрессируют):
- Математика (есть правильный ответ → легко проверить)
- Программирование (можно автоматически запустить тесты)
- Шахматы, го, StarCraft, Dota (симуляция перезапускается, есть счёт)
- Решение головоломок, CAPTCHA, доказательство теорем
- Просмотр видео до конца (YouTube точно знает, досмотрел ты или нет — это тоже верифицируемый сигнал!)
На таких задачах ИИ уже сейчас часто превосходит лучших людей на планете.
Примеры задач, которые пока отстают (потому что плохо верифицируемы):
- Творчество (как объективно оценить, что картина или рассказ «хорошие»?)
- Стратегическое мышление в реальном мире (слишком много скрытого состояния, долгосрочные последствия)
- Задачи, требующие глубокого понимания физического мира, здравого смысла, социального контекста
- Работа с реальными людьми, переговорами, эмпатией и т.д.
Для них пока приходится полагаться либо на «магию обобщения» нейронок, либо на более слабые методы вроде имитации человека.
Главный тезис Карпатого - Software 1.0 легко автоматизирует то, что ты можешь задать. Software 2.0 легко автоматизирует то, что ты можешь проверить.
Карпатый предлагает смотреть на будущее рынка труда через эту призму:
Чем больше в твоей работе задач, которые можно объективно и автоматически проверить и на которых можно «натренироваться» миллиарды раз в симуляции, тем выше вероятность, что они будут автоматизированы в ближайшие 5–10 лет.
X (formerly Twitter)
Andrej Karpathy (@karpathy) on X
Sharing an interesting recent conversation on AI's impact on the economy.
AI has been compared to various historical precedents: electricity, industrial revolution, etc., I think the strongest analogy is that of AI as a new computing paradigm (Software 2.0)…
AI has been compared to various historical precedents: electricity, industrial revolution, etc., I think the strongest analogy is that of AI as a new computing paradigm (Software 2.0)…
👍6❤3⚡2🤮1
Ищем образ трушного вайб-проектирования. Возможно ли создать сложную архитектурную форму только через чат, не используя инструменты редактирования?
Anonymous Poll
11%
да, сложность формы легко описывается через текстовое описание
38%
нет, текущие архитектуры ИИ не способны отразить все запросы в 3д
38%
зависит от формы, не все возможно описать текстом
13%
другое
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
MMaDA-Parallel - параллельные многомодальные модели языка с большой диффузией для редактирования и генерации изображений с использованием мышления
В отличие от последовательных методов визуальной генерации/редактирования, которые генерируют текст в изображение шаг за шагом, работа обеспечивает одновременную генерацию, где текст и изображения корректируют друг друга на каждом этапе шумоподавления. Достигается настоящая параллельность мультимодального взаимодействия.
MMaDA-Parallel-A: https://huggingface.co/tyfeld/MMaDA-Parallel-A
MMaDA-Parallel-M: https://huggingface.co/tyfeld/MMaDA-Parallel-M
MMaDA-Parallel - параллельные многомодальные модели языка с большой диффузией для редактирования и генерации изображений с использованием мышления
В отличие от последовательных методов визуальной генерации/редактирования, которые генерируют текст в изображение шаг за шагом, работа обеспечивает одновременную генерацию, где текст и изображения корректируют друг друга на каждом этапе шумоподавления. Достигается настоящая параллельность мультимодального взаимодействия.
MMaDA-Parallel-A: https://huggingface.co/tyfeld/MMaDA-Parallel-A
MMaDA-Parallel-M: https://huggingface.co/tyfeld/MMaDA-Parallel-M
⚡3👍1
Forwarded from в IT и выйти
⚡️ Gemini 3 Pro ВЫШЛА.
ИИ от Гугла — сильнейшая нейросеть по всем бенчмаркам на данный момент.
Тестим БЕСПЛАТНО здесь.
@techmedia
ИИ от Гугла — сильнейшая нейросеть по всем бенчмаркам на данный момент.
Тестим БЕСПЛАТНО здесь.
@techmedia
🤗5❤🔥2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Тестирую Gemini 3.0 Pro Preview
Проверил смогу ли повторить результат с интерактивным вентилятором в SVG, если промпт на русском.
Тестирую Gemini 3.0 Pro Preview
Проверил смогу ли повторить результат с интерактивным вентилятором в SVG, если промпт на русском.
1👍4❤🔥1⚡1👎1
Media is too big
VIEW IN TELEGRAM
⚡3❤🔥2👍1
Media is too big
VIEW IN TELEGRAM
👍3❤🔥2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Gemini 3.0 Pro Preview
Игра CAST SHADOW
https://arthiteca.github.io/casttheshadowgame/
Сделал игру в 1 промпт, давно была идея, но Gemini ее понял немножко по-другому 😃😃😃
Поделитесь в комментариях у кого получилось ее пройти
Gemini 3.0 Pro Preview
Игра CAST SHADOW
https://arthiteca.github.io/casttheshadowgame/
Сделал игру в 1 промпт, давно была идея, но Gemini ее понял немножко по-другому 😃😃😃
Поделитесь в комментариях у кого получилось ее пройти
👍4❤1⚡1
Forwarded from 🟡NeuroGraph
Media is too big
VIEW IN TELEGRAM
Google только что выпустила Gemini 3.
Это крупное обновление, которое смещает фокус с простой генерации текста на «глубокое мышление» и автономное выполнение задач.
Вот список самых главных обновлений и решений в Gemini 3, актуальных на сегодняшний день:
1. Режим «Deep Think» (Глубокое мышление)
Это, пожалуй, самое важное обновление.
Что это: Новый режим рассуждений (похожий на o1 от OpenAI), который позволяет модели "подумать" перед ответом. Она выстраивает цепочку рассуждений, проверяет гипотезы и только потом выдает результат.
Зачем нужно: Для решения сложных математических задач, написания сложного кода и научного анализа.
Google заявляет, что Gemini 3 бьет рекорды в бенчмарках MathArena Apex и Humanity's Last Exam.
Доступность: Сначала для подписчиков Ultra.
2. Генеративные интерфейсы (Generative UI) и Dynamic View
Gemini 3 больше не ограничивается текстом или картинками в чате.
Dynamic View: Если вы попросите спланировать поездку или объяснить сложную концепцию, Gemini не просто напишет текст, а сгенерирует интерактивный визуальный интерфейс (виджеты, карты, таблицы, графики), который можно нажимать и изменять прямо в диалоге.
Vibe Coding: Улучшенная способность генерировать UI/UX код, который сразу выглядит стильно и современно, а не просто функционально.
3. Платформа Google Antigravity.
Это решение для разработчиков и продвинутых пользователей (вам это может быть интересно как создателю контента).
Что это: Новая среда для создания ИИ-агентов.
Возможности: Агенты могут работать автономно: использовать терминал, браузер и редактор кода для выполнения многошаговых задач (например, «создай веб-сайт, разверни его на сервере и протестируй»).
4. Gemini Agent (Автономный помощник).
ИИ теперь может реально управлять вашими делами, а не просто давать советы. Он интегрируется с календарем, почтой и другими сервисами Google, чтобы выполнять сложные цепочки действий (например, «организуй встречу, забронируй переговорку и подготовь черновик повестки на основе моих писем»).
5. Мультимодальность нового уровня (Video & Images).
Учитывая наш интерес к видео и генеративному искусству, это ключевой пункт:
Понимание видео: Gemini 3 показывает рекордные результаты (87.6% на Video-MMMU). Модель может "смотреть" длинные видеолекции или фильмы и понимать контекст, тайминг и визуальные нюансы лучше.
Анализ: Вы можете загрузить "сырой" видеоматериал, и модель поможет смонтировать его или найти нужные кадры по смыслу, а не по тегам.
6. Производительность.
Google заявляет, что Gemini 3 Pro превосходит предыдущую версию (Gemini 2.5 Pro) по всем параметрам, при этом работая быстрее и эффективнее.
Официальный анонс ЗДЕСЬ
Это крупное обновление, которое смещает фокус с простой генерации текста на «глубокое мышление» и автономное выполнение задач.
Вот список самых главных обновлений и решений в Gemini 3, актуальных на сегодняшний день:
1. Режим «Deep Think» (Глубокое мышление)
Это, пожалуй, самое важное обновление.
Что это: Новый режим рассуждений (похожий на o1 от OpenAI), который позволяет модели "подумать" перед ответом. Она выстраивает цепочку рассуждений, проверяет гипотезы и только потом выдает результат.
Зачем нужно: Для решения сложных математических задач, написания сложного кода и научного анализа.
Google заявляет, что Gemini 3 бьет рекорды в бенчмарках MathArena Apex и Humanity's Last Exam.
Доступность: Сначала для подписчиков Ultra.
2. Генеративные интерфейсы (Generative UI) и Dynamic View
Gemini 3 больше не ограничивается текстом или картинками в чате.
Dynamic View: Если вы попросите спланировать поездку или объяснить сложную концепцию, Gemini не просто напишет текст, а сгенерирует интерактивный визуальный интерфейс (виджеты, карты, таблицы, графики), который можно нажимать и изменять прямо в диалоге.
Vibe Coding: Улучшенная способность генерировать UI/UX код, который сразу выглядит стильно и современно, а не просто функционально.
3. Платформа Google Antigravity.
Это решение для разработчиков и продвинутых пользователей (вам это может быть интересно как создателю контента).
Что это: Новая среда для создания ИИ-агентов.
Возможности: Агенты могут работать автономно: использовать терминал, браузер и редактор кода для выполнения многошаговых задач (например, «создай веб-сайт, разверни его на сервере и протестируй»).
4. Gemini Agent (Автономный помощник).
ИИ теперь может реально управлять вашими делами, а не просто давать советы. Он интегрируется с календарем, почтой и другими сервисами Google, чтобы выполнять сложные цепочки действий (например, «организуй встречу, забронируй переговорку и подготовь черновик повестки на основе моих писем»).
5. Мультимодальность нового уровня (Video & Images).
Учитывая наш интерес к видео и генеративному искусству, это ключевой пункт:
Понимание видео: Gemini 3 показывает рекордные результаты (87.6% на Video-MMMU). Модель может "смотреть" длинные видеолекции или фильмы и понимать контекст, тайминг и визуальные нюансы лучше.
Анализ: Вы можете загрузить "сырой" видеоматериал, и модель поможет смонтировать его или найти нужные кадры по смыслу, а не по тегам.
6. Производительность.
Google заявляет, что Gemini 3 Pro превосходит предыдущую версию (Gemini 2.5 Pro) по всем параметрам, при этом работая быстрее и эффективнее.
Официальный анонс ЗДЕСЬ
👍4⚡1
Forwarded from Искусственный интеллект. Высокие технологии
🇨🇳 Китай показал квантовый прорыв, который звучит слишком мощно, чтобы его игнорировать
Обычно гучные “революции в железе” пролетают мимо внимания.
Но когда такое публикует Tom’s Hardware — ресурс с репутацией — это уже совсем другой уровень.
CHIPX Lab из Китая заявляет, что создали первый промышленный, масштабируемый оптический квантовый чип, который выполняет некоторые AI-нагрузки до 1000× быстрее, чем Nvidia-GPU.
Что внутри и почему это важно:
- фотонный чип с 1000+ оптических компонентов на одной 6-дюймовой пластине
- архитектура, заявленная как масштабируемая до 1 млн кубитов
- развёртывание — недели, а не месяцы
- текущая производительность — ~12 000 пластин в год (скромно, но промышленно)
- потенциальный удар по западным планам: Nvidia и другие тоже гонят фотонные + квантовые архитектуры, но пока не показали похожего масштаба
Если эти цифры подтвердятся, это станет одним из самых серьёзных успехов Китая в гонке за квантовым превосходством — и сигналом, что фотонные квантовые чипы могут вскоре стать реальной альтернативой классическим GPU для ряда задач ИИ.
Пока многое остаётся за кадром, но сам факт публикации и заявленного уровня — уже тревожный звонок для индустрии чипов.
https://www.tomshardware.com/tech-industry/quantum-computing/new-chinese-optical-quantum-chip-allegedly-1-000x-faster-than-nvidia-gpus-for-processing-ai-workloads-but-yields-are-low
Обычно гучные “революции в железе” пролетают мимо внимания.
Но когда такое публикует Tom’s Hardware — ресурс с репутацией — это уже совсем другой уровень.
CHIPX Lab из Китая заявляет, что создали первый промышленный, масштабируемый оптический квантовый чип, который выполняет некоторые AI-нагрузки до 1000× быстрее, чем Nvidia-GPU.
Что внутри и почему это важно:
- фотонный чип с 1000+ оптических компонентов на одной 6-дюймовой пластине
- архитектура, заявленная как масштабируемая до 1 млн кубитов
- развёртывание — недели, а не месяцы
- текущая производительность — ~12 000 пластин в год (скромно, но промышленно)
- потенциальный удар по западным планам: Nvidia и другие тоже гонят фотонные + квантовые архитектуры, но пока не показали похожего масштаба
Если эти цифры подтвердятся, это станет одним из самых серьёзных успехов Китая в гонке за квантовым превосходством — и сигналом, что фотонные квантовые чипы могут вскоре стать реальной альтернативой классическим GPU для ряда задач ИИ.
Пока многое остаётся за кадром, но сам факт публикации и заявленного уровня — уже тревожный звонок для индустрии чипов.
https://www.tomshardware.com/tech-industry/quantum-computing/new-chinese-optical-quantum-chip-allegedly-1-000x-faster-than-nvidia-gpus-for-processing-ai-workloads-but-yields-are-low
👍5❤2⚡2🤡1
#unrealneural
Gemini 3.0 Pro Preview
Симулятор Чёрной дыры
https://arthiteca.github.io/blackholesimulator/
Gemini 3.0 Pro Preview
Симулятор Чёрной дыры
https://arthiteca.github.io/blackholesimulator/
👍2⚡1
#unrealneural
Новая статья на Хабре ⚡️⚡️⚡️
Нейронные сети для генерации планировок. Часть 1.
https://habr.com/ru/companies/pik_digital/articles/967916/
Новая статья на Хабре ⚡️⚡️⚡️
Нейронные сети для генерации планировок. Часть 1.
https://habr.com/ru/companies/pik_digital/articles/967916/
Хабр
Нейронные сети для генерации планировочных решений. Часть 1
Привет, Хабр! Меня зовут Артур Ишмаев, я — руководитель отдела внедрения и развития нейросетей в девелопере ПИК. Наша команда активно работает над оптимизацией и осмыслением многих процессов...
⚡4👍2❤1