Лаборатория ИИ
2.15K subscribers
799 photos
563 videos
25 files
1.03K links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca

Вопросы сотрудничества и участия на мероприятиях
@polinamichurova
Download Telegram
Андрей Карпатый высказался о том, как лучше всего понимать влияние ИИ на экономику и рынок труда.

Недавно он жестко высказался про агенты, AGI и тд.

Экс-глава AI в Tesla и со-основатель OpenAI говорит, что самые популярные аналогии (ИИ = электричество, ИИ = промышленная революция и т.д.) не самые точные.

По его мнению, самая сильная и точная аналогия — это то, что современный ИИ — это новая парадигма программирования, которую он много лет назад назвал Software 2.0.

Что изменилось с ИИ (Software 2.0)?

Сейчас мы больше не пишем программы вручную строчка за строчкой. Мы задаём цель, например, «максимально точно классифицировать картинки» или «получить максимальный счёт в игре» и запускаем градиентный спуск, который сам в миллиардах параметров нейронной сети находит работающую программу.

Это меняет то, какие задачи становятся автоматизируемыми.

Теперь главный вопрос уже не «смогу ли я чётко описать алгоритм?», а «смогу ли я проверить, правильно ли выполнена задача?», то есть верифицируемость.

Три ключевых условия, чтобы задача была легко автоматизируема в эпоху Software 2.0:
1. Среда должна быть перезапускаемой — можно быстро начать новую попытку.
2. Попытки должны быть быстрыми и дешёвыми.
3. Должна быть автоматическая награда/оценка.

Если эти три условия выполнены — задача обречена на сверхчеловеческий уровень автоматизации.

Примеры задач, которые идеально подходят под Software 2.0 (быстро прогрессируют):
- Математика (есть правильный ответ → легко проверить)
- Программирование (можно автоматически запустить тесты)
- Шахматы, го, StarCraft, Dota (симуляция перезапускается, есть счёт)
- Решение головоломок, CAPTCHA, доказательство теорем
- Просмотр видео до конца (YouTube точно знает, досмотрел ты или нет — это тоже верифицируемый сигнал!)

На таких задачах ИИ уже сейчас часто превосходит лучших людей на планете.

Примеры задач, которые пока отстают (потому что плохо верифицируемы):
- Творчество (как объективно оценить, что картина или рассказ «хорошие»?)
- Стратегическое мышление в реальном мире (слишком много скрытого состояния, долгосрочные последствия)
- Задачи, требующие глубокого понимания физического мира, здравого смысла, социального контекста
- Работа с реальными людьми, переговорами, эмпатией и т.д.

Для них пока приходится полагаться либо на «магию обобщения» нейронок, либо на более слабые методы вроде имитации человека.

Главный тезис Карпатого - Software 1.0 легко автоматизирует то, что ты можешь задать. Software 2.0 легко автоматизирует то, что ты можешь проверить.

Карпатый предлагает смотреть на будущее рынка труда через эту призму:
Чем больше в твоей работе задач, которые можно объективно и автоматически проверить и на которых можно «натренироваться» миллиарды раз в симуляции, тем выше вероятность, что они будут автоматизированы в ближайшие 5–10 лет.
👍632🤮1
Ищем образ трушного вайб-проектирования. Возможно ли создать сложную архитектурную форму только через чат, не используя инструменты редактирования?
Anonymous Poll
11%
да, сложность формы легко описывается через текстовое описание
38%
нет, текущие архитектуры ИИ не способны отразить все запросы в 3д
38%
зависит от формы, не все возможно описать текстом
13%
другое
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
MMaDA-Parallel - параллельные многомодальные модели языка с большой диффузией для редактирования и генерации изображений с использованием мышления

В отличие от последовательных методов визуальной генерации/редактирования, которые генерируют текст в изображение шаг за шагом, работа обеспечивает одновременную генерацию, где текст и изображения корректируют друг друга на каждом этапе шумоподавления. Достигается настоящая параллельность мультимодального взаимодействия.

MMaDA-Parallel-A: https://huggingface.co/tyfeld/MMaDA-Parallel-A
MMaDA-Parallel-M: https://huggingface.co/tyfeld/MMaDA-Parallel-M
3👍1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Ну что, счет идет на часы?

@cgevent
👍41🔥1
Forwarded from в IT и выйти
⚡️ Gemini 3 Pro ВЫШЛА.

ИИ от Гугла — сильнейшая нейросеть по всем бенчмаркам на данный момент.

Тестим БЕСПЛАТНО здесь.

@techmedia
🤗5❤‍🔥2👍2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Тестирую Gemini 3.0 Pro Preview

Проверил смогу ли повторить результат с интерактивным вентилятором в SVG, если промпт на русском.
1👍4❤‍🔥11👎1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Тестирую Gemini 3.0 Pro Preview

Интерактивная микроволновка
👍6❤‍🔥31
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Тестирую Gemini 3.0 Pro Preview

Кубик Рубика
👍6❤‍🔥11🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Тестирую Gemini 3.0 Pro Preview

Лендинг сайта за 39.7 сек ⚡️⚡️⚡️
4❤‍🔥1👍1🤗1
Media is too big
VIEW IN TELEGRAM
#unrealneural
Тестирую Gemini 3.0 Pro Preview

Конечно же любимые фракталы в 2д
3❤‍🔥2👍1
Media is too big
VIEW IN TELEGRAM
#unrealneural
Тестирую Gemini 3.0 Pro Preview

Конечно же любимые фракталы в 3д
👍3❤‍🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Тестирую Gemini 3.0 Pro Preview

Генерация массинга
4👍32
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Тестирую Gemini 3.0 Pro Preview

Генерация сложной формы
4🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Gemini 3.0 Pro Preview
Игра CAST SHADOW

https://arthiteca.github.io/casttheshadowgame/

Сделал игру в 1 промпт, давно была идея, но Gemini ее понял немножко по-другому 😃😃😃
Поделитесь в комментариях у кого получилось ее пройти
👍411
Forwarded from 🟡NeuroGraph
Media is too big
VIEW IN TELEGRAM
Google только что выпустила Gemini 3.

Это крупное обновление, которое смещает фокус с простой генерации текста на «глубокое мышление» и автономное выполнение задач.

Вот список самых главных обновлений и решений в Gemini 3, актуальных на сегодняшний день:

1. Режим «Deep Think» (Глубокое мышление)
Это, пожалуй, самое важное обновление.

Что это: Новый режим рассуждений (похожий на o1 от OpenAI), который позволяет модели "подумать" перед ответом. Она выстраивает цепочку рассуждений, проверяет гипотезы и только потом выдает результат.

Зачем нужно: Для решения сложных математических задач, написания сложного кода и научного анализа.

Google заявляет, что Gemini 3 бьет рекорды в бенчмарках MathArena Apex и Humanity's Last Exam.

Доступность: Сначала для подписчиков Ultra.

2. Генеративные интерфейсы (Generative UI) и Dynamic View
Gemini 3 больше не ограничивается текстом или картинками в чате.

Dynamic View: Если вы попросите спланировать поездку или объяснить сложную концепцию, Gemini не просто напишет текст, а сгенерирует интерактивный визуальный интерфейс (виджеты, карты, таблицы, графики), который можно нажимать и изменять прямо в диалоге.

Vibe Coding: Улучшенная способность генерировать UI/UX код, который сразу выглядит стильно и современно, а не просто функционально.

3. Платформа Google Antigravity.

Это решение для разработчиков и продвинутых пользователей (вам это может быть интересно как создателю контента).

Что это: Новая среда для создания ИИ-агентов.

Возможности: Агенты могут работать автономно: использовать терминал, браузер и редактор кода для выполнения многошаговых задач (например, «создай веб-сайт, разверни его на сервере и протестируй»).

4. Gemini Agent (Автономный помощник).

ИИ теперь может реально управлять вашими делами, а не просто давать советы. Он интегрируется с календарем, почтой и другими сервисами Google, чтобы выполнять сложные цепочки действий (например, «организуй встречу, забронируй переговорку и подготовь черновик повестки на основе моих писем»).

5. Мультимодальность нового уровня (Video & Images).

Учитывая наш интерес к видео и генеративному искусству, это ключевой пункт:

Понимание видео: Gemini 3 показывает рекордные результаты (87.6% на Video-MMMU). Модель может "смотреть" длинные видеолекции или фильмы и понимать контекст, тайминг и визуальные нюансы лучше.

Анализ: Вы можете загрузить "сырой" видеоматериал, и модель поможет смонтировать его или найти нужные кадры по смыслу, а не по тегам.

6. Производительность.

Google заявляет, что Gemini 3 Pro превосходит предыдущую версию (Gemini 2.5 Pro) по всем параметрам, при этом работая быстрее и эффективнее.

Официальный анонс ЗДЕСЬ
👍41
🇨🇳 Китай показал квантовый прорыв, который звучит слишком мощно, чтобы его игнорировать

Обычно гучные “революции в железе” пролетают мимо внимания.
Но когда такое публикует Tom’s Hardware — ресурс с репутацией — это уже совсем другой уровень.

CHIPX Lab из Китая заявляет, что создали первый промышленный, масштабируемый оптический квантовый чип, который выполняет некоторые AI-нагрузки до 1000× быстрее, чем Nvidia-GPU.

Что внутри и почему это важно:

- фотонный чип с 1000+ оптических компонентов на одной 6-дюймовой пластине
- архитектура, заявленная как масштабируемая до 1 млн кубитов
- развёртывание — недели, а не месяцы
- текущая производительность — ~12 000 пластин в год (скромно, но промышленно)
- потенциальный удар по западным планам: Nvidia и другие тоже гонят фотонные + квантовые архитектуры, но пока не показали похожего масштаба

Если эти цифры подтвердятся, это станет одним из самых серьёзных успехов Китая в гонке за квантовым превосходством — и сигналом, что фотонные квантовые чипы могут вскоре стать реальной альтернативой классическим GPU для ряда задач ИИ.

Пока многое остаётся за кадром, но сам факт публикации и заявленного уровня — уже тревожный звонок для индустрии чипов.

https://www.tomshardware.com/tech-industry/quantum-computing/new-chinese-optical-quantum-chip-allegedly-1-000x-faster-than-nvidia-gpus-for-processing-ai-workloads-but-yields-are-low
👍532🤡1
#unrealneural
Gemini 3.0 Pro Preview

Симулятор Чёрной дыры
https://arthiteca.github.io/blackholesimulator/
👍21
Лаборатория ИИ pinned «#unrealneural Новая статья на Хабре ⚡️⚡️⚡️ Нейронные сети для генерации планировок. Часть 1. https://habr.com/ru/companies/pik_digital/articles/967916/»
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Удивительный тест возможностей мультимодального мышления Gemini 3.0 pro

Накидайте лайков, если интересно увидеть промпт 🤗
118👍82
😁12🤩1🤗1