Лаборатория ИИ

#unrealneural
Paper2Slides теперь с открытым исходным кодом

Преобразование исследовательских работ и технических отчётов в профессиональные презентации одним щелчком мыши ⚡️⚡️⚡️

https://github.com/HKUDS/Paper2Slides

⚡5👍3❤1

525 viewsАртур Ишмаев, 12:31

Лаборатория ИИ

#unrealneural
Ждем ⚡️⚡️⚡️

👍1🔥1

490 viewsАртур Ишмаев, 20:07

Лаборатория ИИ

#unrealneural
Sketch2BIM

MLLM-агенты пошагово интерпретируют ручной чертёж, формируют JSON-структуру помещений, стен, дверей и окон, а затем автоматически пишут скрипты для создания BIM геометрии.

https://arxiv.org/pdf/2510.20838

👍3⚡1

557 viewsАртур Ишмаев, edited 20:52

Лаборатория ИИ

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

#unrealneural
Этот пример удивителен тем, то создания этого симулятора использовалась связка моделей от Google
1. Nano banana для дизайна ux/ui
2. Gemini 3.0 pro для кода

Выглядит очень хорошо, ищу промты для воспроизведения и скину их в комментарии ⚡️⚡️⚡️

⚡4👍4❤2

489 viewsАртур Ишмаев, edited 06:51

Лаборатория ИИ

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

Очень отзывается твит Андрея Карпатого про сущности и симуляции.

Всегда представлял LLM и особенно chatGPT этаким Солярисом, где нет "я", а есть "все мы".

Перевел твит:

Не думайте о LLM как о сущностях, думайте как о симуляторах. Например, при изучении темы не спрашивайте:

«Что ты думаешь про xyz»?

Нет никакого «ты». В следующий раз попробуйте:

«Какая группа людей была бы подходящей для изучения xyz? Что бы они сказали?»

LLM может передавать/симулировать многие точки зрения, но она не «задумывалась» о xyz в течение некоторого времени и с течением времени не сформировала собственное мнение так, как мы привыкли. Если вы заставите ее использовать «ты», он даст вам что-то, приняв вектор личности (personality embedding vector), подразумеваемый статистикой его тонкой настройки (implied by the statistics of its finetuning data), а затем смоделирует это. Это нормально, но в этом гораздо меньше мистики, чем люди наивно приписывают «вопросам к ИИ».

https://x.com/karpathy/status/1997731268969304070

@cgevent

X (formerly Twitter)

Andrej Karpathy (@karpathy) on X

Don't think of LLMs as entities but as simulators. For example, when exploring a topic, don't ask:

"What do you think about xyz"?

There is no "you". Next time try:

"What would be a good group of people to explore xyz? What would they say?"

The LLM can…

👍4❤1⚡1

457 viewsАртур Ишмаев, 09:24

Лаборатория ИИ

Forwarded from Искусственный интеллект. Высокие технологии

🕶️ Google готовит умные очки на базе Gemini - запуск в 2026 году.

Компания делает две линейки устройств:

• Первая — аудио-очки с динамиками, микрофонами и камерами.
• Вторая — с дисплеями прямо в линзах: навигация, субтитры, подсказки и другие AR-оверлеи.

Первые модели выйдут в 2026 году в партнёрстве с Samsung, Warby Parker и Gentle Monster.

Очки работают на Android XR — единой системе для очков и шлемов, где Gemini “видит” то же, что и пользователь, и даёт ответы с контекстом, а не просто голосовые команды.

bloomberg.com/news/articles/2025-12-08/google-says-first-ai-glasses-with-gemini-will-arrive-in-2026

⚡4👍1🤗1

406 viewsАртур Ишмаев, 15:49

Лаборатория ИИ

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

#unrealneural
Finch3d подружился с Nano banana 🙃🤗

😁4👍2⚡1

454 viewsАртур Ишмаев, 16:25

Лаборатория ИИ

#unrealneural #ЛабораторияИИ
Gemini 3.0 pro и генерация башни сложной формы

вот промпт

Создай башню в 25 этажей. 
1. 1 этаж прямоугольной формы размером 35 на 50 метров. 
2. с 1 по 5 этаж форма плавно превращается в прямоугольный треугольник с катетами 35 на 50 метров 
3. 6 этаж равен 5 с вырезанным углом в глубину 5 м
4. с 6 по 15 одинаковые этажи 
5. с 15 по 17 глубина выреза увеличивается еще на 2 м
6. с 17 по 25 форма этажа плавно меняется в квадрат со сторонами 15 м на 15 м

В комментариях будет obj файл результата генерации

👍3❤‍🔥1🔥1

392 viewsАртур Ишмаев, 19:48

Лаборатория ИИ

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

#unrealneural
MoCA

Новый метод sparse attention для композиционной 3D-генерации

https://github.com/lizhiqi49/MoCA

👍3❤1⚡1

355 viewsАртур Ишмаев, 05:26

#unrealneural
Qwen3-Omni-Flash

По описанию есть ряд улучшений, но будем проверять ⚡️⚡️⚡️

1. Взаимодействие с аудио- и видеооборудованием: Значительное улучшение усвоения инструкций. Решает проблему «упрощения» в неформальных чатах, обеспечивая безупречную стабильность.
2. Точный контроль: Усовершенствованная система обеспечивает оперативное соответствие определенным типам пользователей, стилям и продолжительности.
3. Многоязычная поддержка: Исправлена нестабильность переключения языков. Теперь поддерживаются 119 языков текста, 19 для распознавания речи и 10 для генерации речи.
4. Речь, похожая на речь человека: адаптивная скорость и просодия. Больше никакого запаздывания — звучит как речь настоящего человека.

https://huggingface.co/spaces/Qwen/Qwen3-Omni-Demo

⚡2❤1👍1

343 viewsАртур Ишмаев, edited 07:24

Лаборатория ИИ

Forwarded from gonzo-обзоры ML статей

Меня периодически спрашивают, как я генерю комиксы. Выношу из комментов, ибо многие могли пропустить.

Примерно так:

https://gonzoml.substack.com/p/visualizing-research-how-i-use-gemini

Substack

Visualizing Research: How I Use Gemini 3.0 to Turn Papers into Comics

Lately, I’ve been actively experimenting with the new Gemini 3.0, and I like it.

1❤7🔥3⚡1

279 viewsАртур Ишмаев, 10:46

About

Blog

Apps

Platform