#unrealneural
Paper2Slides теперь с открытым исходным кодом
Преобразование исследовательских работ и технических отчётов в профессиональные презентации одним щелчком мыши ⚡️⚡️⚡️
https://github.com/HKUDS/Paper2Slides
Paper2Slides теперь с открытым исходным кодом
Преобразование исследовательских работ и технических отчётов в профессиональные презентации одним щелчком мыши ⚡️⚡️⚡️
https://github.com/HKUDS/Paper2Slides
⚡5👍3❤1
#unrealneural
Sketch2BIM
MLLM-агенты пошагово интерпретируют ручной чертёж, формируют JSON-структуру помещений, стен, дверей и окон, а затем автоматически пишут скрипты для создания BIM геометрии.
https://arxiv.org/pdf/2510.20838
Sketch2BIM
MLLM-агенты пошагово интерпретируют ручной чертёж, формируют JSON-структуру помещений, стен, дверей и окон, а затем автоматически пишут скрипты для создания BIM геометрии.
https://arxiv.org/pdf/2510.20838
👍3⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Этот пример удивителен тем, то создания этого симулятора использовалась связка моделей от Google
1. Nano banana для дизайна ux/ui
2. Gemini 3.0 pro для кода
Выглядит очень хорошо, ищу промты для воспроизведения и скину их в комментарии ⚡️⚡️⚡️
Этот пример удивителен тем, то создания этого симулятора использовалась связка моделей от Google
1. Nano banana для дизайна ux/ui
2. Gemini 3.0 pro для кода
Выглядит очень хорошо, ищу промты для воспроизведения и скину их в комментарии ⚡️⚡️⚡️
⚡4👍4❤2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Очень отзывается твит Андрея Карпатого про сущности и симуляции.
Всегда представлял LLM и особенно chatGPT этаким Солярисом, где нет "я", а есть "все мы".
Перевел твит:
Не думайте о LLM как о сущностях, думайте как о симуляторах. Например, при изучении темы не спрашивайте:
«Что ты думаешь про xyz»?
Нет никакого «ты». В следующий раз попробуйте:
«Какая группа людей была бы подходящей для изучения xyz? Что бы они сказали?»
LLM может передавать/симулировать многие точки зрения, но она не «задумывалась» о xyz в течение некоторого времени и с течением времени не сформировала собственное мнение так, как мы привыкли. Если вы заставите ее использовать «ты», он даст вам что-то, приняв вектор личности (personality embedding vector), подразумеваемый статистикой его тонкой настройки (implied by the statistics of its finetuning data), а затем смоделирует это. Это нормально, но в этом гораздо меньше мистики, чем люди наивно приписывают «вопросам к ИИ».
https://x.com/karpathy/status/1997731268969304070
@cgevent
Всегда представлял LLM и особенно chatGPT этаким Солярисом, где нет "я", а есть "все мы".
Перевел твит:
Не думайте о LLM как о сущностях, думайте как о симуляторах. Например, при изучении темы не спрашивайте:
«Что ты думаешь про xyz»?
Нет никакого «ты». В следующий раз попробуйте:
«Какая группа людей была бы подходящей для изучения xyz? Что бы они сказали?»
LLM может передавать/симулировать многие точки зрения, но она не «задумывалась» о xyz в течение некоторого времени и с течением времени не сформировала собственное мнение так, как мы привыкли. Если вы заставите ее использовать «ты», он даст вам что-то, приняв вектор личности (personality embedding vector), подразумеваемый статистикой его тонкой настройки (implied by the statistics of its finetuning data), а затем смоделирует это. Это нормально, но в этом гораздо меньше мистики, чем люди наивно приписывают «вопросам к ИИ».
https://x.com/karpathy/status/1997731268969304070
@cgevent
X (formerly Twitter)
Andrej Karpathy (@karpathy) on X
Don't think of LLMs as entities but as simulators. For example, when exploring a topic, don't ask:
"What do you think about xyz"?
There is no "you". Next time try:
"What would be a good group of people to explore xyz? What would they say?"
The LLM can…
"What do you think about xyz"?
There is no "you". Next time try:
"What would be a good group of people to explore xyz? What would they say?"
The LLM can…
👍4❤1⚡1
Forwarded from Искусственный интеллект. Высокие технологии
🕶️ Google готовит умные очки на базе Gemini - запуск в 2026 году.
Компания делает две линейки устройств:
• Первая — аудио-очки с динамиками, микрофонами и камерами.
• Вторая — с дисплеями прямо в линзах: навигация, субтитры, подсказки и другие AR-оверлеи.
Первые модели выйдут в 2026 году в партнёрстве с Samsung, Warby Parker и Gentle Monster.
Очки работают на Android XR — единой системе для очков и шлемов, где Gemini “видит” то же, что и пользователь, и даёт ответы с контекстом, а не просто голосовые команды.
bloomberg.com/news/articles/2025-12-08/google-says-first-ai-glasses-with-gemini-will-arrive-in-2026
Компания делает две линейки устройств:
• Первая — аудио-очки с динамиками, микрофонами и камерами.
• Вторая — с дисплеями прямо в линзах: навигация, субтитры, подсказки и другие AR-оверлеи.
Первые модели выйдут в 2026 году в партнёрстве с Samsung, Warby Parker и Gentle Monster.
Очки работают на Android XR — единой системе для очков и шлемов, где Gemini “видит” то же, что и пользователь, и даёт ответы с контекстом, а не просто голосовые команды.
bloomberg.com/news/articles/2025-12-08/google-says-first-ai-glasses-with-gemini-will-arrive-in-2026
⚡4👍1🤗1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Finch3d подружился с Nano banana 🙃🤗
Finch3d подружился с Nano banana 🙃🤗
😁4👍2⚡1
#unrealneural #ЛабораторияИИ
Gemini 3.0 pro и генерация башни сложной формы
вот промпт
В комментариях будет obj файл результата генерации
Gemini 3.0 pro и генерация башни сложной формы
вот промпт
Создай башню в 25 этажей.
1. 1 этаж прямоугольной формы размером 35 на 50 метров.
2. с 1 по 5 этаж форма плавно превращается в прямоугольный треугольник с катетами 35 на 50 метров
3. 6 этаж равен 5 с вырезанным углом в глубину 5 м
4. с 6 по 15 одинаковые этажи
5. с 15 по 17 глубина выреза увеличивается еще на 2 м
6. с 17 по 25 форма этажа плавно меняется в квадрат со сторонами 15 м на 15 м
В комментариях будет obj файл результата генерации
👍3❤🔥1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
MoCA
Новый метод sparse attention для композиционной 3D-генерации
https://github.com/lizhiqi49/MoCA
MoCA
Новый метод sparse attention для композиционной 3D-генерации
https://github.com/lizhiqi49/MoCA
👍3❤1⚡1
Media is too big
VIEW IN TELEGRAM
#unrealneural
Qwen3-Omni-Flash
По описанию есть ряд улучшений, но будем проверять ⚡️⚡️⚡️
1. Взаимодействие с аудио- и видеооборудованием: Значительное улучшение усвоения инструкций. Решает проблему «упрощения» в неформальных чатах, обеспечивая безупречную стабильность.
2. Точный контроль: Усовершенствованная система обеспечивает оперативное соответствие определенным типам пользователей, стилям и продолжительности.
3. Многоязычная поддержка: Исправлена нестабильность переключения языков. Теперь поддерживаются 119 языков текста, 19 для распознавания речи и 10 для генерации речи.
4. Речь, похожая на речь человека: адаптивная скорость и просодия. Больше никакого запаздывания — звучит как речь настоящего человека.
https://huggingface.co/spaces/Qwen/Qwen3-Omni-Demo
Qwen3-Omni-Flash
По описанию есть ряд улучшений, но будем проверять ⚡️⚡️⚡️
1. Взаимодействие с аудио- и видеооборудованием: Значительное улучшение усвоения инструкций. Решает проблему «упрощения» в неформальных чатах, обеспечивая безупречную стабильность.
2. Точный контроль: Усовершенствованная система обеспечивает оперативное соответствие определенным типам пользователей, стилям и продолжительности.
3. Многоязычная поддержка: Исправлена нестабильность переключения языков. Теперь поддерживаются 119 языков текста, 19 для распознавания речи и 10 для генерации речи.
4. Речь, похожая на речь человека: адаптивная скорость и просодия. Больше никакого запаздывания — звучит как речь настоящего человека.
https://huggingface.co/spaces/Qwen/Qwen3-Omni-Demo
⚡2❤1👍1
Forwarded from gonzo-обзоры ML статей
Меня периодически спрашивают, как я генерю комиксы. Выношу из комментов, ибо многие могли пропустить.
Примерно так:
https://gonzoml.substack.com/p/visualizing-research-how-i-use-gemini
Примерно так:
https://gonzoml.substack.com/p/visualizing-research-how-i-use-gemini
Substack
Visualizing Research: How I Use Gemini 3.0 to Turn Papers into Comics
Lately, I’ve been actively experimenting with the new Gemini 3.0, and I like it.
1❤7🔥3⚡1