Лаборатория ИИ
2.22K subscribers
850 photos
586 videos
25 files
1.05K links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca
Download Telegram
Media is too big
VIEW IN TELEGRAM
#unrealneural
Claude Opus 4.5 очень круто ⚡️⚡️⚡️3д город одним промптом, пришлю как только накинете реакций 🙂
124🔥18👍7👌2
Prompting Guide - FLUX.2

Официальный гайд по промптингу Flux.2

Основное:

- поддерживает структурированные промпты в формате JSON, что даёт точный контроль над элементами изображения

- позволяет использовать HEX-коды для точного подбора цветов

- не поддерживает негативные промпты — нужно описывать, что хочется увидеть, а не то, чего хочется избежать

- понимает промпты на разных языках, что помогает создавать культурно аутентичные результаты

- для фотореалистичных изображений можно указывать модели камер, объективы и настройки.

#guide #prompting
31👍1
Media is too big
VIEW IN TELEGRAM
#unrealneural
Claude 4.5 Opus

3d оркестр ⚡️⚡️⚡️

P.S. Напишите в комментариях а где вы тестируете эту модель ⚡️
3👍1
Forwarded from Machinelearning
⚡️ Qwen3-VL: выпустили технический отчёт по новой линейке VLM

Опубликован tech report по Qwen3-VL - мультимодальным моделям, работающим с изображениями и текстом.

Кратко :
- Три модели собрали 1M+ загрузок за месяц.
- Qwen3-VL-8B - более 2M скачиваний.
- Линейка развивает идеи Qwen2.5-VL (2800+ цитирований).

Что описано в отчёте:
- Архитектура vision–language модели.
- Процесс обучения: pretraining + post-training.
- Источники данных и методы фильтрации.
- Сравнения с другими VLM и ключевые метрики.

🔗 PDF: https://arxiv.org/pdf/2511.21631
🔗
Видео: https://www.youtube.com/watch?v=clwFmuJX_wQ

@ai_machinelearning_big_data

#Qwen #Qwen3 #QwenVL #Qwen3VL #LLM #AIModel
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👌32👍1
Forwarded from 🟡NeuroGraph
Благодаря Nano Banana Pro можно читать лучшие книги, которые не переведены на русский.

Прямо сейчас читаю книгу Мастера – Роджера Дикинса «Reflections».

Переводит даже ручные заметки.
🔥142👍2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Генерация симуляторов Pinball разными моделями

Промпт будет в комментарии ⚡️⚡️⚡️
51👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
На просторах интернета нашел вот такой вау кейс сочетания Ии моделей 😍😍😍
Попробуем повторить ⚡️⚡️⚡️
👍93🤗2
Media is too big
VIEW IN TELEGRAM
#unrealneural
Игровой движок на базе ИИ, способный за считанные минуты сгенерировать локацию для 3д шутера 💫
👍5🔥21
#unrealneural

Ваши мысли буквально формируют ваш мозг

Когда вы концентрируетесь на хорошем, ваш мозг начинает перестраиваться, чтобы замечать ещё больше хорошего. Это не просто мотивация - это нейропластичность в действии. Нейропластичность - это способность мозга реорганизовываться и создавать новые нейронные связи на основе ваших постоянных мыслей, чувств и внимания.
👍51
Последняя из работ-финалистов NeurIPS 2025, про геометрию репрезентаций и механистическое объяснение законов скейлинга. Работа прекрасна!

Superposition Yields Robust Neural Scaling
Yizhou Liu, Ziming Liu, and Jeff Gore
Статья: https://arxiv.org/abs/2505.10465, https://openreview.net/forum?id=knPz7gtjPW
Код: https://github.com/liuyz0/SuperpositionScaling
Ревью: https://arxiviq.substack.com/p/neurips-2025-superposition-yields

# TL;DR

ЧТО сделали: Предложили механистическое объяснение законов масштабирования (scaling laws), связав их с суперпозицией репрезентаций. Адаптировав фреймворк разреженных автоэнкодеров и проверив теорию на открытых LLM (OPT, Pythia, Qwen), авторы показали: когда модели работают в режиме «сильной суперпозиции» (кодируют значительно больше фичей, чем имеют измерений), лосс масштабируется обратно пропорционально ширине модели (L ∝ 1/m). Этот скейлинг обусловлен геометрической интерференцией между векторами признаков, а не статистическими свойствами хвоста распределения данных.

ПОЧЕМУ это важно: Работа — Best Paper Runner-Up на NeurIPS 2025. Она дает вывод законов скейлинга «из первых принципов», устойчивый к распределению данных. В отличие от предыдущих теорий, опирающихся на аппроксимацию многообразия, здесь утверждается, что степенной закон поведения LLM — это геометрическая неизбежность сжатия разреженных концептов в плотные пространства. Это означает, что для преодоления барьеров масштабирования нужны архитектурные вмешательства для управления интерференцией признаков — простое добавление данных не поможет обойти это геометрическое бутылочное горлышко.

Подробнее: https://t.iss.one/gonzo_ML_podcasts/1531
👍51
Media is too big
VIEW IN TELEGRAM
#unrealneural
Kling launch O1

🤗🤗🤗

«Nano banana pro», но в области видеогенерации
52🤗2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural

Главный действующий элемент здесь - нейрон, вероятно, ищущий связь (связи). Другие клетки справа, вероятно, представляют собой активно делящиеся и мигрирующие фибробласты.
👍71👌1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural

ViBT: первый bridge transformer Vision с параметрами 20B

Этот новаторский фреймворк является пионером в области преобразования данных, напрямую моделируя траектории для генерации условных изображений и видео. Он невероятно эффективен, работает до 4 раз быстрее и с лёгкостью справляется со сложными задачами.

https://huggingface.co/Yuanshi/ViBT
👍321
Forwarded from Неискусственный интеллект (Илья Склюев)
Apple делает новый шаг к диверсификации ИИ-архитектур

На фоне кадровых перестановок совсем тихо прошла новость, что компания ищет свою альтернативу диффузионным нейросетям. Apple выпустила в паблик исходники STARFlow-V — первой модели для генерации видео на основе нормализующих потоков.

Модель делит работу на два уровня:

▪️ «Планировщик» предсказывает, что должно случиться дальше, глядя только в прошлые кадры (строго причинно, удобно для стриминга/интерактива);
▪️ «Художник» дорисовывает детали внутри каждого кадра, не заглядывая в будущее.

За счёт такой сборки меньше «сползания» сюжета на длинных роликах и естественная причинность. Не «разшумили сотней шагов», а идём покадрово слева направо, ближе к тому, как ролик реально выводится.

Датасет состоял из примерно 70 млн пар «текст–видео» и 400 млн «текст–изображение»; итоговая 7B-модель генерирует 480p при 16 fps. Работает в сжатом латентном пространстве и благодаря обратимости потоков из коробки поддерживает text-to-video, image-to-video, video-to-video и реконструкцию из латентного представления — без переделки архитектуры и дообучения под каждую задачу.

Демонстрации показывают уверенную обработку сложных движений, света, теней и перспективы, хоть и в низком разрешении. Пока это только эксперимент. Но кажется, что причинная генерация со стриминговым выводом — хороший вектор для развития интерактивного live-контента.

@anti_agi
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31
#unrealneural
cad3dify

Конвертация 2D в 3D CAD с помощью VLM

https://github.com/neka-nat/cad3dify
2👍21