AI LAB | Лаборатория ИИ
1.88K subscribers
656 photos
442 videos
24 files
925 links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca

Вопросы сотрудничества и соучастия
@j_fede
Download Telegram
Media is too big
VIEW IN TELEGRAM
#unrealneural #врежимеожидания
PolyDiff: диффузионная модель для генерации 3D-сеток

PolyDiff — первая диффузионная модель, способная напрямую создавать реалистичные и разнообразные трёхмерные полигональные сетки. В отличие от методов, использующих неявные представления, PolyDiff работает непосредственно с сеточной структурой, учитывая как геометрию вершин, так и топологию граней. Модель рассматривает сетки как «треугольные супы», постепенно искажённые категориальным шумом, и обученный трансформер-шумоподавитель восстанавливает исходную структуру. На этапе генерации сетки формируются из полностью зашумлённых данных с последовательным устранением шума. Подход обеспечивает улучшение метрик качества: среднее снижение FID на 18,2 и JSD на 5,8 по сравнению с современными методами.
https://arxiv.org/abs/2312.11417
4👍21
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #ЛабораторияИИ #AILAB #Эксперименты
Вайб-проектирование

LLM для работы в Revit
Продолжаем эксперименты с Revit и LLM, которая по текстовым запросам моделирует внутри программы. Система тестируется под рабочими названиями Text2BIM, RevitMCP, RevitAI и Revit Copilot. Потенциал — автоматизация любых операций, включая оформление.
👍632🔥2
Forwarded from Data Secrets
Cursor на 28% улучшили фичу Tab с помощью RL

Для тех, кто не пользуется: Tab предсказывает, какое действие пользователь собирается сделать далее. Когда вы перемещаете курсор или начинаете писать какой-то код, Tab пытается понять, что вам нужно и, если она достаточно уверена в своем предсказании, то предлагает вам продолжение (чаще всего завершение кода).

Отличная фича, но часто предлагала шум. В общем, Cursor решили что-то с этим делать.

В других редакторах (например, в Copilot) подобную проблему пытались бороть обычными фильтрами: язык, были бы предыдущие предложения приняты или нет и тд.

Звучит в целом норм, но Cursor выбрали путь сложнее и интереснее, потому что они использовали RL с двумя сильными составляющими:

1. Сложная reward модель. Политика на каждом шаге предсказывает вероятности разных исходов + вероятность того, что предложение будет принято. Reward, исходя из этих вероятностей, поощряет принятые предложения и штрафует отклонённые. Например, если вероятность принятия ≥ 25%, accepted даёт +0.75, rejected — −0.25, если ничего не показывается – 0. Вот модель и решает, как ей лучше себя вести. Также в награде учитывается длина оффера, общее количество офферов и др.

2. On-policy data. То есть данные, на которых училась политика, собраны в реальной работе модели уже после её обновления. Получили новый чекпоинт -> задеплоили -> собрали данные (это занимает пару часов) -> учим дальше. Это чтобы не было distribution shift и градиент обновлялся правильно. Реализовать такое, конечно, мега запара.

Итог: в новой версии на 21% меньше предложений, но на 28% выше доля принятия.

Мало того, что это огромный скачок метрики, это еще и качественно другой результат: тут accept rate растет не за счет костыльной фильтрации шумных предсказаний, а за счет того, что сама модель стала более прагматичной и предлагает меньше ерунды.

Good job

cursor.com/blog/tab-rl
32👍2
#unrealneural
Китай представил первую в мире модель искусственного интеллекта, подобную мозгу, SpikingBrain1.0

До 100 раз быстрее, при этом обучение проводится на менее чем 2% обычно необходимых данных.

Разработанный для имитации работы человеческого мозга, он потребляет гораздо меньше энергии. Новая парадигма эффективности и аппаратной независимости.

Ознаменовывает значительный отход от текущих архитектур ИИ

В отличие от таких моделей, как GPT и LLaMA, которые используют механизмы внимания для параллельной обработки всех входных данных, SpikingBrain1.0 использует локализованное внимание, концентрируясь только на наиболее релевантном недавнем контексте.

Возможные области применения:

- Среды реального времени с низким энергопотреблением
- Автономные дроны и периферийные вычисления
- Носимые устройства, требующие эффективной обработки
- Сценарии, в которых потребление энергии имеет решающее значение

Этот проект является частью более масштабного научного исследования в области нейроморфных вычислений, целью которого является воспроизведение удивительной эффективности человеческого мозга, потребляющего всего около 20 Вт мощности.

https://arxiv.org/abs/2509.05276
🤯32🤔2🤡1
Беседин_А_П_,_Логинов_Е_В_Локк_о_времени.pdf
548 KB
Вышла статья Артема Беседина и Евгения Логинова о теории времени Джона Локка.

Проведен систематический анализ локковской концепции времени как идеи, формирующейся не априорно, а через рефлексию над последовательностью собственных мыслей. Предложено разделение между темпоральным «расстоянием», понятым натуралистически, как объективная длительность состояний человека, и идеей «продолжительности» как результатом рефлексии, что позволяет уточнить структуру идеи времени в эмпиристской эпистемологии Локка. Показано, что Локк критикует аристотелевское определение времени как меры движения, обосновывая автономию идеи времени от физического движения с опорой на субъективный опыт. Выявлено, что рассуждения об идее времени у Локка предполагает относительность времени и указывает на ограниченность человеческого познания, сближаясь в этом с кантовской эпистемологией. Также прослежены аргументы ранней критики (Серджент, Ли) и позиция Лейбница, что позволяет оценить границы и потенциал локковской теории. Показано, что локковская теория является переходом от аристотелических теорий времени к критической философии Канта с его субъективизацией времени.
👍42🔥2
#unrealneural

Tencent представила SRPO — метод прямого согласования траекторий диффузии с человеческим текстом. Модель FLUX1dev прошла тонкую настройку с оптимизированным шумоподавлением и онлайн-регулировкой вознаграждения, что повысило реалистичность и эстетическое качество более чем в 3 раза по оценкам пользователей.

https://huggingface.co/spaces/akhaliq/SRPO
31
Ещё одна любопытная недавно нашумевшая работа про SpikingBrain LLM, где взяли Qwen2.5 и делают на его базе эффективную модель. В этот раз более спайко-подобную, хорошо работающую на очень длинном контексте и потенциально намного более энергоэффективную. Это ещё не полноценная спайковая сеть на нейроморфном процессоре, но уже шаг. Гоняют на китайском GPU MetaX.

Очень перекликается с K2-Think, хоть его результаты и обругали (ничего, исправят в следующей версии). Везде фулл-стек инжиниринг, в обеих работах не-нвидиевское железо и база Qwen2.5. Всё, я уже жду вакансии фулл-стеков в ML!

https://t.iss.one/gonzo_ML_podcasts/834
31👍1
Forwarded from NN
Бесплатный ИИ-поисковик: нашли опенсорсный аналог Perplexity — отлично работает как ассистент для работы и учебы.

Сервис работает с локальными моделями вроде Qwen и DeepSeek. Умеет гуглить, готовить исследования, анализировать данные и даже видео с YouTube. Использует только актуальные данные.

Забираем по ссылке.
5👍1👌1
Neuralink 2025 презентация Илона Маска
Он показал, как имплант сможет вернуть зрение слепым, восстановить речь, передавать мысли напрямую (телепатия), давать «сверхзрение», подключать новые органы чувств и даже расширять мозг за пределы человеческих возможностей...

В этой презентации - демонстрация участников эксперимента, подробности работы чипа, реальные примеры и то, как технологии изменят жизнь в ближайшие годы.

📺 Полный перевод и разбор презентации Neuralink 2025 на YouTube
8👍4🔥3
#unrealneural
SpatialVID: новый огромный набор видеоданных для трехмерного пространственного анализа

Он имеет решающее значение для обучения моделей нового поколения и содержит более 7000 часов разнообразного видеоматериала, снятого в естественных условиях, с подробными аннотациями, такими как позы камеры, карты глубины и динамические маски.
https://huggingface.co/datasets/SpatialVID/SpatialVID-HQ
👍3🔥2
Forwarded from B2B по любви
2-х секундный тест на сколько ты в теме?

1. самое популярное слово 2025 из двух букв?

2. самый популярный застройщик в мск из трех букв?

А теперь сложи оба этих ответа и получится гость нашего подкаста -

руководитель лаборатории ИИ ГК ПИК Артур Ишмаев https://t.iss.one/unrealneural

За 33 мин мы обсудили не только ИИ в Пике, но и армию, факапы и фракталы и даже психологические травмы
Приятного просмотра 🙌

Youtube: https://youtu.be/QERiIRFQmfg

Rutube: https://rutube.ru/video/96c4c9b01be2320ebc01831effb60688/
10🔥6👍4
Forwarded from NN
This media is not supported in your browser
VIEW IN TELEGRAM
Новый ИИ-фотошоп: разработчики Reve выпустили бесплатный редактор. Он очень быстро и реалистично меняет картинки.

Просто загружаем исходник и пишем задачу. На выходе — сразу несколько вариантов исправленной картинки. Можно менять цвета, удалять или добавлять объекты и даже двигать ракурс.

Тестируем по ссылке.
🔥321👍1
#unrealneural
Nanobrowser

Расширение Chrome с открытым исходным кодом для веб-автоматизации на базе искусственного интеллекта.

Запускает многоагентные рабочие процессы с использованием вашего собственного ключа LLM API. Альтернатива OpenAI Operator.

Гибкие варианты LLM — подключение к выбранным источникам LLM и выбор разных моделей для разных агентов.

github.com/nanobrowser/nanobrowser
21👍1