#unrealneural
Vid2Sim: реалистичное и интерактивное моделирование городской навигации на основе видео
Vid2Sim — это новая платформа, которая преобразует монокулярные видео в фотореалистичные и физически интерактивные среды моделирования для обучения воплощенных агентов с минимальным разрывом между симуляцией и реальностью.
https://github.com/Vid2Sim/Vid2Sim
Vid2Sim: реалистичное и интерактивное моделирование городской навигации на основе видео
Vid2Sim — это новая платформа, которая преобразует монокулярные видео в фотореалистичные и физически интерактивные среды моделирования для обучения воплощенных агентов с минимальным разрывом между симуляцией и реальностью.
https://github.com/Vid2Sim/Vid2Sim
👍3🔥1
Forwarded from Data Secrets
Media is too big
VIEW IN TELEGRAM
Claude теперь умеет генерировать и редактировать pdf-ки, табличные файлы и презентации
Не слишком часто пишем про новые фичи ботов, но это приятная и интересная. Даете промпт – а вам на выход файл. Или вы файл – вам на выход отредактированный вариант.
Работает это так: у Claude есть доступ к частному окружению, в котором он пишет и запускает код для создания файлов, которые затем отправляет пользователю в чат.
Теоретически такая система открывает много возможностей: продвинутый анализ данных, обработка всяких фото/видо/аудио, да и вообще работа со всеми видами файлов. Так что ждем и других агентских фичей от Anthropic, а пока наслаждаемся генерацией таблиц и документов.
www.anthropic.com/news/create-files
Не слишком часто пишем про новые фичи ботов, но это приятная и интересная. Даете промпт – а вам на выход файл. Или вы файл – вам на выход отредактированный вариант.
Работает это так: у Claude есть доступ к частному окружению, в котором он пишет и запускает код для создания файлов, которые затем отправляет пользователю в чат.
Теоретически такая система открывает много возможностей: продвинутый анализ данных, обработка всяких фото/видо/аудио, да и вообще работа со всеми видами файлов. Так что ждем и других агентских фичей от Anthropic, а пока наслаждаемся генерацией таблиц и документов.
www.anthropic.com/news/create-files
👍4❤2🔥1
Forwarded from Neural Shit
This media is not supported in your browser
VIEW IN TELEGRAM
Там ребята из ETH и MATS запилили интересную статью: придумали, как заставить текстовые нейронки подсвечивать свои галлюцинации прямо во время ответа.
Очень часто бывает так, что LLM пишут простыню, где половина фактов реальные, а половина уровня «Альберт Эйнштейн изобрёл Гугл в 2007 году». Поймать это раньше можно было только длинными и дорогими проверками через поиск.
Теперь же на внутренние слои модели повесили детектор ерунды. И он по токенам в реальном времени понимает, где имя/дата/ссылка выдуманы.
В итоге на длинных текстах детектор стал ловить враньё почти в полтора раза лучше, чем старые методы.
В идеале это приведёт к тому, что модели научатся не только отвечать, но и честно показывать, где они уверены, а где сами сомневаются.
Тут сама статья.
Очень часто бывает так, что LLM пишут простыню, где половина фактов реальные, а половина уровня «Альберт Эйнштейн изобрёл Гугл в 2007 году». Поймать это раньше можно было только длинными и дорогими проверками через поиск.
Теперь же на внутренние слои модели повесили детектор ерунды. И он по токенам в реальном времени понимает, где имя/дата/ссылка выдуманы.
В итоге на длинных текстах детектор стал ловить враньё почти в полтора раза лучше, чем старые методы.
В идеале это приведёт к тому, что модели научатся не только отвечать, но и честно показывать, где они уверены, а где сами сомневаются.
Тут сама статья.
👍3⚡2
Forwarded from NN
Топовый генератор видео Hailuo AI стал полностью бесплатным на целую неделю.
Модель Hailuo 02 умеет создавать ролики, неотличимые от кадров из фильмов. Она выдает реалистичные кадры и не ломает законы физики.
Забираем по ссылке. Ограничений на число генераций нет до 17 сентября.
Модель Hailuo 02 умеет создавать ролики, неотличимые от кадров из фильмов. Она выдает реалистичные кадры и не ломает законы физики.
Забираем по ссылке. Ограничений на число генераций нет до 17 сентября.
❤3⚡3✍2👍1
#unrealneural
Нейронные сети проникают в студенческие работы будущих архитекторов ⚡️⚡️⚡️
Нейронные сети проникают в студенческие работы будущих архитекторов ⚡️⚡️⚡️
❤13⚡3🔥2
#unrealneural
Посетил свой родной ВУЗ УГНТУ АСФ.
Это место все еще излучает вдохновение и вызывает желание изучать архитектуру как нечто большее, чем просто физические объекты 🔥
Посетил свой родной ВУЗ УГНТУ АСФ.
Это место все еще излучает вдохновение и вызывает желание изучать архитектуру как нечто большее, чем просто физические объекты 🔥
❤17👍10⚡5
Forwarded from iNeuro Lab IABS
ВСЕМ ПРИВЕТ!
Мы - лаборатория нейронного интеллекта Института перспективных исследований мозга МГУ.
Мы работаем уже несколько лет, и наконец готовы делиться с вами ☺️
🐁 Наша задача - разгадать механизмы интеллекта у животных и перенести эти принципы в искусственные системы.
Среди нас есть нейробиологи, специалисты по поведению животных, физики, программисты.
Мы занимаемся:
🟠 исследованием нейронного кодирования поведения у животных
🟠 механизмами долговременной памяти
🟠 поиском нейронных коррелятов сознания
🟠 разработкой новых подходов к анализу нейронных и поведенческих данных
🟠 исследованиями процессов кодирования в искусственных нейронных сетях.
Наши инструменты есть на GitHub.
А об успехах и трудностях на нашем пути мы будем рассказывать в этом канале🐀
Мы - лаборатория нейронного интеллекта Института перспективных исследований мозга МГУ.
Мы работаем уже несколько лет, и наконец готовы делиться с вами ☺️
🐁 Наша задача - разгадать механизмы интеллекта у животных и перенести эти принципы в искусственные системы.
Среди нас есть нейробиологи, специалисты по поведению животных, физики, программисты.
Мы занимаемся:
Наши инструменты есть на GitHub.
А об успехах и трудностях на нашем пути мы будем рассказывать в этом канале
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡2👍2❤1
#unrealneural #пытаюсьпонять
Почему мультимодальные LLM модели испытывают трудности с пространственным пониманием?
Это исследование показывает, что проблемы с пространственным восприятием у MLLM связаны не с дефицитом данных, а с архитектурой. Пространственная способность зависит от позиционных сигналов, получаемых от визуального кодировщика, поэтому необходим редизайн, например, внедрение функции точного таргетинга.
https://www.alphaxiv.org/abs/2509.02359v1
Почему мультимодальные LLM модели испытывают трудности с пространственным пониманием?
Это исследование показывает, что проблемы с пространственным восприятием у MLLM связаны не с дефицитом данных, а с архитектурой. Пространственная способность зависит от позиционных сигналов, получаемых от визуального кодировщика, поэтому необходим редизайн, например, внедрение функции точного таргетинга.
https://www.alphaxiv.org/abs/2509.02359v1
🤔4👍1