Forwarded from Grace Hopper (Alik Sumin)
Media is too big
VIEW IN TELEGRAM
сделал видео на тему того, на каком этапе сейчас находится генерация 3D моделей с помощью #comfyui
ссылка на используемый пакет нодов (там же и примеры workflow):
https://github.com/kijai/ComfyUI-Hunyuan3DWrapper
ссылка на используемый пакет нодов (там же и примеры workflow):
https://github.com/kijai/ComfyUI-Hunyuan3DWrapper
⚡4👍1🔥1
Forwarded from Data Secrets
Бывший исследователь OpenAI Даниэль Кокотаджило предсказал, что случится с ИИ в 2026–2027
В 2024 Дэниэль вошел в список топ-100 самых влиятельных людей в ИИ по версии журнала TIME. Он известен двумя вещами.
Во-первых, в том же 2024 он с шумом ушел с высокой позиции в OpenAI, отказавшись подписать NDA. За подпись ему предлагали примерно $2 миллиона в виде акций, но он выбрал свободу слова.
Во-вторых, в 2021, еще до прихода в OpenAI и задолго до успеха ChatGPT, он написал статью, в которой описал свое виденье того, как будет выглядеть ИИ до 2026, и пока оказался необыкновенно прав. Представьте: он предсказал и массовый хайп, и венчурный бум, и даже ограничение экспорта чипов из США в Китай еще до того, как кто-либо вообще хотя бы единожды поговорил с чат-ботом.
Так вот, на днях Дэниэль показал свой новый прогноз до 2028. Его он разрабатывал уже не один, а с командой его собственной лаборатории AI Futures Project. Вот этот документ, вот подкаст по нему. Основное:
⭐️ 2025: агенты развиваются, но их эффективность все еще ограничена. Тем не менее, внутри компаний уже начинают разворачивать узкоспециализированных агентов, автоматизирующих некоторые задачи.
⭐️ Конец 2025: GPT-3 moment для агентов. Появляется система, действительно способная действовать автономно.
⭐️ Начало 2026: флагмагманские агенты дают 50%-ное ускорение алгоритмического прогресса в компаниях. Китай объединяет все свои ведущие AI-компании в единый центр, чтобы догнать США.
⭐️ Конец 2026: массовые увольнения и перестройка рынка труда.
⭐️ Начало 2027: новые прорывы, полная автоматизация разработки, экономика растет, но разрыв между классам увеличивается.
⭐️ Конец 2027: оказывается, что агенты не вполне безопасны, и вот тут возникает развилка. Либо в этот момент человечество решит приостановить разработку и поработать над элайментом, либо гонка продолжается.
Ну а дальше вы поняли. Либо суперинтеллект поглощает власть над всеми сферами жизни и людям каюк, либо развитие немного притормаживается и больше внимания мы начинаем уделять безопасности и жесткому международному мониторингу.
Что сказать. Сохраняйте, проверим через 3 года.
В 2024 Дэниэль вошел в список топ-100 самых влиятельных людей в ИИ по версии журнала TIME. Он известен двумя вещами.
Во-первых, в том же 2024 он с шумом ушел с высокой позиции в OpenAI, отказавшись подписать NDA. За подпись ему предлагали примерно $2 миллиона в виде акций, но он выбрал свободу слова.
Во-вторых, в 2021, еще до прихода в OpenAI и задолго до успеха ChatGPT, он написал статью, в которой описал свое виденье того, как будет выглядеть ИИ до 2026, и пока оказался необыкновенно прав. Представьте: он предсказал и массовый хайп, и венчурный бум, и даже ограничение экспорта чипов из США в Китай еще до того, как кто-либо вообще хотя бы единожды поговорил с чат-ботом.
Так вот, на днях Дэниэль показал свой новый прогноз до 2028. Его он разрабатывал уже не один, а с командой его собственной лаборатории AI Futures Project. Вот этот документ, вот подкаст по нему. Основное:
Ну а дальше вы поняли. Либо суперинтеллект поглощает власть над всеми сферами жизни и людям каюк, либо развитие немного притормаживается и больше внимания мы начинаем уделять безопасности и жесткому международному мониторингу.
Что сказать. Сохраняйте, проверим через 3 года.
Please open Telegram to view this post
VIEW IN TELEGRAM
😐4😢1🤡1👾1
Forwarded from Data Secrets
Релизнули в трех весах: Llama 4 Scout на 109B, Llama 4 Maverick на 400B и Llama 4 Behemoth на 2T (да-да, в триллионах).
– Llama 4 Scout. Контекст 10M токенов (вау!), MoE на 16 экспертов, 17B активных параметров. Запускается на одной GPU. Уровень Gemini 2.0 Flash Lite.
– Llama 4 Maverick. Контекст поменьше, 1M. 128 экспертов по 17B активных параметров. Примерно на уровне GPT-4o. На арене модель сейчас на 2 месте с рейтингом 1417.
Обе модели выше мультимодальные (на вход принимают до 5 изображений) и поддерживают много языков. Знания – по август 2024. Веса
– Llama 4 Behemoth. Модель невероятных размеров, которая использовалась в качестве учителя для Scout и Maverick. 16 экспертов по 288B активных параметров. Уровень GPT-4.5 и Claude Sonnet 3.7. Весов пока нет, модель в превью и все еще обучается.
Блог | Попробовать
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
В эту среду 9 апреля буду выступать очно на мероприятии в МАРХИ и рассказывать про наши эксперименты с применением нейронных сетей в задачах проектирования
Тема: Конференция МАРХИ Перспективы цифровой трансформации градостроительного проектирования и управления
Время: 9 апр. 2025 10:30 AM Москва
Тема: Конференция МАРХИ Перспективы цифровой трансформации градостроительного проектирования и управления
Время: 9 апр. 2025 10:30 AM Москва
5🔥5❤2⚡1
Forwarded from Data Secrets
В опенсорс наконец официально релизнули того самого агента, чью статью приняли на крупнейшую ML-конференцию ICLR
Напоминаем, что это ИИ-агент The AI Scientist-v2 от японской лаборатории Sakana. Его статья (написанная полностью автономно) примерно месяц назад прошла рецензирование на ICLR воркшоп.
Вот наш пост про первую версию. Главный принцип: система разбивает весь процесс на стадии (генерация идей, реализация экспериментов, визуализация и написание текста), и при этом на каждом этапе работает специальный агент-менеджер. Что нового в v2:
1. Agentic tree search. Вместо последовательной проверки гипотез агент теперь гуляет по пространству идей в виде дерева, так что эксперименты могут проводиться параллельно (картинка 2).
2. Добавили Vision-Language Model, которая отдельно проверяет все таблицы, графики, схемы и подписи к ним.
3. Этап экспериментов раздробили на отдельные подшаги. На каждом добавили ответственного агента и критерии завершения.
4. Написание кода стало полностью автономным. Раньше агент умел только менять человеческие шаблоны, но теперь может и код с нуля написать, и нужный датасет найти, и на HF за моделькой сходить.
К сожалению, кое-где в "уязвимых" местах (типа ссылок на литературу) еще остаются галлюцинации, но в целом – здорово.
Техрепорт | Гитхаб
Напоминаем, что это ИИ-агент The AI Scientist-v2 от японской лаборатории Sakana. Его статья (написанная полностью автономно) примерно месяц назад прошла рецензирование на ICLR воркшоп.
Вот наш пост про первую версию. Главный принцип: система разбивает весь процесс на стадии (генерация идей, реализация экспериментов, визуализация и написание текста), и при этом на каждом этапе работает специальный агент-менеджер. Что нового в v2:
1. Agentic tree search. Вместо последовательной проверки гипотез агент теперь гуляет по пространству идей в виде дерева, так что эксперименты могут проводиться параллельно (картинка 2).
2. Добавили Vision-Language Model, которая отдельно проверяет все таблицы, графики, схемы и подписи к ним.
3. Этап экспериментов раздробили на отдельные подшаги. На каждом добавили ответственного агента и критерии завершения.
4. Написание кода стало полностью автономным. Раньше агент умел только менять человеческие шаблоны, но теперь может и код с нуля написать, и нужный датасет найти, и на HF за моделькой сходить.
К сожалению, кое-где в "уязвимых" местах (типа ссылок на литературу) еще остаются галлюцинации, но в целом – здорово.
Техрепорт | Гитхаб
👍4🔥2⚡1
Forwarded from Data Secrets
This media is not supported in your browser
VIEW IN TELEGRAM
Раньше система запоминала только избранную информацию из прошлых чатов. Теперь же она помнит все ваши переписки полностью и может на них ссылаться, а также учитывает любые когда-либо высказанные вами предпочтения и интересы. Такой вот RAG на стероидах.
Доступно в Pro и Plus
* Обратите внимание, что если в прошлом вы отказались от Memory, то сейчас функция вам недоступна. Надо перейти в настройки и разрешить референсинг и память.
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡2👍2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Как работает мозг?
Ученые приблизились к ответу, создав самую большую на сегодняшний день функциональную карту и схему мозга млекопитающего.
«…Команда создала и разработала инструменты, позволяющие обеспечить плотную нейронную реконструкцию в масштабе. Полученный набор данных включает 200 000 клеток и 523 миллиона соединений в первичной зрительной коре и прилегающих областях мыши. Уникальный вклад проекта MICrONS заключается в том, что он также включает в себя функциональные данные in vivo примерно от 75 000 нейронов…»
https://www.nature.com/immersive/d42859-025-00001-w/index.html
Ученые приблизились к ответу, создав самую большую на сегодняшний день функциональную карту и схему мозга млекопитающего.
«…Команда создала и разработала инструменты, позволяющие обеспечить плотную нейронную реконструкцию в масштабе. Полученный набор данных включает 200 000 клеток и 523 миллиона соединений в первичной зрительной коре и прилегающих областях мыши. Уникальный вклад проекта MICrONS заключается в том, что он также включает в себя функциональные данные in vivo примерно от 75 000 нейронов…»
https://www.nature.com/immersive/d42859-025-00001-w/index.html
👍5🤯4
This media is not supported in your browser
VIEW IN TELEGRAM
Previewing Krea Stage
Скоро будет новый инструмент создания 3д сцен Krea.ai
Выглядит прикольно, интересно как это будет работать с архитектурой и зданиями
Скоро будет новый инструмент создания 3д сцен Krea.ai
Выглядит прикольно, интересно как это будет работать с архитектурой и зданиями
👍4⚡1
Forwarded from SINTEZ [синтез]
ПЛАГИНЫ ДЛЯ АГР
Помимо создания моделей для утверждения архитерно-градостроительных решений в Москве, мы постоянно экспериментируем в поисках способов оптимизации этой работы, которые позволят ускорить процесс создания моделей и избежать ошибок на этапе их проверки.
Сегодня на Archi.ru выйдет статья, в которой мы подробно расскажем про два наших новых плагина, которые уже помогают нам автоматизировать проверку моделей и создание JSON для информационной модели города.
Плагины доступны по ссылке.
Eсли вы хотите присоединиться к разработке или поддержке, а также задать интересующие вопросы, вы можете сделать это в комментариях под этим постом или по почте [email protected]
Следите за выходом новых плагинов у нас в Телеграм канале!
@sintez_space
Помимо создания моделей для утверждения архитерно-градостроительных решений в Москве, мы постоянно экспериментируем в поисках способов оптимизации этой работы, которые позволят ускорить процесс создания моделей и избежать ошибок на этапе их проверки.
Сегодня на Archi.ru выйдет статья, в которой мы подробно расскажем про два наших новых плагина, которые уже помогают нам автоматизировать проверку моделей и создание JSON для информационной модели города.
Плагины доступны по ссылке.
Eсли вы хотите присоединиться к разработке или поддержке, а также задать интересующие вопросы, вы можете сделать это в комментариях под этим постом или по почте [email protected]
Следите за выходом новых плагинов у нас в Телеграм канале!
@sintez_space
👍2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
OmniSVG
Еще один чрезвычайно интересный генератор svg геометрии на архитектуре трансформеров.
Как он работает?
Построен на предварительно обученной визуальной языковой модели Qwen-VL (мультимодальный трансформер, умеющий работать с изображениями и текстом на входе). Включает в себя SVG-токенизатор. Модель маркирует входные данные текста и изображения в виде префиксных токенов, в то время как SVG-токенизатор кодирует команды векторной графики в единое пространство представления.
https://omnisvg.github.io/
Еще визуализации смотри ниже👇🏻
Еще один чрезвычайно интересный генератор svg геометрии на архитектуре трансформеров.
Как он работает?
Построен на предварительно обученной визуальной языковой модели Qwen-VL (мультимодальный трансформер, умеющий работать с изображениями и текстом на входе). Включает в себя SVG-токенизатор. Модель маркирует входные данные текста и изображения в виде префиксных токенов, в то время как SVG-токенизатор кодирует команды векторной графики в единое пространство представления.
https://omnisvg.github.io/
Еще визуализации смотри ниже👇🏻
👍3🔥2⚡1