Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
OpenAI ведет переговоры об инвестициях в Merge Labs, стартап в области нейрокомпьютерных интерфейсов, который планирует создание высокоскоростных BCI-систем.
Merge Labs планирует привлечь 250 миллионов долларов при оценке в 850 миллионов. Сэм Альтман будет числиться сооснователем вместе с бывшим топ-менеджером Neuralink Алексом Бланиа, однако не будет заниматься операционной деятельностью. Ожидается, что основное финансирование поступит от венчурного подразделения OpenAI.
Этот шаг еще больше обостряет давнее соперничество между Альтманом и Маском, которые в 2015 году вместе основали OpenAI, но позже разошлись во взглядах.
ft.com
Anthropic объявила о значительном увеличении контекстного окна для Claude Sonnet 4 до одного миллиона токенов. Это в 5 раз больше предыдущего лимита и позволит обрабатывать за один проход целые кодовые базы или большие массивы документов. Новая возможность уже доступна в публичной бете через API Anthropic, Amazon Bedrock, а в скором времени появится и в Google Cloud Vertex AI.
За расширение придется платить больше. Для запросов свыше 200 тыс. входных токенов цена удваивается и составит 6 долларов за миллион токенов. Стоимость выходных токенов также вырастет с 15 до 22.50 долларов за миллион.
anthropic.com
Согласно внутренним документам, Microsoft составила список конкретных сотрудников с указанием их имен, ролей и принадлежности к командам: Reality Labs, GenAI Infrastructure и AI Research. Корпорация готова предложить им многомиллионные компенсационные пакеты - крупные бонусы при найме, конкурентные зарплаты, значительные пакеты акций и высокие годовые премии.
Для ускорения процесса в Microsoft внедрили специальную процедуру. Рекрутеры могут помечать кандидатов как "критически важные ИИ-таланты" и тогда процесс рассмотрения и утверждения на уровне руководства возможен в течение 24 часов.
businessinsider.com
Институт искусственного интеллекта Аллена представил MolmoAct 7B — опенсорсную модель для планирования движений роботов в трехмерном пространстве. Система интерпретирует команды на естественном языке, создает 3D-реконструкцию сцены и прокладывает траекторию движения, которую разработчик может просмотреть и скорректировать до того, как робот начнет действовать.
Модель на 7 млрд. параметров была обучена на 18 млн. примеров, в которых были включены 12 тыс. эпизодов из реального мира. В бенчмарке SimPLER система показала успешность выполнения задач в 72.1%, обойдя решения от Nvidia, Google и Microsoft.
AI2 опубликовал техотчет, веса и датасеты, позиционируя MolmoAct как свободно доступную альтернативу проприетарным решениям.
allenai.org
Платформа создает полноценные, играбельные проекты на основе текстового описания на естественном языке, не требуя навыков программирования. Система использует большие модели для автоматической генерации всех ключевых элементов: 3D-сцен, персонажей и игровой логики, интегрируя текст, 3D-моделирование и физические движки.
Помимо основной генерации, инструмент поддерживает персонализацию созданных игр, предварительный просмотр в реальном времени и возможность оптимизации. SEELE AI позиционирует свой сервис не только как игровой инструмент, но и как платформу для создания контента в сфере образования, маркетинга и социальных сетей.
Попробовать инструмент можно на официальном сайте.
Seele AI в сети Х
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
💊 Это мощно!
Учёные из Университета Саймон Фрейзер представили CGFlow — ИИ-фреймворк, который может радикально ускорить разработку лекарств.
В отличие от прошлых ИИ-инструментов, CGFlow не только проектирует молекулы, но и продумывает реальные пути их химического синтеза, чтобы их можно было произвести в настоящей лаборатории.
Модель пошагово конструирует молекулу, оптимизируя сразу два параметра: биологическую эффективность и практическую реализуемость.
Такой подход способен сократить многолетний (10 лет и ~$1 млрд) цикл создания лекарств до считаных лет. Уже есть интерес со стороны компаний, работающих над лечением рака.
📌 Источник
Учёные из Университета Саймон Фрейзер представили CGFlow — ИИ-фреймворк, который может радикально ускорить разработку лекарств.
В отличие от прошлых ИИ-инструментов, CGFlow не только проектирует молекулы, но и продумывает реальные пути их химического синтеза, чтобы их можно было произвести в настоящей лаборатории.
Модель пошагово конструирует молекулу, оптимизируя сразу два параметра: биологическую эффективность и практическую реализуемость.
Такой подход способен сократить многолетний (10 лет и ~$1 млрд) цикл создания лекарств до считаных лет. Уже есть интерес со стороны компаний, работающих над лечением рака.
📌 Источник
Модель 270 млн параметров (170M для эмбеддингов и 100M для трансформер-блоков), но с отличной способностью следовать промтпам прямо «из коробки».
🔹 Особенности
- 256k токенов
- Энергоэффективность: INT4-версия на Pixel 9 Pro расходует всего 0.75% батареи за 25 диалогов.
- Доступны предобученные и instruction-tuned чекпойнты.
- Поддержка Quantization-Aware Training (QAT) для запуска в INT4 без заметной потери качества.
- Массовые, чётко определённые задачи: анализ тональности, извлечение сущностей, обработка текста, комплаенс-проверки.
- Минимальные задержки и низкая стоимость инференса — можно запускать прямо на устройстве.
- Быстрые эксперименты с fine-tuning.
- Полная приватность данных благодаря on-device работе.
- Создание «флота» узкоспециализированных моделей.
В анонсе приводится пример, как Adaptive ML и SK Telecom дообучили Gemma 3 4B для мультиязычной модерации контента, превзойдя более крупные проприетарные модели.
Gemma 3 270M — отличная компактная модель, быстрая и дешёвая в работе.
#news #ai #ml #Gemma #google
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
🍌Стало известно, что nano-banana — это модель от Google
Если вы пропустили, эта модель стала вирусной на Арене, благодаря своим возможностям редактирования изображений: меняет цвет волос, одежды, целые образы и фоны, сохраняя стиль и детали персонажа.
Nano-banana демонстрирует высокое качество и согласованность, по сравнению с другими моделями на рынке.
📌 Попробовать можно на арене.
@ai_machinelearning_big_data
#NANOBANANA #AI #GenerativeAI #AIart
Если вы пропустили, эта модель стала вирусной на Арене, благодаря своим возможностям редактирования изображений: меняет цвет волос, одежды, целые образы и фоны, сохраняя стиль и детали персонажа.
Nano-banana демонстрирует высокое качество и согласованность, по сравнению с другими моделями на рынке.
📌 Попробовать можно на арене.
@ai_machinelearning_big_data
#NANOBANANA #AI #GenerativeAI #AIart
This media is not supported in your browser
VIEW IN TELEGRAM
- Выглядит как обычная таблица, но вместо формул — тысячи моделей
- Поддержка OpenAI-совместимых и локальных LLM
- Можно добавлять столбцы с промптами, редактировать данные вручную или через лайки
- Запуск онлайн или локально (Docker / pnpm)
- Полностью опенсорс (Apache-2.0), легко встроить в пайплайны
- Подходит для классификации, трансформации данных, синтетики и «vibe-тестов» моделей
⚡️ Попробовать
#AI #NoCode #datasets #HuggingFace #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🧩 Mirage 2 от Dynamics Lab
Новая версия позволяет превратить одно изображение или даже текстовый промпт в полноценный игровой мир прямо в браузере, где игрок может менять окружение на лету с помощью текста.
✨ Ключевая идея — нейросимулятор, который предсказывает следующий кадр и состояние игры из того, что игрок видит и делает. Это объединяет рендеринг и действия в одном цикле.
🎮 Как это работает:
- Загрузите скетч или фото → система превращает его в лэйаут, материалы и физику.
- Движок добавляет персонажа с базовыми действиями: бег, прыжок, атака.
- Язык выступает интерфейсом управления: можно в реальном времени сменить сеттинг (вестерн → город → киберпанк) без прерывания игры.
⚡ Технические детали:
- Задержка ~200 мс — ощущения отклика в реальном времени.
- Горизонт взаимодействия — 10+ минут до накопления дрейфа.
- Работает на одной потребительской GPU → дешевле для тестов и масштабирования.
🌍 Главное:
- Не ограничен жанром, можно делиться созданными мирами мгновенно.
- Недочёты: иногда неточная анимация на поворотах и визуальные «подёргивания» при резкой смене сцены (частично решается корректным промптом).
👏 Важно, что Mirage 2 уже доступен онлайн и вышел всего через месяц после первой версии, в отличие от многих исследовательских прототипов, которые так и не стали публичными.
https://blog.dynamicslab.ai/
Новая версия позволяет превратить одно изображение или даже текстовый промпт в полноценный игровой мир прямо в браузере, где игрок может менять окружение на лету с помощью текста.
✨ Ключевая идея — нейросимулятор, который предсказывает следующий кадр и состояние игры из того, что игрок видит и делает. Это объединяет рендеринг и действия в одном цикле.
🎮 Как это работает:
- Загрузите скетч или фото → система превращает его в лэйаут, материалы и физику.
- Движок добавляет персонажа с базовыми действиями: бег, прыжок, атака.
- Язык выступает интерфейсом управления: можно в реальном времени сменить сеттинг (вестерн → город → киберпанк) без прерывания игры.
⚡ Технические детали:
- Задержка ~200 мс — ощущения отклика в реальном времени.
- Горизонт взаимодействия — 10+ минут до накопления дрейфа.
- Работает на одной потребительской GPU → дешевле для тестов и масштабирования.
🌍 Главное:
- Не ограничен жанром, можно делиться созданными мирами мгновенно.
- Недочёты: иногда неточная анимация на поворотах и визуальные «подёргивания» при резкой смене сцены (частично решается корректным промптом).
👏 Важно, что Mirage 2 уже доступен онлайн и вышел всего через месяц после первой версии, в отличие от многих исследовательских прототипов, которые так и не стали публичными.
https://blog.dynamicslab.ai/
Страх утечки убивает доверие к ИИ.
Мы понимаем, что технологии могут облегчить жизнь: обработать таблицы, структурировать тексты, автоматизировать задачи. Но каждый раз, когда речь заходит о конфиденциальных данных, возникает барьер. Ведь стоит им оказаться в чужой системе — и назад их уже не вернуть.
25 августа в 19:00 (МСК) karpovꓸcourses проведут вебинар «Как обрабатывать конфиденциальные данные с помощью ИИ». Вы увидите, как запускать локальные модели и подключать к ним собственные данные. Все работает прямо на вашем компьютере, и только вы решаете, кто получит доступ к информации.
Спикер — Павел Зуриев, руководитель ИТ-проектов по внедрению ИИ в бизнес-процессы.
Сделайте шаг к безопасной работе с ИИ: https://clc.to/erid_2W5zFJ4PYsJ
Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFJ4PYsJ
Мы понимаем, что технологии могут облегчить жизнь: обработать таблицы, структурировать тексты, автоматизировать задачи. Но каждый раз, когда речь заходит о конфиденциальных данных, возникает барьер. Ведь стоит им оказаться в чужой системе — и назад их уже не вернуть.
25 августа в 19:00 (МСК) karpovꓸcourses проведут вебинар «Как обрабатывать конфиденциальные данные с помощью ИИ». Вы увидите, как запускать локальные модели и подключать к ним собственные данные. Все работает прямо на вашем компьютере, и только вы решаете, кто получит доступ к информации.
Спикер — Павел Зуриев, руководитель ИТ-проектов по внедрению ИИ в бизнес-процессы.
Сделайте шаг к безопасной работе с ИИ: https://clc.to/erid_2W5zFJ4PYsJ
Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFJ4PYsJ
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Google начала масштабное развертывание диалогового поискового режима AI Mode для 180 стран. Ранее функция работала только в США, Великобритании и Индии. Пока доступен только английский язык, а страны Евросоюза в список не вошли из-за строгих правил в области данных и ИИ.
Вместе с географическим расширением Google представила первую агентную возможность в AI Mode. Теперь пользователи в США могут находить и бронировать столики в ресторанах через платформы OpenTable и Resy, прямо из поисковой выдачи. В будущем планируется добавить бронирование билетов и запись на услуги. Эта функция пока доступна только подписчикам платного тарифа Google AI Ultra.
9to5google.com
Компания анонсировала бета-версию платформы Game Worlds, на которой пользователи в реальном времени могут создавать и исследовать полностью сгенерированных персонажей, сюжеты и окружения.
Одновременно с этим Runway добавила в свой продукт Act-Two новую функцию «Voices». Она дает возможность подбирать и настраивать голоса для ИИ-персонажей.
Эти нововведения - часть стратегии компании по демократизации создания иммерсивного контента, делая его доступным для авторов без специальных навыков в программировании или анимации.
RunwayML в сети X
В сети появились фото тестовых образцов следующего поколения ИИ-архитектуры Jaguar Shores. Размер корпуса 92,5 мм на 92,5 мм, он включает 4 отдельных кристалла и 8 площадок памяти HBM, что явно указывает на платформу для высокопроизводительных вычислений.
Jaguar Shores станет первым стоечным решением Intel, планируется использование памяти HBM4 от SK Hynix и совместная работа с будущими процессорами Xeon Diamond Rapids.
wccftech.com
NVIDIA выпустила Streaming Sortformer - модель для диаризации речи, которая мгновенно определяет и маркирует участников разговора в реальном времени с низкой задержкой.
Модель оптимизирована для английского и китайского языков, способна отслеживать до 4 говорящих одновременно и предназначена для работы на GPU. По результатам тестов, Streaming Sortformer показывает более низкий уровень ошибок (DER) по сравнению с конкурирующими решениями.
Streaming Sortformer подойдет для применения в колл-центрах, при создании протоколов встреч и в интерактивных голосовых приложениях, где важно точно знать, кто, что и когда сказал. Модель доступна на Hugging Face.
developer.nvidia.com
AMD выпустила новейшую технологию масштабирования изображения FidelityFX Super Resolution 4 (FSR 4). Это часть обновления FidelityFX SDK 2.0, где AMD впервые внедряет алгоритм апскейлинга на основе машинного обучения для улучшения качества графики и производительности в играх.
По сравнению с предыдущей версией 3.1, FSR 4 показывает улучшения в детализации изображения и временной стабильности, а также снижает артефакты гостинга движущихся объектов. FSR 4 поддерживается только видеокартами AMD Radeon RX 9000 серии и выше на архитектуре RDNA 4 и требует DirectX 12. AMD также предоставила плагины FSR 4 для Unreal Engine версий 5.1–5.6.
gpuopen.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Save the date: 28 августа 18:00 мск — RecSys Meetup!
Будем обсуждать всё самое актуальное из мира рекомендательных систем: от передовых архитектур для Semantic IDs и их внедрения в продакшн до тонкостей балансировки интересов пользователей и продавцов маркетплейса с помощью онлайн-доранжирования и байесовской оптимизации.
📅 Когда: 28 августа, начало в 18:00
📍 Где: Москва + онлайн-трансляция
🗓 Программа митапа:
«Semantic IDs: архитектура и наш опыт внедрения»
👨💻 Александр Тришин, DS Stream Lead (персональные рекомендации)
— Ключевые архитектуры Semantic IDs (RQ-VAE, RQ-KMeans).
— Опыт внедрения в продакшн: динамика каталога, поддержка стабильности представлений.
— Применение Semantic IDs в рекомендательных моделях для повышения качества рекомендаций.
«Счастье пользователя vs счастье продавца. Онлайн-доранжирование и байесовская оптимизация»
👨💻 Андрей Ветров, Data Scientist (товарные рекомендации)
— Способы учитывать интересы и пользователей, и продавцов.
— Онлайн-доранжирование и байесовская оптимизация как способ найти баланс и повысить эффективность маркетплейса.
«Как мы обучаем CLIP-ы для текстовых тегов»
👨💻 Михаил Киндулов, Stream Lead (Поиск по фото)
— Обучение CLIP-моделей на большом объёме данных в Wildberries & Russ.
— Применение CLIP для задачи автоматического подбора текстовых тегов к изображениям.
«Трансформеры в персональных рекомендациях: от гипотез до AB-тестирования»
👨💻 Иван Ващенко, DS Team Lead (персональные рекомендации)
— Опыт использования BERT4Rec на главной странице Wildberries.
— Проверка гипотез в offline и nearline процессах.
— Head-to-head AB-тесты, онлайн-инференс на Triton.
— Баланс между оффлайн-метриками и реальным онлайн-эффектом.
📝 Регистрация уже открыта!
⚡️ Для участия в офлайн-формате регистрация обязательна.
Будем обсуждать всё самое актуальное из мира рекомендательных систем: от передовых архитектур для Semantic IDs и их внедрения в продакшн до тонкостей балансировки интересов пользователей и продавцов маркетплейса с помощью онлайн-доранжирования и байесовской оптимизации.
📅 Когда: 28 августа, начало в 18:00
📍 Где: Москва + онлайн-трансляция
🗓 Программа митапа:
«Semantic IDs: архитектура и наш опыт внедрения»
👨💻 Александр Тришин, DS Stream Lead (персональные рекомендации)
— Ключевые архитектуры Semantic IDs (RQ-VAE, RQ-KMeans).
— Опыт внедрения в продакшн: динамика каталога, поддержка стабильности представлений.
— Применение Semantic IDs в рекомендательных моделях для повышения качества рекомендаций.
«Счастье пользователя vs счастье продавца. Онлайн-доранжирование и байесовская оптимизация»
👨💻 Андрей Ветров, Data Scientist (товарные рекомендации)
— Способы учитывать интересы и пользователей, и продавцов.
— Онлайн-доранжирование и байесовская оптимизация как способ найти баланс и повысить эффективность маркетплейса.
«Как мы обучаем CLIP-ы для текстовых тегов»
👨💻 Михаил Киндулов, Stream Lead (Поиск по фото)
— Обучение CLIP-моделей на большом объёме данных в Wildberries & Russ.
— Применение CLIP для задачи автоматического подбора текстовых тегов к изображениям.
«Трансформеры в персональных рекомендациях: от гипотез до AB-тестирования»
👨💻 Иван Ващенко, DS Team Lead (персональные рекомендации)
— Опыт использования BERT4Rec на главной странице Wildberries.
— Проверка гипотез в offline и nearline процессах.
— Head-to-head AB-тесты, онлайн-инференс на Triton.
— Баланс между оффлайн-метриками и реальным онлайн-эффектом.
📝 Регистрация уже открыта!
⚡️ Для участия в офлайн-формате регистрация обязательна.