💊 Это мощно!
Учёные из Университета Саймон Фрейзер представили CGFlow — ИИ-фреймворк, который может радикально ускорить разработку лекарств.
В отличие от прошлых ИИ-инструментов, CGFlow не только проектирует молекулы, но и продумывает реальные пути их химического синтеза, чтобы их можно было произвести в настоящей лаборатории.
Модель пошагово конструирует молекулу, оптимизируя сразу два параметра: биологическую эффективность и практическую реализуемость.
Такой подход способен сократить многолетний (10 лет и ~$1 млрд) цикл создания лекарств до считаных лет. Уже есть интерес со стороны компаний, работающих над лечением рака.
📌 Источник
Учёные из Университета Саймон Фрейзер представили CGFlow — ИИ-фреймворк, который может радикально ускорить разработку лекарств.
В отличие от прошлых ИИ-инструментов, CGFlow не только проектирует молекулы, но и продумывает реальные пути их химического синтеза, чтобы их можно было произвести в настоящей лаборатории.
Модель пошагово конструирует молекулу, оптимизируя сразу два параметра: биологическую эффективность и практическую реализуемость.
Такой подход способен сократить многолетний (10 лет и ~$1 млрд) цикл создания лекарств до считаных лет. Уже есть интерес со стороны компаний, работающих над лечением рака.
📌 Источник
Модель 270 млн параметров (170M для эмбеддингов и 100M для трансформер-блоков), но с отличной способностью следовать промтпам прямо «из коробки».
🔹 Особенности
- 256k токенов
- Энергоэффективность: INT4-версия на Pixel 9 Pro расходует всего 0.75% батареи за 25 диалогов.
- Доступны предобученные и instruction-tuned чекпойнты.
- Поддержка Quantization-Aware Training (QAT) для запуска в INT4 без заметной потери качества.
- Массовые, чётко определённые задачи: анализ тональности, извлечение сущностей, обработка текста, комплаенс-проверки.
- Минимальные задержки и низкая стоимость инференса — можно запускать прямо на устройстве.
- Быстрые эксперименты с fine-tuning.
- Полная приватность данных благодаря on-device работе.
- Создание «флота» узкоспециализированных моделей.
В анонсе приводится пример, как Adaptive ML и SK Telecom дообучили Gemma 3 4B для мультиязычной модерации контента, превзойдя более крупные проприетарные модели.
Gemma 3 270M — отличная компактная модель, быстрая и дешёвая в работе.
#news #ai #ml #Gemma #google
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
🍌Стало известно, что nano-banana — это модель от Google
Если вы пропустили, эта модель стала вирусной на Арене, благодаря своим возможностям редактирования изображений: меняет цвет волос, одежды, целые образы и фоны, сохраняя стиль и детали персонажа.
Nano-banana демонстрирует высокое качество и согласованность, по сравнению с другими моделями на рынке.
📌 Попробовать можно на арене.
@ai_machinelearning_big_data
#NANOBANANA #AI #GenerativeAI #AIart
Если вы пропустили, эта модель стала вирусной на Арене, благодаря своим возможностям редактирования изображений: меняет цвет волос, одежды, целые образы и фоны, сохраняя стиль и детали персонажа.
Nano-banana демонстрирует высокое качество и согласованность, по сравнению с другими моделями на рынке.
📌 Попробовать можно на арене.
@ai_machinelearning_big_data
#NANOBANANA #AI #GenerativeAI #AIart
This media is not supported in your browser
VIEW IN TELEGRAM
- Выглядит как обычная таблица, но вместо формул — тысячи моделей
- Поддержка OpenAI-совместимых и локальных LLM
- Можно добавлять столбцы с промптами, редактировать данные вручную или через лайки
- Запуск онлайн или локально (Docker / pnpm)
- Полностью опенсорс (Apache-2.0), легко встроить в пайплайны
- Подходит для классификации, трансформации данных, синтетики и «vibe-тестов» моделей
⚡️ Попробовать
#AI #NoCode #datasets #HuggingFace #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🧩 Mirage 2 от Dynamics Lab
Новая версия позволяет превратить одно изображение или даже текстовый промпт в полноценный игровой мир прямо в браузере, где игрок может менять окружение на лету с помощью текста.
✨ Ключевая идея — нейросимулятор, который предсказывает следующий кадр и состояние игры из того, что игрок видит и делает. Это объединяет рендеринг и действия в одном цикле.
🎮 Как это работает:
- Загрузите скетч или фото → система превращает его в лэйаут, материалы и физику.
- Движок добавляет персонажа с базовыми действиями: бег, прыжок, атака.
- Язык выступает интерфейсом управления: можно в реальном времени сменить сеттинг (вестерн → город → киберпанк) без прерывания игры.
⚡ Технические детали:
- Задержка ~200 мс — ощущения отклика в реальном времени.
- Горизонт взаимодействия — 10+ минут до накопления дрейфа.
- Работает на одной потребительской GPU → дешевле для тестов и масштабирования.
🌍 Главное:
- Не ограничен жанром, можно делиться созданными мирами мгновенно.
- Недочёты: иногда неточная анимация на поворотах и визуальные «подёргивания» при резкой смене сцены (частично решается корректным промптом).
👏 Важно, что Mirage 2 уже доступен онлайн и вышел всего через месяц после первой версии, в отличие от многих исследовательских прототипов, которые так и не стали публичными.
https://blog.dynamicslab.ai/
Новая версия позволяет превратить одно изображение или даже текстовый промпт в полноценный игровой мир прямо в браузере, где игрок может менять окружение на лету с помощью текста.
✨ Ключевая идея — нейросимулятор, который предсказывает следующий кадр и состояние игры из того, что игрок видит и делает. Это объединяет рендеринг и действия в одном цикле.
🎮 Как это работает:
- Загрузите скетч или фото → система превращает его в лэйаут, материалы и физику.
- Движок добавляет персонажа с базовыми действиями: бег, прыжок, атака.
- Язык выступает интерфейсом управления: можно в реальном времени сменить сеттинг (вестерн → город → киберпанк) без прерывания игры.
⚡ Технические детали:
- Задержка ~200 мс — ощущения отклика в реальном времени.
- Горизонт взаимодействия — 10+ минут до накопления дрейфа.
- Работает на одной потребительской GPU → дешевле для тестов и масштабирования.
🌍 Главное:
- Не ограничен жанром, можно делиться созданными мирами мгновенно.
- Недочёты: иногда неточная анимация на поворотах и визуальные «подёргивания» при резкой смене сцены (частично решается корректным промптом).
👏 Важно, что Mirage 2 уже доступен онлайн и вышел всего через месяц после первой версии, в отличие от многих исследовательских прототипов, которые так и не стали публичными.
https://blog.dynamicslab.ai/
Страх утечки убивает доверие к ИИ.
Мы понимаем, что технологии могут облегчить жизнь: обработать таблицы, структурировать тексты, автоматизировать задачи. Но каждый раз, когда речь заходит о конфиденциальных данных, возникает барьер. Ведь стоит им оказаться в чужой системе — и назад их уже не вернуть.
25 августа в 19:00 (МСК) karpovꓸcourses проведут вебинар «Как обрабатывать конфиденциальные данные с помощью ИИ». Вы увидите, как запускать локальные модели и подключать к ним собственные данные. Все работает прямо на вашем компьютере, и только вы решаете, кто получит доступ к информации.
Спикер — Павел Зуриев, руководитель ИТ-проектов по внедрению ИИ в бизнес-процессы.
Сделайте шаг к безопасной работе с ИИ: https://clc.to/erid_2W5zFJ4PYsJ
Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFJ4PYsJ
Мы понимаем, что технологии могут облегчить жизнь: обработать таблицы, структурировать тексты, автоматизировать задачи. Но каждый раз, когда речь заходит о конфиденциальных данных, возникает барьер. Ведь стоит им оказаться в чужой системе — и назад их уже не вернуть.
25 августа в 19:00 (МСК) karpovꓸcourses проведут вебинар «Как обрабатывать конфиденциальные данные с помощью ИИ». Вы увидите, как запускать локальные модели и подключать к ним собственные данные. Все работает прямо на вашем компьютере, и только вы решаете, кто получит доступ к информации.
Спикер — Павел Зуриев, руководитель ИТ-проектов по внедрению ИИ в бизнес-процессы.
Сделайте шаг к безопасной работе с ИИ: https://clc.to/erid_2W5zFJ4PYsJ
Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFJ4PYsJ
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
Google начала масштабное развертывание диалогового поискового режима AI Mode для 180 стран. Ранее функция работала только в США, Великобритании и Индии. Пока доступен только английский язык, а страны Евросоюза в список не вошли из-за строгих правил в области данных и ИИ.
Вместе с географическим расширением Google представила первую агентную возможность в AI Mode. Теперь пользователи в США могут находить и бронировать столики в ресторанах через платформы OpenTable и Resy, прямо из поисковой выдачи. В будущем планируется добавить бронирование билетов и запись на услуги. Эта функция пока доступна только подписчикам платного тарифа Google AI Ultra.
9to5google.com
Компания анонсировала бета-версию платформы Game Worlds, на которой пользователи в реальном времени могут создавать и исследовать полностью сгенерированных персонажей, сюжеты и окружения.
Одновременно с этим Runway добавила в свой продукт Act-Two новую функцию «Voices». Она дает возможность подбирать и настраивать голоса для ИИ-персонажей.
Эти нововведения - часть стратегии компании по демократизации создания иммерсивного контента, делая его доступным для авторов без специальных навыков в программировании или анимации.
RunwayML в сети X
В сети появились фото тестовых образцов следующего поколения ИИ-архитектуры Jaguar Shores. Размер корпуса 92,5 мм на 92,5 мм, он включает 4 отдельных кристалла и 8 площадок памяти HBM, что явно указывает на платформу для высокопроизводительных вычислений.
Jaguar Shores станет первым стоечным решением Intel, планируется использование памяти HBM4 от SK Hynix и совместная работа с будущими процессорами Xeon Diamond Rapids.
wccftech.com
NVIDIA выпустила Streaming Sortformer - модель для диаризации речи, которая мгновенно определяет и маркирует участников разговора в реальном времени с низкой задержкой.
Модель оптимизирована для английского и китайского языков, способна отслеживать до 4 говорящих одновременно и предназначена для работы на GPU. По результатам тестов, Streaming Sortformer показывает более низкий уровень ошибок (DER) по сравнению с конкурирующими решениями.
Streaming Sortformer подойдет для применения в колл-центрах, при создании протоколов встреч и в интерактивных голосовых приложениях, где важно точно знать, кто, что и когда сказал. Модель доступна на Hugging Face.
developer.nvidia.com
AMD выпустила новейшую технологию масштабирования изображения FidelityFX Super Resolution 4 (FSR 4). Это часть обновления FidelityFX SDK 2.0, где AMD впервые внедряет алгоритм апскейлинга на основе машинного обучения для улучшения качества графики и производительности в играх.
По сравнению с предыдущей версией 3.1, FSR 4 показывает улучшения в детализации изображения и временной стабильности, а также снижает артефакты гостинга движущихся объектов. FSR 4 поддерживается только видеокартами AMD Radeon RX 9000 серии и выше на архитектуре RDNA 4 и требует DirectX 12. AMD также предоставила плагины FSR 4 для Unreal Engine версий 5.1–5.6.
gpuopen.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Save the date: 28 августа 18:00 мск — RecSys Meetup!
Будем обсуждать всё самое актуальное из мира рекомендательных систем: от передовых архитектур для Semantic IDs и их внедрения в продакшн до тонкостей балансировки интересов пользователей и продавцов маркетплейса с помощью онлайн-доранжирования и байесовской оптимизации.
📅 Когда: 28 августа, начало в 18:00
📍 Где: Москва + онлайн-трансляция
🗓 Программа митапа:
«Semantic IDs: архитектура и наш опыт внедрения»
👨💻 Александр Тришин, DS Stream Lead (персональные рекомендации)
— Ключевые архитектуры Semantic IDs (RQ-VAE, RQ-KMeans).
— Опыт внедрения в продакшн: динамика каталога, поддержка стабильности представлений.
— Применение Semantic IDs в рекомендательных моделях для повышения качества рекомендаций.
«Счастье пользователя vs счастье продавца. Онлайн-доранжирование и байесовская оптимизация»
👨💻 Андрей Ветров, Data Scientist (товарные рекомендации)
— Способы учитывать интересы и пользователей, и продавцов.
— Онлайн-доранжирование и байесовская оптимизация как способ найти баланс и повысить эффективность маркетплейса.
«Как мы обучаем CLIP-ы для текстовых тегов»
👨💻 Михаил Киндулов, Stream Lead (Поиск по фото)
— Обучение CLIP-моделей на большом объёме данных в Wildberries & Russ.
— Применение CLIP для задачи автоматического подбора текстовых тегов к изображениям.
«Трансформеры в персональных рекомендациях: от гипотез до AB-тестирования»
👨💻 Иван Ващенко, DS Team Lead (персональные рекомендации)
— Опыт использования BERT4Rec на главной странице Wildberries.
— Проверка гипотез в offline и nearline процессах.
— Head-to-head AB-тесты, онлайн-инференс на Triton.
— Баланс между оффлайн-метриками и реальным онлайн-эффектом.
📝 Регистрация уже открыта!
⚡️ Для участия в офлайн-формате регистрация обязательна.
Будем обсуждать всё самое актуальное из мира рекомендательных систем: от передовых архитектур для Semantic IDs и их внедрения в продакшн до тонкостей балансировки интересов пользователей и продавцов маркетплейса с помощью онлайн-доранжирования и байесовской оптимизации.
📅 Когда: 28 августа, начало в 18:00
📍 Где: Москва + онлайн-трансляция
🗓 Программа митапа:
«Semantic IDs: архитектура и наш опыт внедрения»
👨💻 Александр Тришин, DS Stream Lead (персональные рекомендации)
— Ключевые архитектуры Semantic IDs (RQ-VAE, RQ-KMeans).
— Опыт внедрения в продакшн: динамика каталога, поддержка стабильности представлений.
— Применение Semantic IDs в рекомендательных моделях для повышения качества рекомендаций.
«Счастье пользователя vs счастье продавца. Онлайн-доранжирование и байесовская оптимизация»
👨💻 Андрей Ветров, Data Scientist (товарные рекомендации)
— Способы учитывать интересы и пользователей, и продавцов.
— Онлайн-доранжирование и байесовская оптимизация как способ найти баланс и повысить эффективность маркетплейса.
«Как мы обучаем CLIP-ы для текстовых тегов»
👨💻 Михаил Киндулов, Stream Lead (Поиск по фото)
— Обучение CLIP-моделей на большом объёме данных в Wildberries & Russ.
— Применение CLIP для задачи автоматического подбора текстовых тегов к изображениям.
«Трансформеры в персональных рекомендациях: от гипотез до AB-тестирования»
👨💻 Иван Ващенко, DS Team Lead (персональные рекомендации)
— Опыт использования BERT4Rec на главной странице Wildberries.
— Проверка гипотез в offline и nearline процессах.
— Head-to-head AB-тесты, онлайн-инференс на Triton.
— Баланс между оффлайн-метриками и реальным онлайн-эффектом.
📝 Регистрация уже открыта!
⚡️ Для участия в офлайн-формате регистрация обязательна.
Forwarded from Machinelearning
Большие данные - это топливо для ИИ. Но как их использовать, чтобы не нарушить приватность, например датасета, где есть персональные данные?
Один из вариантов - метод дифференциально-приватного отбора. Он выбирает из огромного набора уникальные элементы так, чтобы нельзя было соотнести их с конкретным человеком. А если данных - больше миллиарда? Для этого нужен более надежный подход.
Таким алгоритмом стал Max Adaptive Degree (MAD), представленный Google на ICML 2025. Он не только эффективнее других параллельных методов, но и работает с наборами данных на десятки и сотни миллиардов записей.
Но тут появляется новая проблема - популярные элементы получают избыточный вес, который можно было бы использовать для менее частых, но ценных данных.
MAD решает ее с помощью адаптивного взвешивания, перераспределяя вес: забирает часть у популярных элементов и отдает тем, чьи значения уже находятся у порога. Это позволяет отобрать больше полезных данных без потери приватности.
Простой пример: представьте 100 пользователей, у каждого по 3 элемента. Один элемент (A) есть у всех, а остальные элементы уникальны. В базовом алгоритме элемент A получит слишком много веса (намного больше необходимого), а уникальные элементы - слишком мало. MAD "забирает" часть веса у A и распределяет его между уникальными элементами, давая им шанс пройти порог.
Метод можно использовать в несколько итераций, публикуя промежуточные результаты с шумом. Так можно еще точнее распределять вес между раундами.
В первом раунде запускается MAD как обычно, а во втором удаляются уже найденные элементы и те, которые явно не пройдут порог. Для остальных элементов применяется "смещение" веса на основе данных первого раунда.
На практике MAD показал отличные результаты. Всего за 2 этапа он отобрал больше полезных элементов, чем другие методы. Например, в Common Crawl (800 млрд. записей) он выбрал набор слов, который покрыл 99.9% всех записей и 97% уникальных слов с полным соблюдением приватности.
@ai_machinelearning_big_data
#AI #ML #Selection #MAD #Google
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM