Neural Networks | Нейронные сети
11.7K subscribers
766 photos
170 videos
170 files
9.42K links
Все о машинном обучении

По всем вопросам - @notxxx1

№ 4959169263
Download Telegram
🚨 Breaking News

> DeepSeek-R2 выйдет в период с 15 по 30 августа
> На 97% дешевле GPT-4
> Обучен на кластере чипов Huawei 910 B Ascend (91% эффективности от NVIDIA A100)
💊 Это мощно!

Учёные из Университета Саймон Фрейзер представили CGFlow — ИИ-фреймворк, который может радикально ускорить разработку лекарств.

В отличие от прошлых ИИ-инструментов, CGFlow не только проектирует молекулы, но и продумывает реальные пути их химического синтеза, чтобы их можно было произвести в настоящей лаборатории.

Модель пошагово конструирует молекулу, оптимизируя сразу два параметра: биологическую эффективность и практическую реализуемость.

Такой подход способен сократить многолетний (10 лет и ~$1 млрд) цикл создания лекарств до считаных лет. Уже есть интерес со стороны компаний, работающих над лечением рака.

📌 Источник
Google представила Gemma 3 270M — компактную модель

Модель 270 млн параметров (170M для эмбеддингов и 100M для трансформер-блоков), но с отличной способностью следовать промтпам прямо «из коробки».

🔹 Особенности
- 256k токенов
- Энергоэффективность: INT4-версия на Pixel 9 Pro расходует всего 0.75% батареи за 25 диалогов.
- Доступны предобученные и instruction-tuned чекпойнты.
- Поддержка Quantization-Aware Training (QAT) для запуска в INT4 без заметной потери качества.

💼 Когда использовать
- Массовые, чётко определённые задачи: анализ тональности, извлечение сущностей, обработка текста, комплаенс-проверки.
- Минимальные задержки и низкая стоимость инференса — можно запускать прямо на устройстве.
- Быстрые эксперименты с fine-tuning.
- Полная приватность данных благодаря on-device работе.
- Создание «флота» узкоспециализированных моделей.

В анонсе приводится пример, как Adaptive ML и SK Telecom дообучили Gemma 3 4B для мультиязычной модерации контента, превзойдя более крупные проприетарные модели.

Gemma 3 270M — отличная компактная модель, быстрая и дешёвая в работе.

🟠Подробности: https://developers.googleblog.com/en/introducing-gemma-3-270m/
🟠HF: https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

#news #ai #ml #Gemma #google
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Пользователи Claude Code после возвращения с бесплатного GPT-5 в Cursor!
Статья NYT 2018 года. Другое время.
Forwarded from Machinelearning
🍌Стало известно, что nano-banana — это модель от Google

Если вы пропустили, эта модель стала вирусной на Арене, благодаря своим возможностям редактирования изображений: меняет цвет волос, одежды, целые образы и фоны, сохраняя стиль и детали персонажа.

Nano-banana демонстрирует высокое качество и согласованность, по сравнению с другими моделями на рынке.

📌 Попробовать можно на арене.

@ai_machinelearning_big_data


#NANOBANANA #AI #GenerativeAI #AIart
This media is not supported in your browser
VIEW IN TELEGRAM
🆕 Hugging Face представили **AI Sheets** — no-code инструмент для создания и обработки таблиц с помощью ИИ.

- Выглядит как обычная таблица, но вместо формул — тысячи моделей
- Поддержка OpenAI-совместимых и локальных LLM
- Можно добавлять столбцы с промптами, редактировать данные вручную или через лайки
- Запуск онлайн или локально (Docker / pnpm)
- Полностью опенсорс (Apache-2.0), легко встроить в пайплайны
- Подходит для классификации, трансформации данных, синтетики и «vibe-тестов» моделей

⚡️ Попробовать

#AI #NoCode #datasets #HuggingFace #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🧩 Mirage 2 от Dynamics Lab

Новая версия позволяет превратить одно изображение или даже текстовый промпт в полноценный игровой мир прямо в браузере, где игрок может менять окружение на лету с помощью текста.

Ключевая идея — нейросимулятор, который предсказывает следующий кадр и состояние игры из того, что игрок видит и делает. Это объединяет рендеринг и действия в одном цикле.

🎮 Как это работает:
- Загрузите скетч или фото → система превращает его в лэйаут, материалы и физику.
- Движок добавляет персонажа с базовыми действиями: бег, прыжок, атака.
- Язык выступает интерфейсом управления: можно в реальном времени сменить сеттинг (вестерн → город → киберпанк) без прерывания игры.

Технические детали:
- Задержка ~200 мс — ощущения отклика в реальном времени.
- Горизонт взаимодействия — 10+ минут до накопления дрейфа.
- Работает на одной потребительской GPU → дешевле для тестов и масштабирования.

🌍 Главное:
- Не ограничен жанром, можно делиться созданными мирами мгновенно.
- Недочёты: иногда неточная анимация на поворотах и визуальные «подёргивания» при резкой смене сцены (частично решается корректным промптом).

👏 Важно, что Mirage 2 уже доступен онлайн и вышел всего через месяц после первой версии, в отличие от многих исследовательских прототипов, которые так и не стали публичными.

https://blog.dynamicslab.ai/
Страх утечки убивает доверие к ИИ.

Мы понимаем, что технологии могут облегчить жизнь: обработать таблицы, структурировать тексты, автоматизировать задачи. Но каждый раз, когда речь заходит о конфиденциальных данных, возникает барьер. Ведь стоит им оказаться в чужой системе — и назад их уже не вернуть.

25 августа в 19:00 (МСК) karpovꓸcourses проведут вебинар «Как обрабатывать конфиденциальные данные с помощью ИИ». Вы увидите, как запускать локальные модели и подключать к ним собственные данные. Все работает прямо на вашем компьютере, и только вы решаете, кто получит доступ к информации.

Спикер — Павел Зуриев, руководитель ИТ-проектов по внедрению ИИ в бизнес-процессы.

Сделайте шаг к безопасной работе с ИИ: https://clc.to/erid_2W5zFJ4PYsJ

Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFJ4PYsJ
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Google расширила доступ к ИИ-поиску на 180 стран и добавила функцию бронирования.

Google начала масштабное развертывание диалогового поискового режима AI Mode для 180 стран. Ранее функция работала только в США, Великобритании и Индии. Пока доступен только английский язык, а страны Евросоюза в список не вошли из-за строгих правил в области данных и ИИ.

Вместе с географическим расширением Google представила первую агентную возможность в AI Mode. Теперь пользователи в США могут находить и бронировать столики в ресторанах через платформы OpenTable и Resy, прямо из поисковой выдачи. В будущем планируется добавить бронирование билетов и запись на услуги. Эта функция пока доступна только подписчикам платного тарифа Google AI Ultra.
9to5google.com

✔️ Runway представила платформу для создания интерактивных ИИ-миров.

Компания анонсировала бета-версию платформы Game Worlds, на которой пользователи в реальном времени могут создавать и исследовать полностью сгенерированных персонажей, сюжеты и окружения.

Одновременно с этим Runway добавила в свой продукт Act-Two новую функцию «Voices». Она дает возможность подбирать и настраивать голоса для ИИ-персонажей.

Эти нововведения - часть стратегии компании по демократизации создания иммерсивного контента, делая его доступным для авторов без специальных навыков в программировании или анимации.
RunwayML в сети X

✔️ Появились тестовые образцы нового ИИ-чипа Intel Jaguar Shores

В сети появились фото тестовых образцов следующего поколения ИИ-архитектуры Jaguar Shores. Размер корпуса 92,5 мм на 92,5 мм, он включает 4 отдельных кристалла и 8 площадок памяти HBM, что явно указывает на платформу для высокопроизводительных вычислений.

Jaguar Shores станет первым стоечным решением Intel, планируется использование памяти HBM4 от SK Hynix и совместная работа с будущими процессорами Xeon Diamond Rapids.
wccftech.com

✔️ Streaming Sortformer: модель для распознавания говорящих в реальном времени.

NVIDIA выпустила Streaming Sortformer - модель для диаризации речи, которая мгновенно определяет и маркирует участников разговора в реальном времени с низкой задержкой.

Модель оптимизирована для английского и китайского языков, способна отслеживать до 4 говорящих одновременно и предназначена для работы на GPU. По результатам тестов, Streaming Sortformer показывает более низкий уровень ошибок (DER) по сравнению с конкурирующими решениями.

Streaming Sortformer подойдет для применения в колл-центрах, при создании протоколов встреч и в интерактивных голосовых приложениях, где важно точно знать, кто, что и когда сказал. Модель доступна на Hugging Face.
developer.nvidia.com

✔️ AMD официально представила технологию FSR 4.

AMD выпустила новейшую технологию масштабирования изображения FidelityFX Super Resolution 4 (FSR 4). Это часть обновления FidelityFX SDK 2.0, где AMD впервые внедряет алгоритм апскейлинга на основе машинного обучения для улучшения качества графики и производительности в играх.

По сравнению с предыдущей версией 3.1, FSR 4 показывает улучшения в детализации изображения и временной стабильности, а также снижает артефакты гостинга движущихся объектов. FSR 4 поддерживается только видеокартами AMD Radeon RX 9000 серии и выше на архитектуре RDNA 4 и требует DirectX 12. AMD также предоставила плагины FSR 4 для Unreal Engine версий 5.1–5.6.
gpuopen.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Save the date: 28 августа 18:00 мск — RecSys Meetup!

Будем обсуждать всё самое актуальное из мира рекомендательных систем: от передовых архитектур для Semantic IDs и их внедрения в продакшн до тонкостей балансировки интересов пользователей и продавцов маркетплейса с помощью онлайн-доранжирования и байесовской оптимизации.

📅 Когда: 28 августа, начало в 18:00
📍 Где: Москва + онлайн-трансляция

🗓 Программа митапа:

«Semantic IDs: архитектура и наш опыт внедрения»
👨‍💻 Александр Тришин, DS Stream Lead (персональные рекомендации)

— Ключевые архитектуры Semantic IDs (RQ-VAE, RQ-KMeans).
— Опыт внедрения в продакшн: динамика каталога, поддержка стабильности представлений.
— Применение Semantic IDs в рекомендательных моделях для повышения качества рекомендаций.

«Счастье пользователя vs счастье продавца. Онлайн-доранжирование и байесовская оптимизация»
👨‍💻 Андрей Ветров, Data Scientist (товарные рекомендации)

— Способы учитывать интересы и пользователей, и продавцов.
— Онлайн-доранжирование и байесовская оптимизация как способ найти баланс и повысить эффективность маркетплейса.

«Как мы обучаем CLIP-ы для текстовых тегов»
👨‍💻 Михаил Киндулов, Stream Lead (Поиск по фото)

— Обучение CLIP-моделей на большом объёме данных в Wildberries & Russ.
— Применение CLIP для задачи автоматического подбора текстовых тегов к изображениям.

«Трансформеры в персональных рекомендациях: от гипотез до AB-тестирования»
👨‍💻 Иван Ващенко, DS Team Lead (персональные рекомендации)

— Опыт использования BERT4Rec на главной странице Wildberries.
— Проверка гипотез в offline и nearline процессах.
— Head-to-head AB-тесты, онлайн-инференс на Triton.
— Баланс между оффлайн-метриками и реальным онлайн-эффектом.

📝 Регистрация уже открыта!
⚡️ Для участия в офлайн-формате регистрация обязательна.
Forwarded from Machinelearning
🌟 MAD: алгоритм безопасной работы с огромными датасетами.

Большие данные - это топливо для ИИ. Но как их использовать, чтобы не нарушить приватность, например датасета, где есть персональные данные?

Один из вариантов - метод дифференциально-приватного отбора. Он выбирает из огромного набора уникальные элементы так, чтобы нельзя было соотнести их с конкретным человеком. А если данных - больше миллиарда? Для этого нужен более надежный подход.

Таким алгоритмом стал Max Adaptive Degree (MAD), представленный Google на ICML 2025. Он не только эффективнее других параллельных методов, но и работает с наборами данных на десятки и сотни миллиардов записей.

🟡Стандартный MAD метод состоит из 3 шагов:

🟢Каждому элементу присваивается вес (обычно по частоте использования).

🟢К весу добавляется случайный шум для защиты приватности.

🟢Выбираются только те элементы, чей вес с шумом превышает определенный порог.

Но тут появляется новая проблема - популярные элементы получают избыточный вес, который можно было бы использовать для менее частых, но ценных данных.

MAD решает ее с помощью адаптивного взвешивания, перераспределяя вес: забирает часть у популярных элементов и отдает тем, чьи значения уже находятся у порога. Это позволяет отобрать больше полезных данных без потери приватности.

Простой пример: представьте 100 пользователей, у каждого по 3 элемента. Один элемент (A) есть у всех, а остальные элементы уникальны. В базовом алгоритме элемент A получит слишком много веса (намного больше необходимого), а уникальные элементы - слишком мало. MAD "забирает" часть веса у A и распределяет его между уникальными элементами, давая им шанс пройти порог.


🟡MAD2R.

Метод можно использовать в несколько итераций, публикуя промежуточные результаты с шумом. Так можно еще точнее распределять вес между раундами.

В первом раунде запускается MAD как обычно, а во втором удаляются уже найденные элементы и те, которые явно не пройдут порог. Для остальных элементов применяется "смещение" веса на основе данных первого раунда.

На практике MAD показал отличные результаты. Всего за 2 этапа он отобрал больше полезных элементов, чем другие методы. Например, в Common Crawl (800 млрд. записей) он выбрал набор слов, который покрыл 99.9% всех записей и 97% уникальных слов с полным соблюдением приватности.


🟡Статья
🟡Arxiv
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #Selection #MAD #Google
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM