Neural Networks | Нейронные сети
11.8K subscribers
767 photos
170 videos
170 files
9.42K links
Все о машинном обучении

По всем вопросам - @notxxx1

№ 4959169263
Download Telegram
OpenAI заявляет, что её вычислительная мощность выросла в 15 раз с 2024 года, компания использовала 200 тыс. GPU для GPT-5

Впечатляющая цифра.

Еще зз интересных новостей от OpenAI, gpt-oss уже сказали более 5млн и это самый залайканный релиз года на данный момент! 🔥
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ OpenAI инвестирует в Merge Labs - конкурента Neuralink.

OpenAI ведет переговоры об инвестициях в Merge Labs, стартап в области нейрокомпьютерных интерфейсов, который планирует создание высокоскоростных BCI-систем.

Merge Labs планирует привлечь 250 миллионов долларов при оценке в 850 миллионов. Сэм Альтман будет числиться сооснователем вместе с бывшим топ-менеджером Neuralink Алексом Бланиа, однако не будет заниматься операционной деятельностью. Ожидается, что основное финансирование поступит от венчурного подразделения OpenAI.

Этот шаг еще больше обостряет давнее соперничество между Альтманом и Маском, которые в 2015 году вместе основали OpenAI, но позже разошлись во взглядах.
ft.com

✔️ Контекстное окно Claude Sonnet 4 расширено до миллиона токенов.

Anthropic объявила о значительном увеличении контекстного окна для Claude Sonnet 4 до одного миллиона токенов. Это в 5 раз больше предыдущего лимита и позволит обрабатывать за один проход целые кодовые базы или большие массивы документов. Новая возможность уже доступна в публичной бете через API Anthropic, Amazon Bedrock, а в скором времени появится и в Google Cloud Vertex AI.

За расширение придется платить больше. Для запросов свыше 200 тыс. входных токенов цена удваивается и составит 6 долларов за миллион токенов. Стоимость выходных токенов также вырастет с 15 до 22.50 долларов за миллион.
anthropic.com

✔️ Microsoft ведет целенаправленную кампанию по найму топовых инженеров и исследователей из компании Марка Цукерберга.

Согласно внутренним документам, Microsoft составила список конкретных сотрудников с указанием их имен, ролей и принадлежности к командам: Reality Labs, GenAI Infrastructure и AI Research. Корпорация готова предложить им многомиллионные компенсационные пакеты - крупные бонусы при найме, конкурентные зарплаты, значительные пакеты акций и высокие годовые премии.

Для ускорения процесса в Microsoft внедрили специальную процедуру. Рекрутеры могут помечать кандидатов как "критически важные ИИ-таланты" и тогда процесс рассмотрения и утверждения на уровне руководства возможен в течение 24 часов.
businessinsider.com

✔️ AI2 выпустил открытую модель для робототехники.

Институт искусственного интеллекта Аллена представил MolmoAct 7B — опенсорсную модель для планирования движений роботов в трехмерном пространстве. Система интерпретирует команды на естественном языке, создает 3D-реконструкцию сцены и прокладывает траекторию движения, которую разработчик может просмотреть и скорректировать до того, как робот начнет действовать.

Модель на 7 млрд. параметров была обучена на 18 млн. примеров, в которых были включены 12 тыс. эпизодов из реального мира. В бенчмарке SimPLER система показала успешность выполнения задач в 72.1%, обойдя решения от Nvidia, Google и Microsoft.

AI2 опубликовал техотчет, веса и датасеты, позиционируя MolmoAct как свободно доступную альтернативу проприетарным решениям.
allenai.org

✔️ SEELE AI запустила публичное тестирование генератора 3D-игр по текстовому описанию.

Платформа создает полноценные, играбельные проекты на основе текстового описания на естественном языке, не требуя навыков программирования. Система использует большие модели для автоматической генерации всех ключевых элементов: 3D-сцен, персонажей и игровой логики, интегрируя текст, 3D-моделирование и физические движки.

Помимо основной генерации, инструмент поддерживает персонализацию созданных игр, предварительный просмотр в реальном времени и возможность оптимизации. SEELE AI позиционирует свой сервис не только как игровой инструмент, но и как платформу для создания контента в сфере образования, маркетинга и социальных сетей.
Попробовать инструмент можно на официальном сайте.
Seele AI в сети Х

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🚨 Breaking News

> DeepSeek-R2 выйдет в период с 15 по 30 августа
> На 97% дешевле GPT-4
> Обучен на кластере чипов Huawei 910 B Ascend (91% эффективности от NVIDIA A100)
💊 Это мощно!

Учёные из Университета Саймон Фрейзер представили CGFlow — ИИ-фреймворк, который может радикально ускорить разработку лекарств.

В отличие от прошлых ИИ-инструментов, CGFlow не только проектирует молекулы, но и продумывает реальные пути их химического синтеза, чтобы их можно было произвести в настоящей лаборатории.

Модель пошагово конструирует молекулу, оптимизируя сразу два параметра: биологическую эффективность и практическую реализуемость.

Такой подход способен сократить многолетний (10 лет и ~$1 млрд) цикл создания лекарств до считаных лет. Уже есть интерес со стороны компаний, работающих над лечением рака.

📌 Источник
Google представила Gemma 3 270M — компактную модель

Модель 270 млн параметров (170M для эмбеддингов и 100M для трансформер-блоков), но с отличной способностью следовать промтпам прямо «из коробки».

🔹 Особенности
- 256k токенов
- Энергоэффективность: INT4-версия на Pixel 9 Pro расходует всего 0.75% батареи за 25 диалогов.
- Доступны предобученные и instruction-tuned чекпойнты.
- Поддержка Quantization-Aware Training (QAT) для запуска в INT4 без заметной потери качества.

💼 Когда использовать
- Массовые, чётко определённые задачи: анализ тональности, извлечение сущностей, обработка текста, комплаенс-проверки.
- Минимальные задержки и низкая стоимость инференса — можно запускать прямо на устройстве.
- Быстрые эксперименты с fine-tuning.
- Полная приватность данных благодаря on-device работе.
- Создание «флота» узкоспециализированных моделей.

В анонсе приводится пример, как Adaptive ML и SK Telecom дообучили Gemma 3 4B для мультиязычной модерации контента, превзойдя более крупные проприетарные модели.

Gemma 3 270M — отличная компактная модель, быстрая и дешёвая в работе.

🟠Подробности: https://developers.googleblog.com/en/introducing-gemma-3-270m/
🟠HF: https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

#news #ai #ml #Gemma #google
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Пользователи Claude Code после возвращения с бесплатного GPT-5 в Cursor!
Статья NYT 2018 года. Другое время.
Forwarded from Machinelearning
🍌Стало известно, что nano-banana — это модель от Google

Если вы пропустили, эта модель стала вирусной на Арене, благодаря своим возможностям редактирования изображений: меняет цвет волос, одежды, целые образы и фоны, сохраняя стиль и детали персонажа.

Nano-banana демонстрирует высокое качество и согласованность, по сравнению с другими моделями на рынке.

📌 Попробовать можно на арене.

@ai_machinelearning_big_data


#NANOBANANA #AI #GenerativeAI #AIart
This media is not supported in your browser
VIEW IN TELEGRAM
🆕 Hugging Face представили **AI Sheets** — no-code инструмент для создания и обработки таблиц с помощью ИИ.

- Выглядит как обычная таблица, но вместо формул — тысячи моделей
- Поддержка OpenAI-совместимых и локальных LLM
- Можно добавлять столбцы с промптами, редактировать данные вручную или через лайки
- Запуск онлайн или локально (Docker / pnpm)
- Полностью опенсорс (Apache-2.0), легко встроить в пайплайны
- Подходит для классификации, трансформации данных, синтетики и «vibe-тестов» моделей

⚡️ Попробовать

#AI #NoCode #datasets #HuggingFace #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🧩 Mirage 2 от Dynamics Lab

Новая версия позволяет превратить одно изображение или даже текстовый промпт в полноценный игровой мир прямо в браузере, где игрок может менять окружение на лету с помощью текста.

Ключевая идея — нейросимулятор, который предсказывает следующий кадр и состояние игры из того, что игрок видит и делает. Это объединяет рендеринг и действия в одном цикле.

🎮 Как это работает:
- Загрузите скетч или фото → система превращает его в лэйаут, материалы и физику.
- Движок добавляет персонажа с базовыми действиями: бег, прыжок, атака.
- Язык выступает интерфейсом управления: можно в реальном времени сменить сеттинг (вестерн → город → киберпанк) без прерывания игры.

Технические детали:
- Задержка ~200 мс — ощущения отклика в реальном времени.
- Горизонт взаимодействия — 10+ минут до накопления дрейфа.
- Работает на одной потребительской GPU → дешевле для тестов и масштабирования.

🌍 Главное:
- Не ограничен жанром, можно делиться созданными мирами мгновенно.
- Недочёты: иногда неточная анимация на поворотах и визуальные «подёргивания» при резкой смене сцены (частично решается корректным промптом).

👏 Важно, что Mirage 2 уже доступен онлайн и вышел всего через месяц после первой версии, в отличие от многих исследовательских прототипов, которые так и не стали публичными.

https://blog.dynamicslab.ai/
Страх утечки убивает доверие к ИИ.

Мы понимаем, что технологии могут облегчить жизнь: обработать таблицы, структурировать тексты, автоматизировать задачи. Но каждый раз, когда речь заходит о конфиденциальных данных, возникает барьер. Ведь стоит им оказаться в чужой системе — и назад их уже не вернуть.

25 августа в 19:00 (МСК) karpovꓸcourses проведут вебинар «Как обрабатывать конфиденциальные данные с помощью ИИ». Вы увидите, как запускать локальные модели и подключать к ним собственные данные. Все работает прямо на вашем компьютере, и только вы решаете, кто получит доступ к информации.

Спикер — Павел Зуриев, руководитель ИТ-проектов по внедрению ИИ в бизнес-процессы.

Сделайте шаг к безопасной работе с ИИ: https://clc.to/erid_2W5zFJ4PYsJ

Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFJ4PYsJ
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Google расширила доступ к ИИ-поиску на 180 стран и добавила функцию бронирования.

Google начала масштабное развертывание диалогового поискового режима AI Mode для 180 стран. Ранее функция работала только в США, Великобритании и Индии. Пока доступен только английский язык, а страны Евросоюза в список не вошли из-за строгих правил в области данных и ИИ.

Вместе с географическим расширением Google представила первую агентную возможность в AI Mode. Теперь пользователи в США могут находить и бронировать столики в ресторанах через платформы OpenTable и Resy, прямо из поисковой выдачи. В будущем планируется добавить бронирование билетов и запись на услуги. Эта функция пока доступна только подписчикам платного тарифа Google AI Ultra.
9to5google.com

✔️ Runway представила платформу для создания интерактивных ИИ-миров.

Компания анонсировала бета-версию платформы Game Worlds, на которой пользователи в реальном времени могут создавать и исследовать полностью сгенерированных персонажей, сюжеты и окружения.

Одновременно с этим Runway добавила в свой продукт Act-Two новую функцию «Voices». Она дает возможность подбирать и настраивать голоса для ИИ-персонажей.

Эти нововведения - часть стратегии компании по демократизации создания иммерсивного контента, делая его доступным для авторов без специальных навыков в программировании или анимации.
RunwayML в сети X

✔️ Появились тестовые образцы нового ИИ-чипа Intel Jaguar Shores

В сети появились фото тестовых образцов следующего поколения ИИ-архитектуры Jaguar Shores. Размер корпуса 92,5 мм на 92,5 мм, он включает 4 отдельных кристалла и 8 площадок памяти HBM, что явно указывает на платформу для высокопроизводительных вычислений.

Jaguar Shores станет первым стоечным решением Intel, планируется использование памяти HBM4 от SK Hynix и совместная работа с будущими процессорами Xeon Diamond Rapids.
wccftech.com

✔️ Streaming Sortformer: модель для распознавания говорящих в реальном времени.

NVIDIA выпустила Streaming Sortformer - модель для диаризации речи, которая мгновенно определяет и маркирует участников разговора в реальном времени с низкой задержкой.

Модель оптимизирована для английского и китайского языков, способна отслеживать до 4 говорящих одновременно и предназначена для работы на GPU. По результатам тестов, Streaming Sortformer показывает более низкий уровень ошибок (DER) по сравнению с конкурирующими решениями.

Streaming Sortformer подойдет для применения в колл-центрах, при создании протоколов встреч и в интерактивных голосовых приложениях, где важно точно знать, кто, что и когда сказал. Модель доступна на Hugging Face.
developer.nvidia.com

✔️ AMD официально представила технологию FSR 4.

AMD выпустила новейшую технологию масштабирования изображения FidelityFX Super Resolution 4 (FSR 4). Это часть обновления FidelityFX SDK 2.0, где AMD впервые внедряет алгоритм апскейлинга на основе машинного обучения для улучшения качества графики и производительности в играх.

По сравнению с предыдущей версией 3.1, FSR 4 показывает улучшения в детализации изображения и временной стабильности, а также снижает артефакты гостинга движущихся объектов. FSR 4 поддерживается только видеокартами AMD Radeon RX 9000 серии и выше на архитектуре RDNA 4 и требует DirectX 12. AMD также предоставила плагины FSR 4 для Unreal Engine версий 5.1–5.6.
gpuopen.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Save the date: 28 августа 18:00 мск — RecSys Meetup!

Будем обсуждать всё самое актуальное из мира рекомендательных систем: от передовых архитектур для Semantic IDs и их внедрения в продакшн до тонкостей балансировки интересов пользователей и продавцов маркетплейса с помощью онлайн-доранжирования и байесовской оптимизации.

📅 Когда: 28 августа, начало в 18:00
📍 Где: Москва + онлайн-трансляция

🗓 Программа митапа:

«Semantic IDs: архитектура и наш опыт внедрения»
👨‍💻 Александр Тришин, DS Stream Lead (персональные рекомендации)

— Ключевые архитектуры Semantic IDs (RQ-VAE, RQ-KMeans).
— Опыт внедрения в продакшн: динамика каталога, поддержка стабильности представлений.
— Применение Semantic IDs в рекомендательных моделях для повышения качества рекомендаций.

«Счастье пользователя vs счастье продавца. Онлайн-доранжирование и байесовская оптимизация»
👨‍💻 Андрей Ветров, Data Scientist (товарные рекомендации)

— Способы учитывать интересы и пользователей, и продавцов.
— Онлайн-доранжирование и байесовская оптимизация как способ найти баланс и повысить эффективность маркетплейса.

«Как мы обучаем CLIP-ы для текстовых тегов»
👨‍💻 Михаил Киндулов, Stream Lead (Поиск по фото)

— Обучение CLIP-моделей на большом объёме данных в Wildberries & Russ.
— Применение CLIP для задачи автоматического подбора текстовых тегов к изображениям.

«Трансформеры в персональных рекомендациях: от гипотез до AB-тестирования»
👨‍💻 Иван Ващенко, DS Team Lead (персональные рекомендации)

— Опыт использования BERT4Rec на главной странице Wildberries.
— Проверка гипотез в offline и nearline процессах.
— Head-to-head AB-тесты, онлайн-инференс на Triton.
— Баланс между оффлайн-метриками и реальным онлайн-эффектом.

📝 Регистрация уже открыта!
⚡️ Для участия в офлайн-формате регистрация обязательна.