Технозаметки Малышева

Google DeepMind выпускает модель Lyria для создания музыки

Модель способна создавать инструментальные и вокальные партии, имитируя стили знаменитых исполнителей.
Эксперимент Dream Track позволяет пользователям создавать треки в стиле Charlie Puth и T-Pain.
Разрабатываемые инструменты упрощают интеграцию ИИ в музыкальное творчество.
Также разработаны технологии для идентификации авторства синтетически созданной музыки.
Google сотрудничает с музыкантами и индустрией для ответственного использования ИИ в музыке.

Творение музыки с ИИ станет еще доступнее и разнобразнее.

#GoogleDeepMind #Lyria #DreamTrack

👍1

58 viewsedited 20:27

Google DeepMind представляет самоосознание ИИ

Исследователи из Google DeepMind и Университета Южной Калифорнии предложили механизм самоосознания (self-discover) для усиления способностей к рассуждениям у LLM.
Подход улучшает производительность существующих моделей, включая GPT-4 от OpenAI и PaLM 2 от Google, на сложных задачах требующих рассуждений.
LLM самостоятельно определяют структуру рассуждений, необходимую для решения задачи, что требует в 10-40 раз меньше вычислительной мощности.
Применение метода 'самоосознания' показало улучшение результата в 21 из 25 задач по сравнению с другими техниками, с приростом результативности в 32%.
Этот подход способен значительно продвинуть LLM в сторону общего интеллекта и улучшить решение задач.

семимильными шагами к AGI летим.

#GoogleDeepMind #ИИ #Самоосознание

🤔1

94 views12:00

Технозаметки Малышева

Google DeepMind разрабатывает Genie для создания интерактивных виртуальных сред

Genie - это модель ИИ от Google DeepMind, создающая интерактивные виртуальные миры.

Обучение происходило без учителя на видео из Интернета, размером в 11 миллиардов параметров.

Genie генерирует виртуальные миры по запросам: текст, изображения, эскизы или видео.

За основу взяты видеотокенизатор, авторегрессионная модель динамики и масштабируемая модель скрытых действий.

Позволяет взаимодействовать с средой по кадрам, не требуя явных меток действий.

Исходный набор данных - подборка видео 2D платформеров из Интернета.

Использована система фильтрации для создания качественной выборки из 6,8 миллиона видео.

Процесс обучения включает настройку модели скрытых действий, видеотокенизатора и модели динамики.

Генеративный интерактивный подход позволяет обучать агентов и создавать адаптивные виртуальные миры.

ИМХО полезная история для саморефлексии в будщем AGI.
Виртуальная интерактивная модель в "сознании" ИИ для предварительной прокрутки действий до их выполнения.
Производительности это, конечно, потребует х100, но лет через 5 - будет самое оно.

#GoogleDeepMind #Genie #AI

👍1

91 views05:38

Технозаметки Малышева

AlphaChip: ИИ проектирует дизайн компьютерных чипов

AlphaChip - ИИ модель, использующая обучение с подкреплением для проектирования микросхем, разработанная Google DeepMind.

Генерирует компоновки чипов за часы, тогда как ручной процесс занимал недели.

Подход рассматривает компоновку как игру, размещая компоненты на пустой сетке и использует графовую нейронную сеть для анализа взаимосвязей между элементами.

AlphaChip самосовершенствуется с каждым новым проектом, обобщая свой опыт в разработке различных чипов и схем, что в итоге приводит к бОльшей эффективности, чем экспертиза людей.

Применяется в разработке тензорных процессоров Google, Axion Processors и MediaTek Dimensity.

Ну вот, а вы переживали, - "когда ИИ будет создавать и улучшать сам себя?".
Вот уже почти оно. :)

#AlphaChip #GoogleDeepMind #ChipDesign
-------
@tsingular

🔥33🤯10✍3👍1🍓1👾1

3.9K viewsedited 06:19

Технозаметки Малышева

Google представил новые генеративные модели: Veo 3 с аудио, Imagen 4 и инструмент для кинематографии - Flow

Google DeepMind сегодня представил новое поколение генеративных AI-моделей и инструментов для создания медиаконтента.

🎬 Veo 3: видео с полноценным звуком
Революционное обновление: теперь модель не только улучшает качество видео, но и впервые генерирует полноценное аудио — от городского шума до диалогов между персонажами. Доступно для Ultra-подписчиков в США через приложение Gemini и для корпоративных пользователей на Vertex AI.

📸 Imagen 4: новый стандарт визуализации
Передовая модель генерации изображений с невероятной детализацией (мельчайшие ткани, капли воды, шерсть животных), поддержкой различных соотношений сторон до разрешения 2K. Значительно улучшена типографика, что делает её идеальной для создания открыток, постеров и комиксов.
Уже доступна в Gemini, Whisk, Vertex AI и всех продуктах Workspace.

🎥 Flow: AI-инструмент для кинопроизводства
Новая платформа, объединяющая Veo, Imagen и Gemini для создания кинематографических клипов и сцен. Позволяет с помощью текстовых запросов управлять персонажами, локациями, объектами и стилями внутри единого интерфейса.
Доступна подписчикам Google AI Pro и Ultra в США.

🔌 Улучшения Veo 2:
Reference powered video: управление персонажами, сценами и объектами через референсы
Camera controls: настройка движения камеры (вращение, проезды, зумы)
Outpainting: расширение кадра, например из портретной в ландшафтную ориентацию
Object add/remove: добавление/удаление объектов с учетом масштаба и теней

🎵 Lyria 2: музыкальные возможности
Расширен доступ к Music AI Sandbox на базе Lyria 2 – набору экспериментальных инструментов для музыкантов и продюсеров.
Технология доступна через YouTube Shorts и Vertex AI.

Все новые модели оснащены технологией SynthID для защитной маркировки генерируемого контента, а новый SynthID Detector позволяет проверять медиафайлы на наличие AI-маркировки.

#GoogleDeepMind #AICreative #Veo3 #Imagen4 #Flow
———
@tsingular

🔥9

1.12K views20:06

About

Blog

Apps

Platform