D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🏉 Coca-Cola использовала нейросеть в рекламе для Супербоула

Рекламу напитка BodyArmor покажут 11 февраля во время главного матча в американском футболе, но клип можно посмотреть уже сейчас.

🥒 Основной посыл ролика Field of Fake: натуральное всегда лучше ненатурального, поэтому в BodyArmor используются только натуральные ингредиенты.

⚙️ Все искусственное в ролике символизирует часть, созданная нейросетью. Генерация выполнена в лучших традициях адских видео ModelScope, о которых все позабыли после выхода «реалистичной» Gen-2. Закадровый голос в синтетической части рекламы, кстати, тоже создан нейросетью.

🤫 Агентство Full Contact Advertising, которое работало над клипом вместе с BodyArmor, не раскрывает, какую нейросеть использовало.

💵 Coca-Cola купила бренд BodyArmor в 2021 году за $5,6 млрд.

Компания уже использовала нейросети в рекламе, в частности, для создания «художественных» QR-кодов.

О том, как корпорации с помощью ИИ экономят на рекламе сотни тысяч долларов — мы рассказывали тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
🍏 Независимые лейблы обвинили Apple в попытке обворовать их за счет пространственного аудио

Мы уже писали о том, как Apple хочет, чтобы как можно больше музыки в Apple Music было доступно в формате пространственного аудио.

💵 Компания даже готова платить больше денег за то, чтобы треки выходили в этом формате — даже если их никто не будет слушать. При этом компания не собирается выделять на инициативу дополнительные средства. Бонусы за пространственное аудио будут выплачиваться из того же пула денег, что и обычно.

🤔 Независимые лейблы, разобравшись в ситуации, остались недовольны инициативой Apple. Оказывается, запись трека в формате Dolby Atmos (это и есть пространственное аудио) стоит в среднем на $1 тыс. дороже, чем запись в обычном формате.

🎙 Среднестатистический альбом состоит из 10–15 треков, а значит, его выпуск в новом формате будет стоить независимому лейблу на $10–15 тыс. дороже. Запись старого альбома в новом формате может стоить еще дороже. Скажем, лейблу с бэк-каталогом в три тыс. альбомов их перезапись может обойти в $30 млн.

То есть инди-лейблу, вероятно, даже нет смысла пытаться получить от Apple повышенные роялти, так как они не отобьют стоимость записи.

😈 Зато на Dolby Atmos, считают независимые лейблы, может хорошо заработать мейджор, у которого в каталоге есть, допустим, Тейлор Свифт. Потратив $10 тыс. на альбом, который в пространственном аудио могут послушать миллионы фанатов певицы, и без того богатый лейбл станет еще богаче. При этом богаче он станет за счет денег, которые не получат те, кто не смог позволить себе запись в Dolby Atmos.

❗️ Инди-лейблы хотят договориться с Apple, но если переговоры провалятся, то они готовы идти в суд.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4😁2
🕵️‍♀️ OpenAI разрабатывает ИИ-агентов

🕹 Такие агенты смогут выполнять сложные задания без участия пользователя — по сути, брать на себя управление устройством после получения задачи.

OpenAI уже больше года разрабатывает два типа агентов.

1️⃣ В качестве примера задач, которые будут решать агенты первого типа, The Information приводит перенос данных из документа в таблицу для анализа и автоматическое заполнение отчета о расходах с последующим переносом в бухгалтерское ПО.

2️⃣ Агенты второго типа будут выполнять менее узкие задачи вроде бронирования авиабилетов, отелей, планирования бюджета поездки и т. д.

🧠 Внутри OpenAI ИИ-агентов называют «суперумными персональными помощниками».

💵 Крупные игроки (над своими агентами также работают Meta* и Google) постепенно заходят в нишу, которую раньше обозначили сервисы вроде AutoGPT (мы подробно рассказывали о них).

💪 Создатели AutoGPT ставили перед собой амбициозную цель превратить помощника в AGI — сильный искусственный интеллект. В OpenAI тоже в последнее время часто говорят про AGI.

❗️ Ключевое опасение в связи с ИИ-агентами — безопасность: программа получает доступ к устройству пользователя и существует опасность, что таким же образом к девайсу могут подключиться и мошенники. Сейчас у OpenAI нет конкретного решения этой проблемы.

*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤔2
OpenAI отказали в названии GPT, Huawei выпустит меньше смартфонов из-за ИИ, Midjourney схантили инженера Apple — и другие важные новости за неделю

OpenAI выпустил приложение ChatGPT для хедсета Vision Pro. Внутри приложения — передовая модель GPT-4 Turbo и возможность не только общаться с чат-ботом, но и генерировать изображения. То есть, каких-то принципиальных отличий от обычных версий пока нет;

На этой неделе также стало известно, что OpenAI отказали в регистрации торговой марки GPT. Ведомство по патентам и товарным знакам США (USPTO) пришло к выводу, что GPT — это общее название инструментов, подобных языковой модели, которое не может быть закреплено за одной компанией. OpenAI может подать апелляцию на решение USPTO;

Спрос на ИИ-чипы заставил Huawei направить все мощности на их изготовление в ущерб своим же топовым смартфонам: ИИ-чипы и чипы для телефонов Mate 60 производятся на одних и тех же предприятиях. После запрета со стороны США на экспорт передовых чиповы в КНР, в стране резко вырос спрос на местную продукцию. В то же время китайским компаниям тяжело этот спрос обеспечить;

Microsoft заплатит изданию Semafor за использование своего ИИ в работе редакции. Semafor будет использовать ИИ Microsoft для написания новостей. На сайте издания появится отдельный фид Signals, куда будут публиковаться тексты, написанные с помощью ИИ. Речь не идет о текстах, полностью созданных нейросетью — редакторы сайта будут использовать модели, например, для быстрого перевода новости с неанглоязычного источника. Сколько именно Microsoft заплатит за тест, не уточняется;

В Roblox появится перевод в реальном времени на 16 языков. Функция будет реализована в пользовательских чатах на платформе с помощью кастомной LLM. Это значит, что пользователь, скажем, из Кореи в переписке с пользователем из Германии будет получать сообщения сразу на родном языке — и наоборот;

В Midjourney позвали инженера, который работал над Vision Pro, а также в Neuralink Илона Маска. Ахмад Аббас присоединился к стартапу в роли главы Hardware-подразделения. Вероятно, Аббас будет работать в компании над проектом под кодовым названием Orb. Что такое Orb — отдельное устройство или новая стратегия развития компании — пока неясно;

Meta* всерьез взялась за маркировку генеративного контента в принадлежащих компании соцсетях. Если раньше вотермарки ставили только на контент, произведенный нейросетями Meta, то вскоре это коснется генераций и других моделей. Компания также обещает наказывать пользователей, которые будут пытаться скрыть нейроконтент, выдавая его за настоящий;

В продолжение темы маркировки генеративного контента: вотермарки стандарта C2PA появятся в Dall-E 3. Маркировать контент будут через метаданные и с помощью символа, который будет видно на сгенерированном изображении. Разработчики из OpenAI признают, что такая маркировка — не идеальный вариант (ее достаточно легко удалить), но считают ее важным шагом в регулировании генеративного контента;

Disney станет миноритарным акционером Epic Games, инвестировав в компанию $1,5 млрд. Disney и Epic работают над общей «развлекательной вселенной», которая объединит IP обеих компаний. Как именно будет выглядеть вселенная, пока не уточняется. Некоторые уже назвали проект Disney и Epic — корпоративной метавселенной.

*Организация, запрещенная на территории РФ
👍2🤔1
📈 Популярность «замены лиц» у хакеров подскочила на 700%

📆 Следует из отчета британской биометрической компании iProov. Рост составил 704% во второй половине 2023 года по сравнению с первой половиной года.

Выросло и количество хакерских групп, которые занимаются атаками с помощью дипфейков — их стало больше на 47%.

👥 Аналитики компании ожидаемо связывают рост популярности фейссвапов с все большей доступностью самых разных ИИ-инструментов.

🏪 При этом распознать подобные дипфейки, если они качественно выполнены, все еще довольно сложно. В iProov отмечают, что мошенники чаще всего пользуются сервисами SwapFace и DeepFaceLive.

💵 Отчет iProov появился в одно время с историей о сотруднике финансовой фирмы в Гонконге, который перевел $25,6 млн мошенникам, поговорив с их дипфейками. Мошенники выдали себя за коллег служащего.

📹 Жертву насторожил имейл о необходимости крупной транзакции, но видеосозвон развеял все сомнения.

🚨 Полиция Гонконга задержала 6 человек в связи с преступлением.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2😁2🤯2
🙂 Disney будет продавать контекстную рекламу с учетом настроения зрителя

#️⃣ Сервис Disney’s Magic Words с помощью ИИ анализирует каталог компании, чтобы расставить контекстные теги для каждой сцены в мультике/фильме/передаче.

🚰 На основе этих тегов бренды смогут покупать рекламное время именно в том моменте, который наиболее подходит их продукту. К примеру, персонажу очень хочется пить и в этот момент зритель увидит контекстную рекламу минералки.

💊 При этом теги проставлены не только для вещей и брендов, которые появляются в кадре, но и для общего настроения конкретной сцены или даже эмоции. Условно говоря, на сцене, когда у Бемби убивают маму, вам могут предложить антидепрессанты.

🔩 Продвинутую рекламу увидят пользователи стриминг-сервисов Disney+ и Hulu. Сейчас Disney’s Magic Words находится на этапе тестирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3👍2👎1
Media is too big
VIEW IN TELEGRAM
Цукербергу не понравился Vision Pro 👎

Глава Meta* опубликовал у себя в Instagram** видео, в котором рассказал о своих впечатлениях от нового устройства Apple.

По словам Цукерберга, с удивлением для себя он обнаружил, что хедсет Quest, который разрабатывает его компания, лучше того, что выпустила компания Тима Кука 😱.

😌 Цукерберг скромно говорит, что до тестирования думал, что Quest обойдет Vision Pro только в категории «цена-качество» (Quest 3 стоит $500, Vision Pro — от $3 500).

📊 Но по результатам теста стало очевидно, что Quest лучше Vision Pro во всем, для чего люди в принципе используют такие устройства, говорит Цукерберг в видео.

☝️ Quest удобнее — не такой тяжелый, из него не торчат провода, у него ярче экран и больше обзор, перечисляет Цукерберг. Управление взглядом? Прикольно, но не всегда удобно, кроме того, и в Quest он вернется в следующих версиях (Eyetracking был в про-версии хедсета)!

Ради дисплея Vision Pro, который все так хвалят, Apple пришлось пойти на слишком много компромиссов, уверен он.

💪 В конце Цук обещает, что будущее за открытыми системами, как Quest, а не закрытыми — как Apple.

🤔 От себя добавим: выглядит немного странно, что Цукербергу самому приходится так хвалить свой продукт и критиковать чужой.

*Организация, запрещенная на территории РФ
**Instagram входит в Meta — организацию, запрещенную на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
😁52
🆕 Stability AI представил новый тип нейросети

🌭 Stable Cascade использует принципиально новую архитектуру Würstchen. Würstchen (то есть «сосиска» в переводе с немецкого) отличается высокой скоростью генераций при меньшей требовательности к ресурсам.

☝️ Ключевое отличие Cascade от Diffusion в том, что новая нейросеть использует не одну большую модель, а три небольших (каждая из которых построена на Würstchen).

За счет распределения задач между несколькими моделями и достигается увеличение скорости работы без потери качества генерации.

📝 Cascade, как утверждают разработчики, также более точно следует пользовательским промптам и (наконец-то!) может генерировать текст внутри изображений. С последним, правда, модель справляется не идеально.

Модель доступна на GitHub, но с запретом на коммерческое использование.
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
😛 Опенсорсная LLM с поддержкой рекордного количества языков

🌐 Модель Aya — это результат работы стартапа Cohere (подробнее о нем здесь) и трех тыс. независимых исследователей из 119 стран.

Ключевое отличие Aya от конкурентов — поддержка 101 языка, что в два раза больше, чем у конкурирующих языковых моделей с открытым кодом. Десятки языков и диалектов доступны только в модели Cohere.

💬 Для сравнения, всего в мире на данный момент используется семь тыс. языков, при этом больше половины населения Земли использует всего 23 языка.

📝 Стартап выложил в открытый доступ не только саму модель, но и датасет, на котором ее обучали. Вместе с датасетом идут полезные комментарии от носителей языков, которые участвовали в создании модели.

📊 Разработчики говорят, что в бенчмарках Aya обходит всех ключевых конкурентов, в том числе Bloom.

Летом прошлого года Cohere привлек $270 млн от инвесторов, включая Nvidia. Оценочная стоимость компании достигла $1,2 млрд.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🥰4🔥1
😱 OpenAI показал Sora — модель для генерации фотореалистичных видео

🔩 Sora способна генерировать видео длиной до минуты, следуя сложным пользовательским промптам на всем протяжении клипа. Модель также может анимировать статичный кадр и «расширить» исходное видео.

☝️ Диффузионная модель создает сцены с несколькими персонажами, сложными паттернами движений; может сгенерировать несколько кадров в одном видео, которые будут выдержаны в едином стиле; передать эмоции персонажей, прописанные в промпте.

☁️ OpenAI говорят, что Sora («небо» в переводе с японского) не просто следует промпту, но и понимает, какое место генерируемые объекты занимают в «физическом» мире. Что-то подобное мы слышали в недавнем анонсе Runway.

🧨 Те примеры генераций, которыми поделились разработчики, действительно выглядят потрясающе — тот же Gen-2 ничем подобным похвастаться не может. Длятся они, правда, не по минуте, а около 10–15 секунд.

🛑 Другое дело, что обычным пользователям модель недоступна и оценить ее реальные возможности не получится. OpenAI открыл Sora только для избранных разработчиков, художников, дизайнеров и киноделов. Все остальные в ближайшее время доступа к модели не получат. Все из-за опасений, что модель может быть использована для распространения фотореалистичных фейков.

😐 Среди слабых мест текущей версии модели разработчики называют передачу физических свойств объектов и причинно-следственные связи внутри сцены (например: откушенное человеком печенье останется целым). Также Sora может перепутать левую сторону с правой и допустить ошибки при генерации событий, которые происходят в течение какого-то отрезка времени (скажем, поведение камеры на протяжении видео).
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3
🤜🤛 Суд в США встал на сторону OpenAI в споре с писателями. Но не до конца

🫤 Окружной суд Калифорнии решил, что истцы не предоставили достаточных доказательств того, что ChatGPT, в частности, обучали на пиратских копиях их произведений, а также, что сервис нанес авторам финансовый ущерб.

👎 Не согласился суд и с тем, что работа чат-бота может нанести серьезный ущерб интеллектуальной собственности в будущем (назвав такие доводы спекуляцией), а также с тем, что контент, генерируемый ChatGPT, копирует произведения истцов.

☝️ Всего группа писателей обвинила OpenAI по шести пунктам, среди которых прямое и косвенное нарушение копирайта, нечестная конкуренция и неосновательное обогащение.

Из шести пунктов суд принял претензии и должен будет вынести решение только по одному — прямое нарушение копирайта.

🥂 Но OpenAI рано праздновать победу. По факту прямое нарушение авторского права — основная претензия истцов, если его удастся доказать, то это может иметь серьезные последствия для сервиса, как и иск New York Times, а также еще несколько коллективных исков от писателей.

Кроме того, истцы до 13 марта могут скорректировать первоначальные исковые требования и вновь обратиться с ними в суд.
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤔2🔥1
Альтман ищет $7 трлн, Nvidia круче Amazon и Alphabet, в Сан-Франциско жгут роботакси — и другие важные новости за неделю

Появилась информация о сумме, которую Сэм Альтман ищет на свой проект по созданию инфраструктуры для производства чипов. Глава OpenAI попытается убедить инвесторов дать ему $7 трлн. Это астрономическая сумма — почти 10% мирового ВВП — хотя, скорее всего, речь идет об инвестициях, которые растянуты на несколько лет;

Nvidia обогнала Amazon и Alphabet по рыночной капитализации. На момент написания текста стоимость компании достигла $1,825 трлн против $1,820 трлн у Alphabet и $1,776 трлн — у Amazon. Причина, конечно же, в буме генеративного ИИ для которого нужно все больше и больше мощностей. С начала года стоимость акций Nvidia взлетела на 40%;

Яндекс добавил возможности нейросети Yandex GPT в свой браузер. Теперь он может отредактировать текст или написать его с нуля, перевести видео на другой язык или пересказать его, сделать саммарайзинг веб-странички. Даже сгенерировать картинку теперь можно, не выходя из браузера;

В Сан-Франциско на уходящей неделе было неспокойно. У офиса OpenAI в городе несколько десятков человек протестовали против сотрудничества компании с Пентагоном и разработки AGI. Чуть ли не в тот же день разъяренная толпа луддитов набросилась на роботакси Waymo, отпинала его, а потом сожгла;

OpenAI работает над конкурентом поисковика Google, который частично будет работать на мощностях Bing. Что будет из себя представлять новый продукт — отдельный сервис или дополнение к ChatGPT — пока неясно. Удастся ли OpenAI нарушить доминирование Google на рынке поисковиков с помощью ИИ — вопрос. Тому же Bing пока не удалось;

Сбер запустил сервис для упрощения создания контента с виртуальными инфлюенсерами. В Studio.iVFX можно прямо в браузере создать анимацию и внешний вид персонажа, настроить виртуальное освещение, фон и т. д. Обещают, что использование сервиса позволяет сократить затраты на производство в три–пять раз;

НХЛ покажет повторы нескольких хоккейных матчей в 3D на платформе Roblox. В пространстве NHL Blast можно будет увидеть «повтор» трех товарищеских матчей, состоявшихся в начале февраля в рамках NHL All-Star.
👍6
ByteDance показал плагин для продвинутой анимации

Boximator позволяет «оживлять» выбранные области на изображении без использования текстовой подсказки.

Да-да, аналогичная функция уже есть у Gen-2, моделей Google и других конкурентов.

☝️ Но Boximator идет дальше и позволяет выбрать сразу несколько объектов для анимации, а также задавать направление их движения. С помощью разных типов «рамок» можно также выбрать последовательность, в которой будут происходить действия.

🔌 Boximator не является «полноценной» нейросетью — разработчики называют его плагином, который можно подключать к существующим диффузионным моделям для генерации видео.

🍼 Даже по опубликованным разработчиками примерам видно, что нейросети пока тяжело дается консистентность — в некоторых случаях создается ощущение, что клип сшит из нескольких разных генераций, настолько по-разному выглядят анимированные объекты в движении. Но в качестве эдакого Proof of Concept выглядит здорово.

🎮 Если хотите проверить модель самостоятельно, то тут есть два варианта. Можно дождаться демоверсии Boximator, которую обещают через два–три месяца. Второй вариант более экзотический: можно отправить любое изображение разработчикам на почту вместе с промптом и попросить его анимировать.

Подробности здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🆕 ElevenLabs с помощью Sora анонсировали новый продукт

Стартап, известный своими моделями для синтеза голоса, решил использовать нашумевшую Sora, чтобы представить новый инструмент.

🔩 В своем x/твиттере разработчики анонсировали фичу, которая позволит генерировать аудиоэффекты по промпту.

В качестве наглядного примера они использовали видео, сгенерированные Sora.

Как это будет работать, пока неясно: нужно ли будет подробно описывать желаемый звук или нейросеть сможет додумать детали по исходному видео.

📝 Релиз обещают скоро, пока можно записаться в очередь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31