D. Lab – Telegram

D. Lab

1.1K subscribers

503 photos

499 videos

1 file

900 links

Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.

Download Telegram

About

Blog

Apps

Platform

1.1K subscribers

This media is not supported in your browser

VIEW IN TELEGRAM

🏉 Coca-Cola использовала нейросеть в рекламе для Супербоула

Рекламу напитка BodyArmor покажут 11 февраля во время главного матча в американском футболе, но клип можно посмотреть уже сейчас.

🥒 Основной посыл ролика Field of Fake: натуральное всегда лучше ненатурального, поэтому в BodyArmor используются только натуральные ингредиенты.

⚙️ Все искусственное в ролике символизирует часть, созданная нейросетью. Генерация выполнена в лучших традициях адских видео ModelScope, о которых все позабыли после выхода «реалистичной» Gen-2. Закадровый голос в синтетической части рекламы, кстати, тоже создан нейросетью.

🤫 Агентство Full Contact Advertising, которое работало над клипом вместе с BodyArmor, не раскрывает, какую нейросеть использовало.

💵 Coca-Cola купила бренд BodyArmor в 2021 году за $5,6 млрд.

Компания уже использовала нейросети в рекламе, в частности, для создания «художественных» QR-кодов.

О том, как корпорации с помощью ИИ экономят на рекламе сотни тысяч долларов — мы рассказывали тут.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

622 views14:55

🍏

Независимые лейблы обвинили Apple в попытке обворовать их за счет пространственного аудио

Мы уже писали о том, как Apple хочет, чтобы как можно больше музыки в Apple Music было доступно в формате пространственного аудио.

💵 Компания даже готова платить больше денег за то, чтобы треки выходили в этом формате — даже если их никто не будет слушать. При этом компания не собирается выделять на инициативу дополнительные средства. Бонусы за пространственное аудио будут выплачиваться из того же пула денег, что и обычно.

🤔 Независимые лейблы, разобравшись в ситуации, остались недовольны инициативой Apple. Оказывается, запись трека в формате Dolby Atmos (это и есть пространственное аудио) стоит в среднем на $1 тыс. дороже, чем запись в обычном формате.

🎙 Среднестатистический альбом состоит из 10–15 треков, а значит, его выпуск в новом формате будет стоить независимому лейблу на $10–15 тыс. дороже. Запись старого альбома в новом формате может стоить еще дороже. Скажем, лейблу с бэк-каталогом в три тыс. альбомов их перезапись может обойти в $30 млн.

То есть инди-лейблу, вероятно, даже нет смысла пытаться получить от Apple повышенные роялти, так как они не отобьют стоимость записи.

😈 Зато на Dolby Atmos, считают независимые лейблы, может хорошо заработать мейджор, у которого в каталоге есть, допустим, Тейлор Свифт. Потратив $10 тыс. на альбом, который в пространственном аудио могут послушать миллионы фанатов певицы, и без того богатый лейбл станет еще богаче. При этом богаче он станет за счет денег, которые не получат те, кто не смог позволить себе запись в Dolby Atmos.

❗️ Инди-лейблы хотят договориться с Apple, но если переговоры провалятся, то они готовы идти в суд.

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔4😁2

571 views15:05

🕵️‍♀️ OpenAI разрабатывает ИИ-агентов

🕹 Такие агенты смогут выполнять сложные задания без участия пользователя — по сути, брать на себя управление устройством после получения задачи.

OpenAI уже больше года разрабатывает два типа агентов.

1️⃣ В качестве примера задач, которые будут решать агенты первого типа, The Information приводит перенос данных из документа в таблицу для анализа и автоматическое заполнение отчета о расходах с последующим переносом в бухгалтерское ПО.

2️⃣ Агенты второго типа будут выполнять менее узкие задачи вроде бронирования авиабилетов, отелей, планирования бюджета поездки и т. д.

🧠 Внутри OpenAI ИИ-агентов называют «суперумными персональными помощниками».

💵 Крупные игроки (над своими агентами также работают Meta* и Google) постепенно заходят в нишу, которую раньше обозначили сервисы вроде AutoGPT (мы подробно рассказывали о них).

💪 Создатели AutoGPT ставили перед собой амбициозную цель превратить помощника в AGI — сильный искусственный интеллект. В OpenAI тоже в последнее время часто говорят про AGI.

❗️ Ключевое опасение в связи с ИИ-агентами — безопасность: программа получает доступ к устройству пользователя и существует опасность, что таким же образом к девайсу могут подключиться и мошенники. Сейчас у OpenAI нет конкретного решения этой проблемы.

*Организация, запрещенная на территории РФ

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2🤔2

745 views14:15

OpenAI отказали в названии GPT, Huawei выпустит меньше смартфонов из-за ИИ, Midjourney схантили инженера Apple — и другие важные новости за неделю

✅ OpenAI выпустил приложение ChatGPT для хедсета Vision Pro. Внутри приложения — передовая модель GPT-4 Turbo и возможность не только общаться с чат-ботом, но и генерировать изображения. То есть, каких-то принципиальных отличий от обычных версий пока нет;

✅ На этой неделе также стало известно, что OpenAI отказали в регистрации торговой марки GPT. Ведомство по патентам и товарным знакам США (USPTO) пришло к выводу, что GPT — это общее название инструментов, подобных языковой модели, которое не может быть закреплено за одной компанией. OpenAI может подать апелляцию на решение USPTO;

✅ Спрос на ИИ-чипы заставил Huawei направить все мощности на их изготовление в ущерб своим же топовым смартфонам: ИИ-чипы и чипы для телефонов Mate 60 производятся на одних и тех же предприятиях. После запрета со стороны США на экспорт передовых чиповы в КНР, в стране резко вырос спрос на местную продукцию. В то же время китайским компаниям тяжело этот спрос обеспечить;

✅ Microsoft заплатит изданию Semafor за использование своего ИИ в работе редакции. Semafor будет использовать ИИ Microsoft для написания новостей. На сайте издания появится отдельный фид Signals, куда будут публиковаться тексты, написанные с помощью ИИ. Речь не идет о текстах, полностью созданных нейросетью — редакторы сайта будут использовать модели, например, для быстрого перевода новости с неанглоязычного источника. Сколько именно Microsoft заплатит за тест, не уточняется;

✅ В Roblox появится перевод в реальном времени на 16 языков. Функция будет реализована в пользовательских чатах на платформе с помощью кастомной LLM. Это значит, что пользователь, скажем, из Кореи в переписке с пользователем из Германии будет получать сообщения сразу на родном языке — и наоборот;

✅ В Midjourney позвали инженера, который работал над Vision Pro, а также в Neuralink Илона Маска. Ахмад Аббас присоединился к стартапу в роли главы Hardware-подразделения. Вероятно, Аббас будет работать в компании над проектом под кодовым названием Orb. Что такое Orb — отдельное устройство или новая стратегия развития компании — пока неясно;

✅ Meta* всерьез взялась за маркировку генеративного контента в принадлежащих компании соцсетях. Если раньше вотермарки ставили только на контент, произведенный нейросетями Meta, то вскоре это коснется генераций и других моделей. Компания также обещает наказывать пользователей, которые будут пытаться скрыть нейроконтент, выдавая его за настоящий;

✅ В продолжение темы маркировки генеративного контента: вотермарки стандарта C2PA появятся в Dall-E 3. Маркировать контент будут через метаданные и с помощью символа, который будет видно на сгенерированном изображении. Разработчики из OpenAI признают, что такая маркировка — не идеальный вариант (ее достаточно легко удалить), но считают ее важным шагом в регулировании генеративного контента;

✅ Disney станет миноритарным акционером Epic Games, инвестировав в компанию $1,5 млрд. Disney и Epic работают над общей «развлекательной вселенной», которая объединит IP обеих компаний. Как именно будет выглядеть вселенная, пока не уточняется. Некоторые уже назвали проект Disney и Epic — корпоративной метавселенной.

*Организация, запрещенная на территории РФ

👍2🤔1

575 views09:00

📈

Популярность «замены лиц» у хакеров подскочила на 700%

📆 Следует из отчета британской биометрической компании iProov. Рост составил 704% во второй половине 2023 года по сравнению с первой половиной года.

Выросло и количество хакерских групп, которые занимаются атаками с помощью дипфейков — их стало больше на 47%.

👥 Аналитики компании ожидаемо связывают рост популярности фейссвапов с все большей доступностью самых разных ИИ-инструментов.

🏪 При этом распознать подобные дипфейки, если они качественно выполнены, все еще довольно сложно. В iProov отмечают, что мошенники чаще всего пользуются сервисами SwapFace и DeepFaceLive.

💵 Отчет iProov появился в одно время с историей о сотруднике финансовой фирмы в Гонконге, который перевел $25,6 млн мошенникам, поговорив с их дипфейками. Мошенники выдали себя за коллег служащего.

📹 Жертву насторожил имейл о необходимости крупной транзакции, но видеосозвон развеял все сомнения.

🚨 Полиция Гонконга задержала 6 человек в связи с преступлением.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2😁2🤯2

537 views14:45

🙂

Disney будет продавать контекстную рекламу с учетом настроения зрителя

#️⃣ Сервис Disney’s Magic Words с помощью ИИ анализирует каталог компании, чтобы расставить контекстные теги для каждой сцены в мультике/фильме/передаче.

🚰 На основе этих тегов бренды смогут покупать рекламное время именно в том моменте, который наиболее подходит их продукту. К примеру, персонажу очень хочется пить и в этот момент зритель увидит контекстную рекламу минералки.

💊 При этом теги проставлены не только для вещей и брендов, которые появляются в кадре, но и для общего настроения конкретной сцены или даже эмоции. Условно говоря, на сцене, когда у Бемби убивают маму, вам могут предложить антидепрессанты.

🔩 Продвинутую рекламу увидят пользователи стриминг-сервисов Disney+ и Hulu. Сейчас Disney’s Magic Words находится на этапе тестирования.

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔3👍2👎1

540 views13:45

Media is too big

VIEW IN TELEGRAM

Цукербергу не понравился Vision Pro

👎

Глава Meta* опубликовал у себя в Instagram** видео, в котором рассказал о своих впечатлениях от нового устройства Apple.

По словам Цукерберга, с удивлением для себя он обнаружил, что хедсет Quest, который разрабатывает его компания, лучше того, что выпустила компания Тима Кука 😱.

😌 Цукерберг скромно говорит, что до тестирования думал, что Quest обойдет Vision Pro только в категории «цена-качество» (Quest 3 стоит $500, Vision Pro — от $3 500).

📊 Но по результатам теста стало очевидно, что Quest лучше Vision Pro во всем, для чего люди в принципе используют такие устройства, говорит Цукерберг в видео.

☝️ Quest удобнее — не такой тяжелый, из него не торчат провода, у него ярче экран и больше обзор, перечисляет Цукерберг. Управление взглядом? Прикольно, но не всегда удобно, кроме того, и в Quest он вернется в следующих версиях (Eyetracking был в про-версии хедсета)!

Ради дисплея Vision Pro, который все так хвалят, Apple пришлось пойти на слишком много компромиссов, уверен он.

💪 В конце Цук обещает, что будущее за открытыми системами, как Quest, а не закрытыми — как Apple.

🤔 От себя добавим: выглядит немного странно, что Цукербергу самому приходится так хвалить свой продукт и критиковать чужой.

*Организация, запрещенная на территории РФ
**Instagram входит в Meta — организацию, запрещенную на территории РФ

Please open Telegram to view this post

VIEW IN TELEGRAM

😁5❤2

619 viewsedited 15:25

🆕

Stability AI представил новый тип нейросети

🌭 Stable Cascade использует принципиально новую архитектуру Würstchen. Würstchen (то есть «сосиска» в переводе с немецкого) отличается высокой скоростью генераций при меньшей требовательности к ресурсам.

☝️ Ключевое отличие Cascade от Diffusion в том, что новая нейросеть использует не одну большую модель, а три небольших (каждая из которых построена на Würstchen).

⏳ За счет распределения задач между несколькими моделями и достигается увеличение скорости работы без потери качества генерации.

📝 Cascade, как утверждают разработчики, также более точно следует пользовательским промптам и (наконец-то!) может генерировать текст внутри изображений. С последним, правда, модель справляется не идеально.

Модель доступна на GitHub, но с запретом на коммерческое использование.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥3🤔2

548 views13:55

This media is not supported in your browser

VIEW IN TELEGRAM

😛

Опенсорсная LLM с поддержкой рекордного количества языков

🌐 Модель Aya — это результат работы стартапа Cohere (подробнее о нем здесь) и трех тыс. независимых исследователей из 119 стран.

Ключевое отличие Aya от конкурентов — поддержка 101 языка, что в два раза больше, чем у конкурирующих языковых моделей с открытым кодом. Десятки языков и диалектов доступны только в модели Cohere.

💬 Для сравнения, всего в мире на данный момент используется семь тыс. языков, при этом больше половины населения Земли использует всего 23 языка.

📝 Стартап выложил в открытый доступ не только саму модель, но и датасет, на котором ее обучали. Вместе с датасетом идут полезные комментарии от носителей языков, которые участвовали в создании модели.

📊 Разработчики говорят, что в бенчмарках Aya обходит всех ключевых конкурентов, в том числе Bloom.

Летом прошлого года Cohere привлек $270 млн от инвесторов, включая Nvidia. Оценочная стоимость компании достигла $1,2 млрд.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🥰4🔥1

591 views15:55

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

😱

OpenAI показал Sora — модель для генерации фотореалистичных видео

🔩

Sora способна генерировать видео длиной до минуты, следуя сложным пользовательским промптам на всем протяжении клипа. Модель также может анимировать статичный кадр и «расширить» исходное видео.

☝️ Диффузионная модель создает сцены с несколькими персонажами, сложными паттернами движений; может сгенерировать несколько кадров в одном видео, которые будут выдержаны в едином стиле; передать эмоции персонажей, прописанные в промпте.

☁️ OpenAI говорят, что Sora («небо» в переводе с японского) не просто следует промпту, но и понимает, какое место генерируемые объекты занимают в «физическом» мире. Что-то подобное мы слышали в недавнем анонсе Runway.

🧨 Те примеры генераций, которыми поделились разработчики, действительно выглядят потрясающе — тот же Gen-2 ничем подобным похвастаться не может. Длятся они, правда, не по минуте, а около 10–15 секунд.

🛑 Другое дело, что обычным пользователям модель недоступна и оценить ее реальные возможности не получится. OpenAI открыл Sora только для избранных разработчиков, художников, дизайнеров и киноделов. Все остальные в ближайшее время доступа к модели не получат. Все из-за опасений, что модель может быть использована для распространения фотореалистичных фейков.

😐 Среди слабых мест текущей версии модели разработчики называют передачу физических свойств объектов и причинно-следственные связи внутри сцены (например: откушенное человеком печенье останется целым). Также Sora может перепутать левую сторону с правой и допустить ошибки при генерации событий, которые происходят в течение какого-то отрезка времени (скажем, поведение камеры на протяжении видео).

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4👍3

741 views07:35

🤜🤛 Суд в США встал на сторону OpenAI в споре с писателями. Но не до конца

🫤 Окружной суд Калифорнии решил, что истцы не предоставили достаточных доказательств того, что ChatGPT, в частности, обучали на пиратских копиях их произведений, а также, что сервис нанес авторам финансовый ущерб.

👎 Не согласился суд и с тем, что работа чат-бота может нанести серьезный ущерб интеллектуальной собственности в будущем (назвав такие доводы спекуляцией), а также с тем, что контент, генерируемый ChatGPT, копирует произведения истцов.

☝️ Всего группа писателей обвинила OpenAI по шести пунктам, среди которых прямое и косвенное нарушение копирайта, нечестная конкуренция и неосновательное обогащение.

Из шести пунктов суд принял претензии и должен будет вынести решение только по одному — прямое нарушение копирайта.

🥂 Но OpenAI рано праздновать победу. По факту прямое нарушение авторского права — основная претензия истцов, если его удастся доказать, то это может иметь серьезные последствия для сервиса, как и иск New York Times, а также еще несколько коллективных исков от писателей.

Кроме того, истцы до 13 марта могут скорректировать первоначальные исковые требования и вновь обратиться с ними в суд.

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡2🤔2🔥1

615 views14:45

Альтман ищет $7 трлн, Nvidia круче Amazon и Alphabet, в Сан-Франциско жгут роботакси — и другие важные новости за неделю

✅ Появилась информация о сумме, которую Сэм Альтман ищет на свой проект по созданию инфраструктуры для производства чипов. Глава OpenAI попытается убедить инвесторов дать ему $7 трлн. Это астрономическая сумма — почти 10% мирового ВВП — хотя, скорее всего, речь идет об инвестициях, которые растянуты на несколько лет;

✅ Nvidia обогнала Amazon и Alphabet по рыночной капитализации. На момент написания текста стоимость компании достигла $1,825 трлн против $1,820 трлн у Alphabet и $1,776 трлн — у Amazon. Причина, конечно же, в буме генеративного ИИ для которого нужно все больше и больше мощностей. С начала года стоимость акций Nvidia взлетела на 40%;

✅ Яндекс добавил возможности нейросети Yandex GPT в свой браузер. Теперь он может отредактировать текст или написать его с нуля, перевести видео на другой язык или пересказать его, сделать саммарайзинг веб-странички. Даже сгенерировать картинку теперь можно, не выходя из браузера;

✅ В Сан-Франциско на уходящей неделе было неспокойно. У офиса OpenAI в городе несколько десятков человек протестовали против сотрудничества компании с Пентагоном и разработки AGI. Чуть ли не в тот же день разъяренная толпа луддитов набросилась на роботакси Waymo, отпинала его, а потом сожгла;

✅ OpenAI работает над конкурентом поисковика Google, который частично будет работать на мощностях Bing. Что будет из себя представлять новый продукт — отдельный сервис или дополнение к ChatGPT — пока неясно. Удастся ли OpenAI нарушить доминирование Google на рынке поисковиков с помощью ИИ — вопрос. Тому же Bing пока не удалось;

✅ Сбер запустил сервис для упрощения создания контента с виртуальными инфлюенсерами. В Studio.iVFX можно прямо в браузере создать анимацию и внешний вид персонажа, настроить виртуальное освещение, фон и т. д. Обещают, что использование сервиса позволяет сократить затраты на производство в три–пять раз;

✅ НХЛ покажет повторы нескольких хоккейных матчей в 3D на платформе Roblox. В пространстве NHL Blast можно будет увидеть «повтор» трех товарищеских матчей, состоявшихся в начале февраля в рамках NHL All-Star.

👍6

522 views09:01

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

✨

ByteDance показал плагин для продвинутой анимации

Boximator позволяет «оживлять» выбранные области на изображении без использования текстовой подсказки.

Да-да, аналогичная функция уже есть у Gen-2, моделей Google и других конкурентов.

☝️ Но Boximator идет дальше и позволяет выбрать сразу несколько объектов для анимации, а также задавать направление их движения. С помощью разных типов «рамок» можно также выбрать последовательность, в которой будут происходить действия.

🔌 Boximator не является «полноценной» нейросетью — разработчики называют его плагином, который можно подключать к существующим диффузионным моделям для генерации видео.

🍼 Даже по опубликованным разработчиками примерам видно, что нейросети пока тяжело дается консистентность — в некоторых случаях создается ощущение, что клип сшит из нескольких разных генераций, настолько по-разному выглядят анимированные объекты в движении. Но в качестве эдакого Proof of Concept выглядит здорово.

🎮 Если хотите проверить модель самостоятельно, то тут есть два варианта. Можно дождаться демоверсии Boximator, которую обещают через два–три месяца. Второй вариант более экзотический: можно отправить любое изображение разработчикам на почту вместе с промптом и попросить его анимировать.

Подробности здесь.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4👍2😁2

536 views15:05

This media is not supported in your browser

VIEW IN TELEGRAM

🆕

ElevenLabs с помощью Sora анонсировали новый продукт

Стартап, известный своими моделями для синтеза голоса, решил использовать нашумевшую Sora, чтобы представить новый инструмент.

🔩 В своем x/твиттере разработчики анонсировали фичу, которая позволит генерировать аудиоэффекты по промпту.

В качестве наглядного примера они использовали видео, сгенерированные Sora.

❓ Как это будет работать, пока неясно: нужно ли будет подробно описывать желаемый звук или нейросеть сможет додумать детали по исходному видео.

📝 Релиз обещают скоро, пока можно записаться в очередь.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤1

555 views09:15