D. Lab
1.09K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
Microsoft рассказал сколько минут нужно ИИ, чтобы стать полезным

11 минут.

👌 Именно столько должен экономить ИИ каждый день, чтобы человек увидел в нем пользу .

👥 Microsoft вывел эту цифру, проведя опрос 1,3 тыс. пользователей помощника Copilot.

⌚️ Среди опрошенных были и те, кому ИИ экономил гораздо больше — до 30 минут ежедневно.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2
Stability AI потерял всех ключевых сотрудников, Яндекс анонсировал новое поколение Yandex GPT, Юрий Никулин вернется в виде дипфейка — и другие важные новости за неделю

CEO Stability AI Эмад Мостак покинул компанию вслед за несколькими ключевыми сотрудниками, ушедшими на несколько дней раньше. Пост временного главы стартапа разделят между собой CTO и COO компании. Мостак уверяет, что решение уйти было принято им и заявил, что теперь вплотную займется вопросами децентрализации ИИ. Тем не менее внимание обращает на себя тот факт, что Мостак ушел на фоне слухов о попытках руководства Stability AI продать компанию, сложного финансового положения стартапа и текучки кадров. К репутации самого гендира тоже были вопросы;

Spotify запустит видеокурсы совместно с Би-би-си, платформой Skillshare и другими компаниями. Пока уроки запустят только для пользователей в Великобритании. Курсы будут доступны всем подписчикам. Первые два урока можно будет получить бесплатно, дальше придется платить £20–80. Темы уроков самые разные — от создания музыки до обучения Excel;

ООН приняла первую резолюцию по искусственному интеллекту. Документ, единогласно поддержанный всеми 193 членами Генассамблеи (включая Россию и Китай), призывает к регулированию ИИ, защите личной информации при использовании и разработке моделей и борьбе со злонамеренным использованием технологии;

Сарик Андреасян использует дипфейк Юрия Никулина в проекте Манюня: Приключения в Москве, где Андреасян и его брат Гевонд выступают продюсерами. Действие Манюни происходит в 1980-х, а Никулин — один из ключевых персонажей истории. Наследники Никулина оказались не против такого использования образа актера. В кинотеатрах Манюня должна выйти в мае;

Яндекс анонсировал новое поколение LLM YandexGPT. Пока из нового семейства моделей доступна только Pro-версия через API. Также через Yandex Cloud можно попробовать демоверсию модели. Разработчики говорят, что новая LLM лучше понимает контекст беседы, эффективнее работает со сложными запросами и т. д. Также Яндекс хвастается, что в бенчмарках их разработка обходит на несколько процентных пунктов GPT-3.5 Turbo;

Amazon потратит еще $150 млрд на строительство дата-центров, чтобы обеспечить всех нуждающихся в мощностях для работы ИИ и сохранить за собой лидерство на облачном рынке. Десятки миллиардов потратят не единовременно, а на протяжении 15 лет. Сейчас Amazon занимает около 31% рынка, на втором месте Microsoft — с 24%.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🆕 Adobe выкатил генеративный сервис для маркетологов

GenStudio позволяет с помощью нейросетей запустить маркетинговую кампанию сразу на нескольких платформах.

С помощью GenStudio можно быстро запилить брендированные рекламные шаблоны для размещения в соцсетях, имейл-рассылках и т. д.

📊 Запущенные кампании можно будет проанализировать на их эффективность.

🧠 Нейросеть можно обучить на существующих примерах рекламных материалов компании, чтобы ИИ понял Tone of Voice бренда.

🔩 GenStudio интегрируется в другие маркетинговые инструменты Adobe вроде Journey Optimizer и Marketo.

В Adobe считают, что GenStudio подойдет как большому, так и малому бизнесу. Впервые сервис анонсировали прошлой осенью.

🌐 В будущем Adobe обещает добавить возможность генерировать целые сайты с помощью нейросети.

💵 Сейчас GenStudio находится на этапе альфа-тестирования, цена будет варьироваться в зависимости от размера бизнеса.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔3
Media is too big
VIEW IN TELEGRAM
🎞 Новый метод для увеличения хронометража синтетических видео

Streaming T2V — это авторегрессионная техника, которая позволяет увеличить продолжительность сгенерированного Text-to-Video нейросетью клипа с нескольких секунд до 2-х минут и даже дольше.

🔮 Авторегрессионная техника означает, что метод учитывает предыдущую информацию (в данном случае — сгенерированное видео), чтобы «предсказать», что будет происходить дальше.

Важно, что Streaming T2V при этом сохраняет консистентность видео, его детали, фреймрейт и старается как можно ближе следовать изначальному промпту.

🔩 Для этого используется несколько методов, один из которых при генерации не дает забыть исходный кадр нейровидео.

🔫 При этом расширенная часть клипа будет наполнена «экшеном», тогда как конкуренты зачастую выдают статичную картинку, утверждают создатели.

Разработчики отмечают, что улучшения в базовой модели приводят к более эффективным результатам Streaming T2V.

📆 Код и демо обещают позже.

Недавно мы рассказывали еще об одном методе оптимизации работы нейросетей.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤔1
💸 ИИ-компании потратили на чипы в 17 раз больше денег, чем заработали

Но это пока что мало кого волнует.

Как пишет Wall Street Journal со ссылкой на данные венчурного фонда Sequoia, за прошлый год индустрия потратила на чипы от Nvidia $50 млрд. Выручка ИИ-компаний при этом составила всего лишь $3 млрд.

💭 Часть экспертов считает, что такие цифры могут говорить о растущем на рынке пузыре.

🧠 Помимо сумасшедших трат на процессоры, об этом могут свидетельствовать и темпы, которыми растет оценочная стоимость компаний, работающих над любым продуктом, связанным с ИИ.

📈 Например, стоимость стартапа Cognition Labs всего за несколько недель выросла с $350 млн до $1 млрд. Но компанию не устроила такая оценка и она хочет привлечь инвестиции при оценке в $2 млрд. При этом программа для написания программного кода с помощью ИИ, над которой работает стартап, не приносит практически никакой прибыли.

🖥 Отрезвляющая статистика по затратам ИИ-стартапов и их выручке вряд ли что-то изменит в ближайшее время. Например, Microsoft уже собирается построить для OpenAI суперкомпьютер ценой около $100 млрд — это приблизительно в 100 раз больше стоимости самого мощного современного дата-центра.
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3🤔2👍1
🟡 Новая оживлялка аватаров от Tencent

Китайская компания в последнее время чуть ли не каждую неделю выпускает генеративные инструменты.

🆕 Знакомьтесь, AniPortrait — фреймворк для генерации анимированных аватаров из портрета и аудио или видео.

☝️ Доступно три способа применения: генерация анимации из аудио, создание анимации из портрета и Head Pose-видео (видео, где человек держит голову в определенном положении) и, наконец, из любого видео и любого портрета (своего рода дипфейк).

Называется это Audio Driven, Self Driven и Face Reenactment — см. картинку выше.

💪 Разработчики утверждают, что по сравнению с многочисленными конкурентами, появившимися в последнее время, AniPortrait особенно хорошо удается липсинк и естественные движения аватара.

Код здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 Вышла новая версия Stable Audio

В Stable Audio 2.0, в отличие от предшественника, теперь можно:

Генерировать треки продолжительностью до трех минут в высоком качестве;

🗣 Использовать Audio-to-Audio. Пользователь может загрузить свой сэмпл и редактировать его через промпты;

🎷 Быстро менять музыкальный стиль генерации;

💣 Применять расширенные возможности по созданию аудиоэффектов.

Suno пока может спать спокойно — создать полноценный трек с вокалом и текстом Stable Audio не может. А учитывая непростую ситуацию в Stability AI, пока непонятно — как стартап будет дальше развивать свои модели.

🎞 Пока же разработчики завели на YouTube отдельный канал, где 24/7 транслируется музыка, сгенерированная нейросетью.

🫡 Попробовать Stable Audio можно тут. После регистрации дадут 20 кредитов на генерации.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
⚠️ Grok оказался самым опасным чат-ботом

Желание Илона Маска создать чат-бот, который сможет говорить с пользователем на любые темы, оказалось палкой о двух концах.

💣 Как выяснили исследователи из компании Adversa AI, не особо стараясь Grok можно убедить рассказать, как изготовить бомбу, угнать автомобиль или совратить несовершеннолетнего.

👩‍🔬 Исследователи рассказали, что у Grok ожидаемо отсутствуют любые фильтры на запросы, которые другие чат-боты считают неприемлемыми. При этом фильтры на экстремально неприемлемые запросы (типа перечисленных в предыдущем абзаце) легко обойти.

🫡 Специалисты Adversa AI тестировали Grok, Le Chat, ChatGPT, Gemini, Claude, Llama и Bing самыми популярными джейлбрейк-техниками. Например, когда чат-бот просят представить себя в роли кого-то, кто может ответить на вопрос на запрещенную тему.

📊 Grok в исследовании показал себя хуже всех, но Le Chat от французского стартапа Mistral AI выступил немногим лучше (о его уязвимости мы уже писали). Не удалось взломать только Llama, а остальные чат-боты попались хотя бы на один джейлбрейк.

Не стоит думать, что Llama действительно невозможно взломать — такие методы существуют. Но те техники, которые использовали Adversa AI, не сработали.

☝️ Вывод такой: компании очень спешат выпустить свой чат-бот из-за высокой конкуренции на рынке, забывая про (или забивая на) безопасность.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤔2
Создатели ChatGPT клонируют голоса, YouTube борется со скучными видео, Google будет брать деньги за поиск — и другие важные новости за неделю

Власти США обязали каждое федеральное ведомство в стране ввести должность главного по искусственному интеллекту (Chief AI Officer). На своей должности специалисты будут выступать в роли советчиков по инициативам, связанным с искусственным интеллектом, отслеживать и документировать случаи использования ИИ внутри ведомства и оценивать риски от использования ИИ;

OpenAI продемонстрировал свою нейросеть для клонирования голоса Voice Engine. Модели нужно 15 секунд аудио, чтобы создать идентичный голос. Нейросеть сохраняет все особенности речи говорящего даже при переводе на другой язык. Когда Voice Engine переводит, скажем, французскую речь на английский, то у говорящего появляется характерный акцент. Стартап также видит возможности медицинского использования. О выпуске модели в публичный доступ речи пока не идет — OpenAI опасаются случаев недобросовестного использования их разработки;

На этой неделе OpenAI также открыл доступ к GPT-3,5 Turbo без регистрации. За доступ без личных данных придется смириться с ограничениями: LLM не будет отвечать на некоторые вопросы и сохранять историю переписки с пользователями. Свободный доступ к GPT-3,5 будут постепенно добавлять в новые регионы;

С помощью ИИ YouTube тестирует функцию перемотки «скучных» моментов видео. А с помощью ML-алгоритмов ролики анализируют на самые просматриваемые моменты и предлагают пользователю остановиться только на них. Функция Jump Ahead пока доступна только некоторым платным подписчикам в США и не на всех видео;

Больше 200 музыкантов подписали открытое письмо к разработчикам ИИ-моделей с требованием прекратить нарушать их права в качестве артистов. Конкретно, музыкантов волнует практика клонирования голосов и использование ИИ, чтобы не платить им роялти. Подписанты требуют от музыкальных сервисов взять на себя обязательство не использовать музыкальные нейросети. Среди тех, кто поддержал требования: Билли Айлиш, Кэти Перри, Ники Минаж, Стиви Уандер и другие;

Сбер выпустил в ограниченный доступ новую версию нейросети Kandinsky. Версия 3.1 работает быстрее предыдущей в 20 раз; умеет автоматически «бьютифицировать» изображение, дополняя пользовательский промпт; генерирует изображения в 4К и др. Когда Kandinsky станет доступен всем, пока не уточняется;

Google рассматривает возможность брать с пользователей отдельную плату за ИИ-функции в поисковике. Пэйвол находится в разработке, но финального решения по его использованию нет, как и подробностей о том, о каких функциях идет речь. Тем не менее Google уже сейчас не рассматривает возможность отключения рекламы для тех, кто заплатил за премиум-версию поисковика;

И еще одна новость из мира поисковиков: сервис Perplexity собирается продавать рекламу в своем ИИ-поисковике. Рекламные сообщения должны появиться в подборке вопросов по теме, которые сервис предлагает пользователю;

Газпром-Медиа Холдинг третий год подряд выступит генеральным медиапартнером ПМЭФ. D.lab, как часть холдинга, планирует принять участие в форуме вместе с коллегами из других активов.
👍2
Нил Моган

🎞 YouTube пригрозил OpenAI за использование видео с платформы

CEO видеохостинга Нил Моган заявил, что использование видео, размещенных на платформе, для обучения ИИ-моделей, нарушает правила YouTube.

💬 Так Моган отреагировал на недавнее интервью технического директора OpenAI Миры Мурати. В нем она заявила, что видеомодель Sora обучалась на клипах, находящихся в открытом доступе, — возможно, и на тех, которые опубликованы на YouTube.

🚫 По словам Могана, в правилах использования хостинга четко прописано, что контент с YouTube нельзя использовать для сторонних сервисов. Имеются в виду не только сами видео, но и их текстовые расшифровки.

Мурати в своем интервью не сказала точно, откуда были взяты видео, на которых обучалась Sora.

📋 В материале New York Times (NYT), вышедшем уже после слов Могана, утверждается, что OpenAI использовали «миллионы часов» видео на YouTube в виде текстовых расшифровок для обучения GPT-4. Стартап пошел на этот шаг, так как якобы исчерпал все подходящие для обучения LLM источники англоязычных текстов. Sora в материале не упоминается.

©️ При этом Google, который владеет YouTube, сам использовал контент, размещенный на видеохостинге, для обучения ИИ. Как пишет NYT, это также может нарушать копирайт авторов видео.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4
👉 Новый point and click-метод редактирования изображений

StableDrag от Tencent — следующая ступень в развитии инструментов для редактирования со словом Drag в названии. Мы уже рассказывали про DragGAN, а были еще FreeDrag, DragDiffusion и другие.

🔩 Механика у таких методов примерно одинакова: пользователь кликает на часть изображения, которую хочет отредактировать, и «перетягивает» ее в нужном направлении.

Разработчики StableDrag утверждают, что им удалось решить основные проблемы подобных методов,. Речь, например, о кривом поинт трекинге, из-за которого изображение редактировалось не так, как задумывал пользователь.

👍 Так, StableDrag умеет самостоятельно оценивать качество редактирования, и если оно становится слишком низким, то фреймворк сбрасывает изменения и возвращается к исходному изображению.

🤷‍♀️ Код StableDrag и подробный Research Paper придется подождать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2🤔1
🤑 Forbes рассказал, как Сэм Альтман стал миллиардером

Дело не в успехах OpenAI, просто Альтман — еще и талантливый инвестор. Forbes пишет, что у Альтмана есть целый «лабиринт» холдингов, через которые он вкладывает деньги.

📆 Первые инвестиции он сделал еще в 2010 году, когда ему было 25. А в 2012 году он продал мобильное приложение Loopt за $43 млн и вложил часть в венчурный фонд Hydrazine Capital, запущенный им в том же году.

📈 Уже в 2014 году Альтман хвастался, что 5 из 40 инвестиций выросли в стоимости в 100 раз. Самым успешным оказался финтех-стартап Stripe.

💼 В том же 2014-м Альтман стал президентом венчурного фонда Y Combinator (он также был одним из его основателей). Он проработал на должности 5 лет, существенно расширив инвестиционный портфель фонда.

💬 Альтман не прекратил инвестировать и уйдя из Y Combinator в OpenAI в 2019 году. В 2020 году он вместе с братом запустил фонд Apollo Projects, где был советником.

🆕 Альтман через фонды и лично имеет долю в Reddit на общую сумму в $580 млн. Из этой суммы 14% — личные средства главы OpenAI.

🏚 Также он зарабатывает на недвижимости на Гавайях и в Калифорнии общей стоимостью $90 млн.

💵 Среди инвестиций предпринимателя есть занимающаяся атомной энергетикой компания Helion и изучающий вопросы долголетия стартап Retro Biosciences. В Helion Альтман вложил $375 млн из личных средств, в Retro Biosciences — около $170 млн.

🤔 Что касается OpenAI, то, как утверждается публично, Альтман не получает денег от работы в стартапе. Эксперты относятся к таким заявлениям скептически. Возможно, именно успех OpenAI позволил Альтману вложить гигантские суммы в Helion и Retro Biosciences.

🧠 Forbes описывает инвестиционную стратегию Альтмана так: небольшие по сумме, но многочисленные инвестиции в рискованные проекты и несколько крупных инвестиций, на которые приходятся основные деньги. Сам Альтман говорит, что ему удается находить талантливых людей, о которых никто не слышал
Please open Telegram to view this post
VIEW IN TELEGRAM
22🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🎮 Dyson геймифицировал уборку пылесосом

Помните, как пользователь твиттера превратил уборку пылесосом в игру?

🤔 Кажется, вирусный ролик увидел кто-то в компании Dyson и решил украсть позаимствовать идею. Новая функция получила название CleanTrace.

☎️ Версия Dyson получилась менее элегантной, но более практичной — если в твиттере для AR-уборки использовали хедсет Oculus Quest, то для CleanTrace понадобится смартфон, прикрепленный к пылесосу.

💵 Функция будет доступна в июне пользователям пылесоса Gen5Detect, стоимостью почти $1000. Quest, если что, стоит почти в 4 раза дешевле.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 «Убийца» Suno от бывших сотрудников DeepMind

🎼 Udio не только немного похож на Suno названием, но и умеет приблизительно тоже самое — генерировать полноценные треки с вокалом по текстовой подсказке.

☝️ Нейросеть поддерживает несколько языков, включая русский; может расширить сэмпл до трека; может по текстовой подсказке продолжить трек в другом жанре (если вдруг захотелось превратить дэт-метал в кальянный рэп).

©️Разработчики отмечают, что в промпте можно прямо написать в стиле какого исполнителя должен быть исполнен трек. Но нейросеть якобы не будет копировать чужой вокал, а каким-то образом подберет похожий вариант.

🤔 При этом те, кто попробовал модель, пишут, что синтетический вокал не отличить от оригинала.

🤑 Udio позиционируется разарботчиками как инструмент в том числе и для профессиональных музыкантов. Для них в сервис позже обещают добавить возможности монетизации.

💵 У Udio много крупных инвесторов, включая венчурный фонд a16z, участника Black Eyed Peas и музыкального продюсера will.i.am и сооснователя Instagram* Майка Кригера.

🫡 Сейчас Udio находится в открытом бета-тесте, попробовать можно на официальном сайте (тем, кто в России, придется поколдовать с регионом). После регистрации можно генерировать до 1,2 тыс треков (!!) в месяц.

🤷‍♀️ На момент написания текста, сайт был перегружен.

*Instagram входит в Meta — организацию, запрещенную на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3🤔2
Генеративный таймлапс

Именно этого всем нам не хватает, посчитали исследователи из университетов Сингапура, Китая и США, и придумали MagicTime.

🔨 MagicTime — это фреймворк, который позволяет генерировать клипы, где предметы физически корректно изменяются с течением времени. Это значит, что для синтетического таймлапса особенно важна консистентность генерации на определенном отрезке времени (иначе мы просто не увидим желаемый результат).

🗂 Для обучения модели физическим законам разработчики использовали реальные видео высокого качества с замедленной съемкой и запилили с ними отдельный датасет ChronoMagic.

🔩 Чтобы исходная нейросеть в генерациях отдавала приоритет именно физическим изменениям предмета, разработчики добавили механику Dynamic Frames Extraction.

Также авторы прикрутили к MagicTime специальный кодировщик, который позволяет нейросети лучше справляться с «метаморфическими промптами» — текстовыми подсказками, в которых контретно дано указание на генерацию таймлапса.

📆 Разработчики считают, что в будущем MagicTime можно будет использовать для симуляции трансформации предметов с заданными физическими параметрами.

Код здесь. Демо можно потестировать тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
🛍 TikTok тестирует виртуальных рекламных инфлюенсеров

Соцсеть ведет переговоры с рекламодателями о перспективах использования сгенерированных нейросетью аватаров, которые будут продвигать их продукцию.

💬 Клиенты смогут по промпту получить сценарий рекламного ролика, который потом отыграет нейроинфлюенсер.

🏪 Продавцы, которые продают свои товары на маркетплейсе TikTok Shop, тоже смогут использовать ИИ.

🤫 TikTok не подтверждает и не отрицает информацию о разработке нового рекламного инструмента.

Интересно, как TikTok собирается объяснять контентмейкерам, которые зарабатывают в соцсети, появление их прямого конкурента — если, конечно, тест окажется успешным.

🧪 TikTok не первый, кто пытается найти рекламное применение нейросетям с помощью виртуальных инфлюенсеров. Пока все эти кейсы больше похожи на эксперименты.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1