D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
🔨 Sora дали потестировать профессиональным дизайнерам и художникам. Вот что получилось

В блоге OpenAI появились несколько роликов, созданных с помощью Sora художниками, 3D-дизайнерами, креативными студиями и продакшн-компаниями.

💬 В посте есть цитаты тестировщиков об опыте взаимодействия с нейросетью — естественно, все они в восторге и продвигают важный для OpenAI нарратив, что Sora не заменит креативщиков, а станет им верным помощником.

🎞 Опубликованные ролики варьируются от полных абстракций до передачи «В мире животных» из параллельной вселенной и истории мужчины с воздушным шариком на месте головы.

😱 Да, генерации Sora все еще выглядят потрясающе.

📆 Модель должна стать доступна всем желающим до конца года. По слухам, компания уже продвигает свою нейросеть в Голливуде.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
😱 Google показал продвинутые NeRF-ы c трехзначным FPS

RadSplat — это новый метод рендеринга сложных сцен в реальном времени.

☝️ RadSplat включает в себя NeRF, который отвечает за детальную 3D-модель сцены, а также за ее последующую оптимизацию и представление в виде точек в пространстве (Point Based Scene Representation), что требует меньше ресурсов, чем, скажем, mesh-объекты.

🔩 RadSplat также использует Gaussian Splatting и встроенный бенчмарк, который определяет «важность» тех или иных объектов в сцене для рендеринга.

🙈 Большие сцены RadSplat разбивает на несколько сегментов и рендерит только те, которые будет видно.

Все эти фокусы и позволяют достичь сумасшедшего фреймрейта до 900 кадров.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🔫 Почему ИИ (пока) не может убить поисковик Google

Автор The Verge решил разобраться, что удобнее — поисковик Google или новомодные сервисы You.com и Perplexity, использующие генеративный ИИ.

Результат, за редким исключением, оказался не в пользу последних.

🔎 Сервисы тестировали на самых популярных запросах трех типов: навигационных (поиск сайтов), информационных (запросах, у которых есть один верный ответ — например, сколько в следующем году длятся новогодние каникулы) и исследовательских (когда пользователь изучает обширную тему и хочет с чего-то начать).

🔎 С навигационными запросами точно лучше справляется Google. Поисковик сразу выдает нужный сайт. ИИ сначала подумает, а потом, вместо ссылки, расскажет историю компании, сайт которой вам нужен.

🔎 С информационными запросами тоже лучше справится обычный поисковик. ИИ может выдать устаревшую, выдуманную или просто ненужную информацию. Google же сразу покажет результат и релевантные данные (например, на какой минуте был забит гол).

🗺 Кроме того, Google учитывает при запросе местоположение пользователя, что делает результаты еще точнее. ИИ пока что так не умеет.

🌭 Есть один подвид информационных запросов, с которым ИИ справляется лучше. Например, когда вы ищете, как сделать скриншот на айфоне или рецепт блюда, то ИИ сразу даст ответ. Гугл же отправит на сайты, где вам придется проскроллить тонну баннеров и ненужной информации, прежде чем наконец-то узнать, что нужно делать.

🤖 В конечном итоге тип запросов, с которым ИИ справляется однозначано лучше — это исследовательский. Пользователь только начал изучать тему и ему нужна краткая информация по всем важным деталям. Тут пригодится саммарайзинг, на который не способен Google. Правда, и в этом случае ИИ не застрахован от галлюцинаций.

🔚 В большинстве случаев пользователю не нужна тонна информации по его запросу. Ему нужна ссылка или конкретная цифра. С этим ИИ пока не справляется. Кажется, действительно произведет революцию тот, кто сможет органично объединить классический поисковик с «умным».
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🤔5
😮 А мы тут наделали генеративных видосов для RUTUBE

🧪 В рамках теста мы специально для RUTUBE создали коллекцию из нескольких десятков шортов с полностью синтетическим видеорядом.

🫡 Всю коллекцию можно найти здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9🤔322
This media is not supported in your browser
VIEW IN TELEGRAM
💃 HeyGen научился дублировать движущиеся аватары на разные языки

Стартап, который прошлым летом многим взорвал мозг реалистичными аватарами, продолжает добавлять новые возможности своему сервису.

Теперь у HeyGen появилась функция Avatar in Motion, которая позволяет дублировать на разные языки не просто сидящего или стоящего человека, а человека, который во время речи двигается 🚶‍♂️.

🔩 При этом все фишки дубляжа, которыми так гордится HeyGen, сохраняются: остаются все особенности речи говорящего, качественный липсинк. Фоновые звуки, которые добавляют видео реалистичности, тоже остаются на месте.

❗️ В данном случае HeyGen не генерирует аватар с нуля, а использует готовое видео.

Из поста к ролику выше выясняется, что герой клипа изначально говорил на немецком, а английскую речь тоже сгенерировал HeyGen. Вот это поворот! 🤔

Стартап предлагает в комментариях к посту оставлять тексты, которые потом произнесет герой видео.

💵 Heygen все еще можно попробовать бесплатно, стоимость платных тарифов начинается от $24 в месяц. Создание аватара студийного качества обойдется в $1 тыс. в год.

💵 Недавно стало известно, что оценочная стоимость HeyGen за 4 месяца выросла в 6 раз и почти достигла $0,5 млрд.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2🤔21
Microsoft рассказал сколько минут нужно ИИ, чтобы стать полезным

11 минут.

👌 Именно столько должен экономить ИИ каждый день, чтобы человек увидел в нем пользу .

👥 Microsoft вывел эту цифру, проведя опрос 1,3 тыс. пользователей помощника Copilot.

⌚️ Среди опрошенных были и те, кому ИИ экономил гораздо больше — до 30 минут ежедневно.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2
Stability AI потерял всех ключевых сотрудников, Яндекс анонсировал новое поколение Yandex GPT, Юрий Никулин вернется в виде дипфейка — и другие важные новости за неделю

CEO Stability AI Эмад Мостак покинул компанию вслед за несколькими ключевыми сотрудниками, ушедшими на несколько дней раньше. Пост временного главы стартапа разделят между собой CTO и COO компании. Мостак уверяет, что решение уйти было принято им и заявил, что теперь вплотную займется вопросами децентрализации ИИ. Тем не менее внимание обращает на себя тот факт, что Мостак ушел на фоне слухов о попытках руководства Stability AI продать компанию, сложного финансового положения стартапа и текучки кадров. К репутации самого гендира тоже были вопросы;

Spotify запустит видеокурсы совместно с Би-би-си, платформой Skillshare и другими компаниями. Пока уроки запустят только для пользователей в Великобритании. Курсы будут доступны всем подписчикам. Первые два урока можно будет получить бесплатно, дальше придется платить £20–80. Темы уроков самые разные — от создания музыки до обучения Excel;

ООН приняла первую резолюцию по искусственному интеллекту. Документ, единогласно поддержанный всеми 193 членами Генассамблеи (включая Россию и Китай), призывает к регулированию ИИ, защите личной информации при использовании и разработке моделей и борьбе со злонамеренным использованием технологии;

Сарик Андреасян использует дипфейк Юрия Никулина в проекте Манюня: Приключения в Москве, где Андреасян и его брат Гевонд выступают продюсерами. Действие Манюни происходит в 1980-х, а Никулин — один из ключевых персонажей истории. Наследники Никулина оказались не против такого использования образа актера. В кинотеатрах Манюня должна выйти в мае;

Яндекс анонсировал новое поколение LLM YandexGPT. Пока из нового семейства моделей доступна только Pro-версия через API. Также через Yandex Cloud можно попробовать демоверсию модели. Разработчики говорят, что новая LLM лучше понимает контекст беседы, эффективнее работает со сложными запросами и т. д. Также Яндекс хвастается, что в бенчмарках их разработка обходит на несколько процентных пунктов GPT-3.5 Turbo;

Amazon потратит еще $150 млрд на строительство дата-центров, чтобы обеспечить всех нуждающихся в мощностях для работы ИИ и сохранить за собой лидерство на облачном рынке. Десятки миллиардов потратят не единовременно, а на протяжении 15 лет. Сейчас Amazon занимает около 31% рынка, на втором месте Microsoft — с 24%.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🆕 Adobe выкатил генеративный сервис для маркетологов

GenStudio позволяет с помощью нейросетей запустить маркетинговую кампанию сразу на нескольких платформах.

С помощью GenStudio можно быстро запилить брендированные рекламные шаблоны для размещения в соцсетях, имейл-рассылках и т. д.

📊 Запущенные кампании можно будет проанализировать на их эффективность.

🧠 Нейросеть можно обучить на существующих примерах рекламных материалов компании, чтобы ИИ понял Tone of Voice бренда.

🔩 GenStudio интегрируется в другие маркетинговые инструменты Adobe вроде Journey Optimizer и Marketo.

В Adobe считают, что GenStudio подойдет как большому, так и малому бизнесу. Впервые сервис анонсировали прошлой осенью.

🌐 В будущем Adobe обещает добавить возможность генерировать целые сайты с помощью нейросети.

💵 Сейчас GenStudio находится на этапе альфа-тестирования, цена будет варьироваться в зависимости от размера бизнеса.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔3
Media is too big
VIEW IN TELEGRAM
🎞 Новый метод для увеличения хронометража синтетических видео

Streaming T2V — это авторегрессионная техника, которая позволяет увеличить продолжительность сгенерированного Text-to-Video нейросетью клипа с нескольких секунд до 2-х минут и даже дольше.

🔮 Авторегрессионная техника означает, что метод учитывает предыдущую информацию (в данном случае — сгенерированное видео), чтобы «предсказать», что будет происходить дальше.

Важно, что Streaming T2V при этом сохраняет консистентность видео, его детали, фреймрейт и старается как можно ближе следовать изначальному промпту.

🔩 Для этого используется несколько методов, один из которых при генерации не дает забыть исходный кадр нейровидео.

🔫 При этом расширенная часть клипа будет наполнена «экшеном», тогда как конкуренты зачастую выдают статичную картинку, утверждают создатели.

Разработчики отмечают, что улучшения в базовой модели приводят к более эффективным результатам Streaming T2V.

📆 Код и демо обещают позже.

Недавно мы рассказывали еще об одном методе оптимизации работы нейросетей.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤔1
💸 ИИ-компании потратили на чипы в 17 раз больше денег, чем заработали

Но это пока что мало кого волнует.

Как пишет Wall Street Journal со ссылкой на данные венчурного фонда Sequoia, за прошлый год индустрия потратила на чипы от Nvidia $50 млрд. Выручка ИИ-компаний при этом составила всего лишь $3 млрд.

💭 Часть экспертов считает, что такие цифры могут говорить о растущем на рынке пузыре.

🧠 Помимо сумасшедших трат на процессоры, об этом могут свидетельствовать и темпы, которыми растет оценочная стоимость компаний, работающих над любым продуктом, связанным с ИИ.

📈 Например, стоимость стартапа Cognition Labs всего за несколько недель выросла с $350 млн до $1 млрд. Но компанию не устроила такая оценка и она хочет привлечь инвестиции при оценке в $2 млрд. При этом программа для написания программного кода с помощью ИИ, над которой работает стартап, не приносит практически никакой прибыли.

🖥 Отрезвляющая статистика по затратам ИИ-стартапов и их выручке вряд ли что-то изменит в ближайшее время. Например, Microsoft уже собирается построить для OpenAI суперкомпьютер ценой около $100 млрд — это приблизительно в 100 раз больше стоимости самого мощного современного дата-центра.
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3🤔2👍1
🟡 Новая оживлялка аватаров от Tencent

Китайская компания в последнее время чуть ли не каждую неделю выпускает генеративные инструменты.

🆕 Знакомьтесь, AniPortrait — фреймворк для генерации анимированных аватаров из портрета и аудио или видео.

☝️ Доступно три способа применения: генерация анимации из аудио, создание анимации из портрета и Head Pose-видео (видео, где человек держит голову в определенном положении) и, наконец, из любого видео и любого портрета (своего рода дипфейк).

Называется это Audio Driven, Self Driven и Face Reenactment — см. картинку выше.

💪 Разработчики утверждают, что по сравнению с многочисленными конкурентами, появившимися в последнее время, AniPortrait особенно хорошо удается липсинк и естественные движения аватара.

Код здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 Вышла новая версия Stable Audio

В Stable Audio 2.0, в отличие от предшественника, теперь можно:

Генерировать треки продолжительностью до трех минут в высоком качестве;

🗣 Использовать Audio-to-Audio. Пользователь может загрузить свой сэмпл и редактировать его через промпты;

🎷 Быстро менять музыкальный стиль генерации;

💣 Применять расширенные возможности по созданию аудиоэффектов.

Suno пока может спать спокойно — создать полноценный трек с вокалом и текстом Stable Audio не может. А учитывая непростую ситуацию в Stability AI, пока непонятно — как стартап будет дальше развивать свои модели.

🎞 Пока же разработчики завели на YouTube отдельный канал, где 24/7 транслируется музыка, сгенерированная нейросетью.

🫡 Попробовать Stable Audio можно тут. После регистрации дадут 20 кредитов на генерации.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2