D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
🔫 Kling клином вышибают: китайцы показали убийцу Sora

Диффузионная Text-to-Video нейросеть от компании Kuaishou (создатели приложения KWAI — конкурента TikTok) может генерировать видео продолжительностью до двух минут в 1080p.

Модель использует для генераций собственную технологию 3D VAE.

☝️ Обещают продвинутую физику внутри генераций, сложные сцены, реалистичных персонажей (не только внешне, но и в плане анимации) и корректное следование даже самым фантастическим промптам (типа кота, едущего на автомобиле по городу).

🤔 Китайцы уже анонсировали другого убийцу Sora несколько недель назад. Но Vidu был достаточно странной штукой, о которой с тех пор ничего не слышно. Kling выглядит убедительнее.

🫡 Оценить, действительно ли модель может создавать такие крышесносные видео, пока не получится. Вроде бы есть возможность записаться в очередь на тестирование модели через приложение (QR-код есть на сайте), но как это сделать, мы разобраться не смогли.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
IKEA платит деньги виртуальным сотрудникам, в X разрешили порно, генерации Sora покажут на кинофестивале — и другие важные новости за неделю

Из-за бума ИИ и количества энергии, которое потребляют ИИ-модели, энергетические компании в США решили повременить с отказом от угольных электростанций. Компании, которые до этого собирались закрыть или перевести такие предприятия на другой тип топлива в ближайшие три–пять лет, теперь откладывают планы в долгий ящик. Это может помешать планам американского правительства добиться безуглеродного энергетического сектора к 2035 году;

Нейросеть Stable Diffusion 3 появится в открытом доступе 12 июня. Сначала выпустят Medium-версию, доступную только для некоммерческого использования. Все технические подробности о новой версии станут известны, видимо, уже после выхода;

В X официально разрешили публиковать порно. Найти его там можно было и раньше, но теперь контент для взрослых прописали в правилах соцсети. Уточняется, что видео должно быть записано и опубликовано с согласия всех участвующих и с соответствующей маркировкой. Порно, созданное с помощью нейросетей, тоже разрешили. Судя по всему, никакой премодерации таких видео не предусмотрено, а контент будут удалять только после жалоб;

Один из главных инди-кинофестивалей покажет короткометражки, сгенерированные Sora. На фестивале Трайбека в Нью-Йорке представят пять видео в рамках новой программы Sora Shorts, созданные пятью режиссерами — в том числе победительницей кинофестиваля Санденс Никиату Джусу. Логично, что OpenAI решил прорекламировать Sora именно на Трайбеке — независимые режиссеры всегда работают с небольшим бюджетом и нейросеть (хотя бы в теории) могла бы помочь сэкономить;

Илон Маск перенаправил ИИ-чипы Nvidia, которые предназначались для Tesla, в свой стартап xAI. Совпадение или нет, но незадолго до этого стало известно, что Маск собрался строить суперкомпьютер для обучения новой версии Grok, которому понадобится 100 тыс. чипов. Сам Маск объяснил изменения тем, что у Tesla сейчас просто нет места, где хранить больше 10 тыс. чипов. При этом производитель электромобилей в итоге все равно должен получить полупроводники на $500 млн, но с задержкой в несколько месяцев. Видимо, к тому моменту и место для них найдется;

Любитель нейросетей Дрейк использовал в новой песне U My Everything сэмпл из трека BBL Drizzy, сгенерированного Udio по промпту комика King Wilonius. Теперь юристы гадают, должны ли Дрейк и его коллега по треку Sexyy Red были получить право на использование аудиофрагмента. Дело в том, что музыкальная часть трека создана нейросетью, и получать разрешение на ее использование не нужно. Но текст к BBL Drizzy King Wilonius написал сам, а значит, он является автором песни и все-таки должен получать отчисления за сэмпл;

Shutterstock заработал $104 млн за год на лицензировании своего контента для обучения ИИ-моделей. Среди клиентов: Apple, Amazon, Alphabet и другие бигтехи, которые заплатили сервису около $10 млн каждый. В Shutterstock прогнозируют, что к 2027 году доходы от лицензирования для ИИ вырастут еще в два раза;

YouTube тестирует виртуальный зеленый экран Dream Screen, который поможет создателям Shorts сэкономить на создании контента. Экран позволяет по промпту получить фон для ролика, не тратясь на приобретение хромакея. Аналог зеленого экрана появился в Shorts в 2022 году, но тогда он позволял только добавить в качестве фона изображение или видео, а не сгенерировать его в приложении;

На неделе Nvidia стала второй самой дорогой компанией в мире, обогнав Apple и уступив только Microsoft. Стоимость компании перевалила за $3 трлн. Те, кто следит за успехами компании, вряд ли удивятся этой новости — бум ИИ обеспечивает Nvidia сверхприбыли уже не первый квартал;

IKEA набирает сотрудников в свой виртуальный магазин в Roblox. Платить будут около $16 в час в реальных деньгах, а не в Roblox-валюте. Магазин открывается 24 июня, резюме можно отправить до 16 июня. Оплачивать виртуальный труд будут только на некоторых должностях. Еще одно условие — соискателю должно быть минимум 18 лет.
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🏋️‍♂️🤖 Фитнесс-клуб, где всем заправляет ИИ

В Lumin Fitness ИИ интегрирован везде, где для него нашлось место: от экранов с фоновыми видео (сгенерированы нейросетью) до тренеров (продвинутые голосовые помощники).

📸 Используя камеры и датчики отслеживания движения, виртуальные тренеры могут в реальном времени дать совет, как выполнять упражнение более эффективно. В зале также встроены камеры, которые с помощью ИИ распознают спортивные снаряды — это нужно для тренировок, которые созданы в формате мини-игр.

🎧 Кроме тренера клиент может выбрать музыку, которая должна играть во время тренировки.

😮‍💨 Программы тренировок пока еще разрабатывают люди.

У фитнес-клуба даже есть внутренняя валюта (Lumin Coin), которую можно заработать на тренировке, а затем потратить на мерч или забронировать любимое место в зале.

Абонемент в клуб стоит от $89 до $209 в месяц.

🌆 Создатели Lumin Fitness в будущем планируют расширять сеть (сейчас работает один клуб в Техасе), а также продавать технологию. Пока компания начала с франшизы: в начале года стало известно, что под вывеской Lumin Fitness откроется еще 13 заведений в Техасе.
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤔1😱1
😐 Владелец TikTok разработал ИИ-редактор изображений: работает по типу «потяни и отредактируй»

В рядах редакторов изображений со словом Drag в названии пополнение — Национальный университет Сингапура и владелец TikTok, китайская ByteDance, показали InstaDrag.

🔴🔵Работает сервис по механике «потяни и отредактируй». Пользователь ставит две точки: красные — на те области, которые нужно «повернуть», синие (целевые) — на участки, куда изображение повернется.

🤔Разработчики заявляют, что изображения редактируются менее, чем за секунду, тогда как у конкурентов процесс может занимать до минуты. Такой скорости удалось достичь за счет упрощения работы редактора по сравнению с аналогами.

InstaDrag сразу использует исходное изображение в качестве условий (conditional generation) для последующей генерации, избегая времязатратной оптимизации, как у конкурентов. Ресурсы при этом тоже экономятся.

🎞 За счет того, что фреймворк обучен на видеоинформации, генерации получаются более точными и естественными, чем у других.

🤷‍♀️ По крайней мере, должны — потестировать InstaDrag пока нельзя.

🙂 InstaDrag — далеко не первый ИИ-редактор, работающий по типу «потяни и отредактируй». Аналогичный инструмент — StableDrag — есть у конкурента ByteDance в родном Китае, компании Tencent.

Более ранний ИИ-редактор из «Drag-семейства» — DragGAN — в 2023 году представил один из доцентов Наньянского технологического университета.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔2
🫡 Еще одна видеонейросеть следующего поколения — от Luma AI. Попробовать можно прямо сейчас

Luma Dream Machine — новый конкурент Sora, которые последнее время появляются чуть ли не каждую неделю.

Важное отличие нейросети как от самой Sora, так и от недавнего Kling — его можно без проблем потестировать, нужно будет только зарегистрироваться через Google-аккаунт.

🔩 Генерации можно создавать по промпту или изображению-референсу. По умолчанию Dream Machine сама расширяет пользовательский промпт.

В остальном обещают все как у конкурентов: продвинутая физика и анимация даже в самых сложных сценах, высокая консистентность видео и т.д. Технических деталей разработчики пока не раскрывают.

🧪Наш опыт тестирования модели показал, что она иногда очень приблизительно следует промптам, а качество видео сильно варьировалась от случая к случаю (видео с девушкой и тигром из подборки — наши). Продолжительность клипа — около 4-5 секунд.

🔮 Luma AI обещают, что Dream Machine станет первой в серии передовых нейросетей (Frontier Generative Models) для генерации «нового контента из изображений, текста, видео и других вводных».

Мы уже несколько раз писали о Luma AI, но Dream Machine это, пожалуй, первый по-настоящему большой релиз от стартапа.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2
D. lab на ПМЭФ: что показала цифровая лаборатория на главном экономическом форуме

⛽️ Специально для Петербургского международного экономического форума (проходил с 5 по 8 июня) цифровая лаборатория Газпром-Медиа Холдинга — D.lab — разработала сервис ИИ-стилизации изображений для стенда RUTUBE. Сфотографироваться и получить стилизованное изображение в выбранном образе мог любой посетитель стенда.

📸 Сервис построен на генеративном ИИ и работает следующим образом: в систему загружают фото посетителя, он выбирает один из предустановленных стилей — космос, русский, киберпанк, фэнтези, аниме и гламур. На выходе посетитель получает свой образ в выбраном стиле

👩🏼 За 4 дня форума сервисом воспользовались более 750 раз. Среди воспользовавшихся — официальный представитель МИД РФ Мария Захарова

📰 Также на ПМЭФ, в рамках Форума Креативного Бизнеса, прошла сессия «ИИ и Нейросети: замена креаторам или новый инструмент?», в которой участвовал руководитель D.lab Эдуард Маас

ИИ — это инструмент. Но совершенно новый. Его можно сравнить с изобретением кинокамеры. Реальность сейчас проявляется через нейросети. Но мы — люди — все равно гораздо круче. ИИ нужны большие вычислительные мощности. А нам чтобы придумать что-то стоящее, утром достаточно кофе и пирожка. Нейросети могут сделать множество картинок. Но определить и выбрать красивую может только человек. Очень хорошо, что много open source разработок. Но все они обучены на западной культуре. Нужно формировать отечественные датасеты. Это очень важная работа

«Газпром-Медиа Холдинг» — генеральный медиапартнер ПМЭФ-2024
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4😁1🤔1
🤪 Microsoft рассказал подробности о своем ИИ-улучшителе графики в играх

Automatic Super Resolution (Auto SR) — это апскейлер графики в видеоиграх (наподобие DLSS от Nvidia, XeSS от Intel и FSR от AMD).

🔩 Ключевое отличие Auto SR от конкурентов — интеграция непосредственно в ОС. Это позволяет упростить использование инструмента: разработчикам не нужно будет лезть во внутренности игры и оптимизировать ее под работу с апскейлером, а пользователям — играться с настройками.

🎮 Microsoft обещают, что апскейлер можно будет включить в любой игре через настройки, но ряд тайтлов будет поддерживать AutoSR по умолчанию (Dark Souls III, God of War, The Witcher III и др).

🖌 Принцип работы Auto SR довольно прост — сначала ИИ ухудшает качество картинки ради повышения FPS в игре, а затем нейросети делают красиво. При этом ИИ-нагрузка идет на отдельный NPU-чип, чтобы сэкономить на использовании остальных ресурсов системы, особенно GPU.

💸 Сэкономить на устройстве, которое будет поддерживать AutoSR, не получится. Для работы улучшителя (помимо свежей Windows с поддержкой ИИ-помощника Copilot) понадобится компьютер c новеньким процессором Snapdragon X с отдельным NPU-чипом или его аналоги. Так что готовьтесь выложить несколько сотен тысяч рублей за подходящую машину.

🖼 Microsoft пока не показывает видео с AutoSR, так что придется любоваться скриншотами.

Апскейлер официально запустят 18 июня.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1
D. Lab pinned a photo
🏆 Настоящая фотография выиграла конкурс ИИ-снимков

Мы уже привыкли, что изображения, созданные нейросетью, путают с настоящими снимками, а иногда они даже выигрывают престижные фотоконкурсы.

😎 Фотограф Майлз Эстрей решил провести обратный эксперимент — отправил свой снимок на конкурс ИИ-изображений. И выиграл.

✔️ Эстрей отправил снимок фламинго на конкурс 1839 Photography Awards и победил в категории сгенерированных изображений в «народном» голосовании, а также получил третье место от жюри конкурса.

👥 Лучшие снимки выбирали сотрудники крупных изданий и фотоагентств, кураторы галерей, креативные директоры и др. Конкурс проводится с 2020 года.

🤣 Фотограф объяснил, что своим пранком хотел показать, что настоящая фотография «не утратила своей актуальности». Фотографию он выбирал, исходя из сюрреалистичности снимка — чтобы он больше был похож на работу нейросети.

Уже после победы жюри дисквалифицировало Эстрея.

🤝 Автор снимка рассказал, что после конкурса одна из членов жюри написала ему письмо, где поддержала его поступок, назвав его важным и своевременным.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3🤔2
📈 Инфографика: как изменилась стоимость обучения ИИ-моделей за 7 лет

Сайт Visual Capitalist наглядно показал, как выросла стоимость обучения ИИ-моделей с 2017 года.

Чтобы подсчитать цену, авторы взяли примерную стоимость оборудования и интенсивность его использования, а также продолжительность обучения модели.

☁️ За основу при составлении инфографики была взять стоимость аренды облачных мощностей в период обучения конкретной модели с поправкой на инфляцию.

💵 Важно помнить, что на обучении модели затраты не заканчиваются. В прошлом году аналитики подсчитали, что каждый день работы ChatGPT обходился OpenAI приблизительно в миллион долларов.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1🤔1