🤖 Нечеловеческие игры: генеративный ИИ будет создавать половину контента в гейминге через 5–10 лет
🕹 Сейчас с помощью технологии создают менее 5% контента в играх, поделились аналитики Bain.
💎 Большинство топ-менеджеров в индустрии считают, что генеративный ИИ повысит качество игр и ускорит их разработку. При этом только 20% считают, что технология снизит расходы на геймдизайн.
🧩 Большинство (60%) респондентов не боятся, что ИИ заменит живых сотрудников и не считают его угрозой кадровому рынку. Также большинство уверены, что генеративный ИИ повлияет на игры гораздо сильнее, чем, например, VR и облачные технологии.
🎮 Генеративный ИИ становится все более частой практикой в разработке игр. Известные компании — Unity, Epic Games, Roblox и Ubisoft — объявили об интеграции генеративного ИИ в комплекты для разработки.
🕹 Сейчас с помощью технологии создают менее 5% контента в играх, поделились аналитики Bain.
💎 Большинство топ-менеджеров в индустрии считают, что генеративный ИИ повысит качество игр и ускорит их разработку. При этом только 20% считают, что технология снизит расходы на геймдизайн.
🧩 Большинство (60%) респондентов не боятся, что ИИ заменит живых сотрудников и не считают его угрозой кадровому рынку. Также большинство уверены, что генеративный ИИ повлияет на игры гораздо сильнее, чем, например, VR и облачные технологии.
🎮 Генеративный ИИ становится все более частой практикой в разработке игр. Известные компании — Unity, Epic Games, Roblox и Ubisoft — объявили об интеграции генеративного ИИ в комплекты для разработки.
🇯🇵 Зачем Японии свой ChatGPT
💰 Правительство страны и крупные техкомпании тратят сотни миллионов долларов на создание ИИ-моделей на базе японского языка.
🀄️ Эксперты считают, что иностранные ИИ-модели не могут понять все тонкости японского языка. В то время как английский алфавит состоит всего из 26 букв, в письменном японском языке активно используется около 3-х тыс. иероглифов.
Языковые модели часто обучаются на общедоступных данных, большая часть которых — на английском языке. Поэтому ChatGPT иногда генерирует неточные и странные ответы на японском, используя редкие и непривычные японцам символы 🗣.
🍥 Но пока что японские языковые модели сильно отстают от ChatGPT. Чтобы оценить, насколько тонко языковые модели чувствуют японскую культуру и язык, группа исследователей запустила рейтинг Rakuda — ученые задавали чат-ботам вопросы о Японии и оценивали ответы. В итоге в рейтинге лидирует GPT-4 с 87% точностью ответов. Лучшая японская модель в рейтинге оказалась лишь на 4-м месте.
🌟 Правительство страны готовит к запуску более сильные модели. Так, проект Fugaku LLM, использующий один из самых быстрых в мире суперкомпьютеров Fugaku, запустится в следующем году. В основу модели лягут от 30 млрд параметров. На смену Fugaku LLM может прийти еще более крупная модель, которая будет генерировать научные гипотезы на базе уже опубликованных исследований. На старте она будет использовать 100 млрд параметров. Для сравнения, у LLama 2 — 70 млрд параметров, а у GPT-4, по слухам, их 500 млрд (точное количество разработчики держат в секрете)
💎 Японские частные компании тоже развивают свои LLM. Производитель суперкомпьютеров NEC начал использовать генеративный ИИ на основе японского языка в мае. По данным компании, ИИ ускоряет создание отчетов на 50%, а разработку кода — на 80%. Тем временем SoftBank инвестирует около ¥20 млрд (~$130 млн) в ИИ-модель, которую планирует запустить в следующем году.
💰 Правительство страны и крупные техкомпании тратят сотни миллионов долларов на создание ИИ-моделей на базе японского языка.
🀄️ Эксперты считают, что иностранные ИИ-модели не могут понять все тонкости японского языка. В то время как английский алфавит состоит всего из 26 букв, в письменном японском языке активно используется около 3-х тыс. иероглифов.
Языковые модели часто обучаются на общедоступных данных, большая часть которых — на английском языке. Поэтому ChatGPT иногда генерирует неточные и странные ответы на японском, используя редкие и непривычные японцам символы 🗣.
🍥 Но пока что японские языковые модели сильно отстают от ChatGPT. Чтобы оценить, насколько тонко языковые модели чувствуют японскую культуру и язык, группа исследователей запустила рейтинг Rakuda — ученые задавали чат-ботам вопросы о Японии и оценивали ответы. В итоге в рейтинге лидирует GPT-4 с 87% точностью ответов. Лучшая японская модель в рейтинге оказалась лишь на 4-м месте.
🌟 Правительство страны готовит к запуску более сильные модели. Так, проект Fugaku LLM, использующий один из самых быстрых в мире суперкомпьютеров Fugaku, запустится в следующем году. В основу модели лягут от 30 млрд параметров. На смену Fugaku LLM может прийти еще более крупная модель, которая будет генерировать научные гипотезы на базе уже опубликованных исследований. На старте она будет использовать 100 млрд параметров. Для сравнения, у LLama 2 — 70 млрд параметров, а у GPT-4, по слухам, их 500 млрд (точное количество разработчики держат в секрете)
💎 Японские частные компании тоже развивают свои LLM. Производитель суперкомпьютеров NEC начал использовать генеративный ИИ на основе японского языка в мае. По данным компании, ИИ ускоряет создание отчетов на 50%, а разработку кода — на 80%. Тем временем SoftBank инвестирует около ¥20 млрд (~$130 млн) в ИИ-модель, которую планирует запустить в следующем году.
🔥3🤔1
👊 Universal Music объявляет войну генеративному шуму
🎸 Крупнейший звукозаписывающий лейбл и французский музыкальный сервис Deezer меняют экономику музыкального рынка.
🤑 Компании считают, что музыкальные мошенники, вооруженные ИИ, отбирают хлеб добросовестных артистов. С помощью технологии мошенники часто генерируют целые треки, состоящие из расслабляющих звуков, например, мурлыканья кошки или капель дождя. Затем они загружают аудио на платформы и привлекают слушателей, называя это «музыкой для релаксации» слушателей, получая доход. В некоторых случаях мошенники загружают тысячи версий 1 трека, меняя имя исполнителя.
💰 Spotify недавно сообщил, что шумовые и эмбиент-подкасты собирают 3 млн часов прослушивания в день. При этом они монетизируются по тому же тарифу, что и музыка, записанная вживую.
👂 С развитием генеративного ИИ загружать спам-музыку становится проще. По оценкам Deezer, на фейковую музыку приходится 7% прослушиваний.
🔉 Чтобы лишить мошенников дохода и поощрять труд музыкантов, Universal Music и Deezer будут резко понижать монетизацию для музыки, созданную ИИ. Также для поддержки профессиональных артистов Deezer увеличит выплаты вдвое, если артист набрал 1 тыс. прослушиваний в месяц от более чем 500 уникальных слушателей.
При этом от новой модели монетизации могут пострадать начинающие музыканты без крупной фан-базы — на них приходится 80% всех артистов на стримингах. 😒
🎸 Крупнейший звукозаписывающий лейбл и французский музыкальный сервис Deezer меняют экономику музыкального рынка.
🤑 Компании считают, что музыкальные мошенники, вооруженные ИИ, отбирают хлеб добросовестных артистов. С помощью технологии мошенники часто генерируют целые треки, состоящие из расслабляющих звуков, например, мурлыканья кошки или капель дождя. Затем они загружают аудио на платформы и привлекают слушателей, называя это «музыкой для релаксации» слушателей, получая доход. В некоторых случаях мошенники загружают тысячи версий 1 трека, меняя имя исполнителя.
💰 Spotify недавно сообщил, что шумовые и эмбиент-подкасты собирают 3 млн часов прослушивания в день. При этом они монетизируются по тому же тарифу, что и музыка, записанная вживую.
👂 С развитием генеративного ИИ загружать спам-музыку становится проще. По оценкам Deezer, на фейковую музыку приходится 7% прослушиваний.
🔉 Чтобы лишить мошенников дохода и поощрять труд музыкантов, Universal Music и Deezer будут резко понижать монетизацию для музыки, созданную ИИ. Также для поддержки профессиональных артистов Deezer увеличит выплаты вдвое, если артист набрал 1 тыс. прослушиваний в месяц от более чем 500 уникальных слушателей.
При этом от новой модели монетизации могут пострадать начинающие музыканты без крупной фан-базы — на них приходится 80% всех артистов на стримингах. 😒
🤔5
🌟 DALL-E 3: в паре с ChatGPT, без новых мемов с селебрити
🏞 OpenAI анонсировала новую версию text-2-image нейросети. У нее есть явные преимущества перед DALL-E 2, но появились и ограничения.
🔥 Нейросеть будет интегрирована с ChatGPT, то есть дизайнерам не нужно тратить время на составление четких промптов. Достаточно кратко описать желаемый результат, а ChatGPT сам дополнит запрос деталями.
Платные и корпоративные подписчики ChatGPT смогут генерировать картинки прямо в чате с октября.
🌈 Качество изображений DALL-E 3 заметно лучше, чем у прошлой версии — нейросеть создает детализированные рисунки, хорошо выстраивает сложные композиции и ракурсы.
Также DALL-E 3 умеет четко прорисовывать кисти рук — по крайней мере, так заявляют разработчики. Еще примеры от OpenAI демонстрируют, что DALL-E 3 может генерировать изображения с четко прописанным на нем текстом, а не набором неясных символов.
🙅♀️ Одновременно с этим, у нейросети появились и ограничения. Так, DALL-E 3 не будет изображать известных людей, даже если указать имя в промпте, а также копировать стиль ныне живущих художников.
Ждем, что ответят на это разработчики Midjourney и Stable Diffusion.
🏞 OpenAI анонсировала новую версию text-2-image нейросети. У нее есть явные преимущества перед DALL-E 2, но появились и ограничения.
🔥 Нейросеть будет интегрирована с ChatGPT, то есть дизайнерам не нужно тратить время на составление четких промптов. Достаточно кратко описать желаемый результат, а ChatGPT сам дополнит запрос деталями.
Платные и корпоративные подписчики ChatGPT смогут генерировать картинки прямо в чате с октября.
🌈 Качество изображений DALL-E 3 заметно лучше, чем у прошлой версии — нейросеть создает детализированные рисунки, хорошо выстраивает сложные композиции и ракурсы.
Также DALL-E 3 умеет четко прорисовывать кисти рук — по крайней мере, так заявляют разработчики. Еще примеры от OpenAI демонстрируют, что DALL-E 3 может генерировать изображения с четко прописанным на нем текстом, а не набором неясных символов.
🙅♀️ Одновременно с этим, у нейросети появились и ограничения. Так, DALL-E 3 не будет изображать известных людей, даже если указать имя в промпте, а также копировать стиль ныне живущих художников.
Ждем, что ответят на это разработчики Midjourney и Stable Diffusion.
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
🦾 ИИ победил человека в соревновании дронов
🏆 Важное событие в мире робототехники — дрон с автоматическим ИИ-управлением обошел аппарат, управляемый живым оператором в рамках соревнований.
🛸 Беспилотники должны были пройти полосу препятствий: эксперты проверяли скорость и ловкость дронов при выполнении сложных маневров. Самоуправляемый дрон Swift соревновался с тремя опытными пилотами и обошел их в 15 из 25 испытаний. Swift работает на базе нейросети и собирает данные в реальном времени с помощью камер.
🤖 Это первый случай, когда автономный дрон одержал верх над людьми в нецифровом соревновании. До этого ИИ побеждал людей только в онлайн-играх: шахматах, шашках, StarCraft и др.
🏆 Важное событие в мире робототехники — дрон с автоматическим ИИ-управлением обошел аппарат, управляемый живым оператором в рамках соревнований.
🛸 Беспилотники должны были пройти полосу препятствий: эксперты проверяли скорость и ловкость дронов при выполнении сложных маневров. Самоуправляемый дрон Swift соревновался с тремя опытными пилотами и обошел их в 15 из 25 испытаний. Swift работает на базе нейросети и собирает данные в реальном времени с помощью камер.
🤖 Это первый случай, когда автономный дрон одержал верх над людьми в нецифровом соревновании. До этого ИИ побеждал людей только в онлайн-играх: шахматах, шашках, StarCraft и др.
🔥6🤔1
🧠 MIT представил топ современных новаторов до 35 лет
Из 35 человек 8 работают в области ИИ. И неудивительно — авторы списка назвали ИИ одной из самых революционных технологий этого года.
🥇 Звание «Новатор года» присудили 32-летней Шэрон Ли за ее исследования в области безопасности ИИ. Ли называют пионером в области детекции неизвестных данных OOD (out-of-distribution detection): функция предотвращает сбой моделей при столкновении с незнакомыми сценариями. Ли разработала один из первых алгоритмов детекции неизвестных данных в глубоких нейросетях, после чего Google создал команду для таких систем в свои продукты.
🏥 28-летний Пранав Раджпуркар разработал способ, с помощью которого ИИ может точно интерпретировать медицинские изображения без помощи человека. Его системы на уровне экспертов выявляют патологии, которые могли остаться незамеченными.
💊 Также в список вошел 29-летний Коннор Коли, разработавший набор инструментов ASKCOS для обнаружения и синтезирования новых молекул. Набор используют более 10 фармкомпаний и десятки тысяч химиков для создания новых лекарств и материалов.
🏭 Еще 1 ученый в топе MIT — Кэтрин Де Вульф. Она использует ИИ для снижения выбросов и отходов в строительстве.
🕹 34-летний Альхуссейн Фавзи — пионер в использовании игрового ИИ для ускорения фундаментальных вычислений. Фавзи подходит к поиску новых алгоритмов как к игре и использует для этого игровой ИИ DeepMind AlphaZero.
⛅️ Саша Луччиони — 33-летняя исследовательница из Hugging Face — разработала для техкомпаний способ оценки углеродного следа языковых моделей. Метод рассчитывает выбросы углекислого газа, учитывая воздействие на климат на протяжении всего жизненного цикла ИИ-модели.
🤖 Ирен Сулейман — бывший исследователь в OpenAI. В 2019 году она предложила новый подход к запуску GPT-2, предшественника ChatGPT. Сулейман рекомендовала выпускать новые модели поэтапно, чтобы было больше времени на тестирование. OpenAI, Microsoft и Meta теперь используют этот подход для ChatGPT, поисковика Bing и модели LLaMA соответственно.
👀 Старший научный сотрудник Adobe Ричард Чжан изобрел алгоритмы визуального сходства, лежащие в основе моделей для генерации изображений — Stable Diffusion и Stylegan.
Из 35 человек 8 работают в области ИИ. И неудивительно — авторы списка назвали ИИ одной из самых революционных технологий этого года.
🥇 Звание «Новатор года» присудили 32-летней Шэрон Ли за ее исследования в области безопасности ИИ. Ли называют пионером в области детекции неизвестных данных OOD (out-of-distribution detection): функция предотвращает сбой моделей при столкновении с незнакомыми сценариями. Ли разработала один из первых алгоритмов детекции неизвестных данных в глубоких нейросетях, после чего Google создал команду для таких систем в свои продукты.
🏥 28-летний Пранав Раджпуркар разработал способ, с помощью которого ИИ может точно интерпретировать медицинские изображения без помощи человека. Его системы на уровне экспертов выявляют патологии, которые могли остаться незамеченными.
💊 Также в список вошел 29-летний Коннор Коли, разработавший набор инструментов ASKCOS для обнаружения и синтезирования новых молекул. Набор используют более 10 фармкомпаний и десятки тысяч химиков для создания новых лекарств и материалов.
🏭 Еще 1 ученый в топе MIT — Кэтрин Де Вульф. Она использует ИИ для снижения выбросов и отходов в строительстве.
🕹 34-летний Альхуссейн Фавзи — пионер в использовании игрового ИИ для ускорения фундаментальных вычислений. Фавзи подходит к поиску новых алгоритмов как к игре и использует для этого игровой ИИ DeepMind AlphaZero.
⛅️ Саша Луччиони — 33-летняя исследовательница из Hugging Face — разработала для техкомпаний способ оценки углеродного следа языковых моделей. Метод рассчитывает выбросы углекислого газа, учитывая воздействие на климат на протяжении всего жизненного цикла ИИ-модели.
🤖 Ирен Сулейман — бывший исследователь в OpenAI. В 2019 году она предложила новый подход к запуску GPT-2, предшественника ChatGPT. Сулейман рекомендовала выпускать новые модели поэтапно, чтобы было больше времени на тестирование. OpenAI, Microsoft и Meta теперь используют этот подход для ChatGPT, поисковика Bing и модели LLaMA соответственно.
👀 Старший научный сотрудник Adobe Ричард Чжан изобрел алгоритмы визуального сходства, лежащие в основе моделей для генерации изображений — Stable Diffusion и Stylegan.
❤3🤔2
Google вот-вот выпустит конкурента GPT-4, ИИ написал неудачный некролог, TikTok будет помечать созданный нейросетями контент — и другие важные новости за неделю
✅ Нейросеть Яндекса научилась генерировать субтитры к русскоязычным видео и онлайн-стримам. Функция доступна на любых сайтах в Яндекс.Браузере — от соцсетей до сайтов телеканалов. Сервис почти не занимает оперативную память, поэтому работает даже на старых компьютерах.
✅ Портал новостей Microsoft MSN опубликовал некролог умершего спортсмена, написанный ИИ. Нейросеть прямо в заголовке назвала экс-баскетболиста NBA Брендона Хантера «бесполезным» и почему-то отметила его успехи в видеоиграх. По всей видимости, ИИ пока доступны не все литературные жанры.
✅ Google готовит запуск Gemini AI и уже дал тестовый доступ нескольким компаниям. Эксперты прогнозируют, что Gemini станет сильным конкурентом GPT-4. Помимо открытых данных в интернете Gemini использует данные Google, что делает ее более ориентированной на пользователя.
✅ В то же время Open AI готовит свой ответ — мультимодальную модель Gobi. В отличие от ChatGPT, Gobi изначально поддерживает текст, изображения, код и другие форматы данных. Но называть ее GPT5 пока рано — компания только готовится к полноценному обучению нейросети.
✅ Чат-бот Google Bard научился искать информацию в почте Gmail, Google Drive и других сервисах компании. Например, в интерфейсе одного чата можно найти нужное письмо от коллеги, внести правки в документ или проложить маршрут до кафе. Другим ИИ-моделям для этого обычно нужны дополнительные расширения и настройки.
✅ Компания Deci представила модели генеративного ИИ, которые в 15 раз превосходят алгоритм Meta. Модели DeciDiffusion и DeciLM 6B помогут ИИ-разработчикам сократить затраты на вычисления на 80%.
✅ Активность в ChatGPT начала расти впервые за три месяца. Скорее всего, снижение трафика было связано с летними каникулами у школьников и студентов, а значит, можно сделать вывод об основной аудитории чат-бота.
✅ TikTok начнет автоматически помечать сгенерированный ИИ контент. Вероятно, уже скоро примеру последуют и другие медиаплатформы. Любопытно, будут ли соцсети будущего наводнены ИИ-контентом или его количество будут контролировать?
✅ Чат-бот GigaChat от Сбера теперь доступен прямо в Telegram. Позже нейросеть появится и во ВК. Кажется, это гораздо удобнее, чем на отдельном сайте.
✅ Тинькофф продолжает борьбу с телефонными мошенниками. На этот раз банк создал целую галерею выдуманных персонажей для Защитника Олега — в разговоре со спамерами они всячески тянут время, чтобы мошенники позвонили как можно меньшему числу людей.
✅ Amazon улучшил помощника Alexa с помощью генеративного ИИ. Она понимает язык тела, жесты и зрительный контакт. Также Alexa научилась выражать эмоции и запоминать контекст даже, если диалог был долгим.
✅ YouTube анонсировал несколько ИИ-инструментов для авторов. Среди них — фото- и видеофоны, созданные с помощью ИИ, предложения тем для видео и поиск музыки. Теперь еще больше контента будет создаваться при помощи ИИ.
✅ Microsoft назначил дату выпуска ИИ-сервиса Copilot — он станет доступен платным клиентам с ноября. Запуск произошел меньше, чем через год после выхода ChatGPT. Генеративный ИИ становится по-настоящему массовым продуктом.
✅ Нейросеть Яндекса научилась генерировать субтитры к русскоязычным видео и онлайн-стримам. Функция доступна на любых сайтах в Яндекс.Браузере — от соцсетей до сайтов телеканалов. Сервис почти не занимает оперативную память, поэтому работает даже на старых компьютерах.
✅ Портал новостей Microsoft MSN опубликовал некролог умершего спортсмена, написанный ИИ. Нейросеть прямо в заголовке назвала экс-баскетболиста NBA Брендона Хантера «бесполезным» и почему-то отметила его успехи в видеоиграх. По всей видимости, ИИ пока доступны не все литературные жанры.
✅ Google готовит запуск Gemini AI и уже дал тестовый доступ нескольким компаниям. Эксперты прогнозируют, что Gemini станет сильным конкурентом GPT-4. Помимо открытых данных в интернете Gemini использует данные Google, что делает ее более ориентированной на пользователя.
✅ В то же время Open AI готовит свой ответ — мультимодальную модель Gobi. В отличие от ChatGPT, Gobi изначально поддерживает текст, изображения, код и другие форматы данных. Но называть ее GPT5 пока рано — компания только готовится к полноценному обучению нейросети.
✅ Чат-бот Google Bard научился искать информацию в почте Gmail, Google Drive и других сервисах компании. Например, в интерфейсе одного чата можно найти нужное письмо от коллеги, внести правки в документ или проложить маршрут до кафе. Другим ИИ-моделям для этого обычно нужны дополнительные расширения и настройки.
✅ Компания Deci представила модели генеративного ИИ, которые в 15 раз превосходят алгоритм Meta. Модели DeciDiffusion и DeciLM 6B помогут ИИ-разработчикам сократить затраты на вычисления на 80%.
✅ Активность в ChatGPT начала расти впервые за три месяца. Скорее всего, снижение трафика было связано с летними каникулами у школьников и студентов, а значит, можно сделать вывод об основной аудитории чат-бота.
✅ TikTok начнет автоматически помечать сгенерированный ИИ контент. Вероятно, уже скоро примеру последуют и другие медиаплатформы. Любопытно, будут ли соцсети будущего наводнены ИИ-контентом или его количество будут контролировать?
✅ Чат-бот GigaChat от Сбера теперь доступен прямо в Telegram. Позже нейросеть появится и во ВК. Кажется, это гораздо удобнее, чем на отдельном сайте.
✅ Тинькофф продолжает борьбу с телефонными мошенниками. На этот раз банк создал целую галерею выдуманных персонажей для Защитника Олега — в разговоре со спамерами они всячески тянут время, чтобы мошенники позвонили как можно меньшему числу людей.
✅ Amazon улучшил помощника Alexa с помощью генеративного ИИ. Она понимает язык тела, жесты и зрительный контакт. Также Alexa научилась выражать эмоции и запоминать контекст даже, если диалог был долгим.
✅ YouTube анонсировал несколько ИИ-инструментов для авторов. Среди них — фото- и видеофоны, созданные с помощью ИИ, предложения тем для видео и поиск музыки. Теперь еще больше контента будет создаваться при помощи ИИ.
✅ Microsoft назначил дату выпуска ИИ-сервиса Copilot — он станет доступен платным клиентам с ноября. Запуск произошел меньше, чем через год после выхода ChatGPT. Генеративный ИИ становится по-настоящему массовым продуктом.
❤4👍4🔥2😁1
Alibaba научил свою нейросеть аутпейнтингу видео 👩🎨
Masked 3D Diffusion Model (M3DDM) умеет дорисовывать клипы — это как Generative Fill, но только для видео ☝️.
Оценить модель пока можно только на примерах, которые опубликовали авторы.
🧪 В ближайшее время обещают запустить отдельный сайт, где потестить M3DDM можно будет уже на своих клипах.
⌨️ В ожидании можете завести себе аккаунт на китайской площадке Taobao — он понадобится для доступа к нейросети.
Masked 3D Diffusion Model (M3DDM) умеет дорисовывать клипы — это как Generative Fill, но только для видео ☝️.
Оценить модель пока можно только на примерах, которые опубликовали авторы.
🧪 В ближайшее время обещают запустить отдельный сайт, где потестить M3DDM можно будет уже на своих клипах.
⌨️ В ожидании можете завести себе аккаунт на китайской площадке Taobao — он понадобится для доступа к нейросети.
🔥3❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Дипфейки стримеров круглосуточно продают товары в китайском интернете
🕙 Дипфейки уже используют популярные в КНР e-commerce платформы и соцсети. Для «клонирования» достаточно записи 1 минуты стрима, хотя еще пару лет назад нейросети нужно было обработать как минимум полчаса видео.
❗️Да, на видео выше — ненастоящий человек.
💸 Созданием клонов занимаются отдельные сервисы (Silicon Intelligence, Xiaoice), которые берут около $1 тыс. за создание самого простого клона. Более продвинутый вариант обойдется на несколько тысяч долларов дороже — он сможет в прямом эфире реагировать на комментарии пользователей и менять поведение в зависимости от количества зрителей.
🛋 С технологией есть и проблемы: в Китае клонов для рекламы часто хотят использовать производители мебели, но дипфейки пока не научились реалистично взаимодействовать со стулом или кроватью. Не очень понятно и как происходит добавление рекламируемого товара в «синтетический» стрим — на этапе создания клона или другим способом уже вовремя эфира.
😱 Эксперты говорят, что стримерам с миллионной аудиторией вряд ли стоит беспокоиться за свою карьеру, а вот их коллегам «2-го эшелона», возможно, и стоит опасаться, что их скоро полностью заменят дипфейки.
🌎 Silicon Intelligence уже сгенерировали 400 тыс. синтетических стримеров. Цель компании — 100 млн дипфейков к 2025 году.
🕙 Дипфейки уже используют популярные в КНР e-commerce платформы и соцсети. Для «клонирования» достаточно записи 1 минуты стрима, хотя еще пару лет назад нейросети нужно было обработать как минимум полчаса видео.
❗️Да, на видео выше — ненастоящий человек.
🛋 С технологией есть и проблемы: в Китае клонов для рекламы часто хотят использовать производители мебели, но дипфейки пока не научились реалистично взаимодействовать со стулом или кроватью. Не очень понятно и как происходит добавление рекламируемого товара в «синтетический» стрим — на этапе создания клона или другим способом уже вовремя эфира.
🌎 Silicon Intelligence уже сгенерировали 400 тыс. синтетических стримеров. Цель компании — 100 млн дипфейков к 2025 году.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯4🔥2😱2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
YouTube добавит генеративные возможности в Shorts ✂️
Функция Dream Screen позволит создавать с помощью нейросети статичный или анимированный фон для коротких видео✨ .
🔐 Тестировать Dream Screen начнут до конца года, авторам постепенно начнут давать доступ к инструменту в 2024 году.
🔮 YouTube обещает, что Dream Screen — это только начало. Дальше видеохостинг собирается добавить возможность через промпт менять не только фон видео, но и весь в клип в целом (подробностей пока не говорят).
⚠️ Shorts — важная история для YouTube в контексте борьбы за аудиторию с TikTok. По данным самого сервиса, Shorts набирают по 70 млрд просмотров ежедневно.
🤨 Формат стал таким популярным, что некоторые сотрудники видеохостинга всерьез опасаются, что Shorts отбирают аудиторию у основного продукта.
Функция Dream Screen позволит создавать с помощью нейросети статичный или анимированный фон для коротких видео
🔐 Тестировать Dream Screen начнут до конца года, авторам постепенно начнут давать доступ к инструменту в 2024 году.
🔮 YouTube обещает, что Dream Screen — это только начало. Дальше видеохостинг собирается добавить возможность через промпт менять не только фон видео, но и весь в клип в целом (подробностей пока не говорят).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT превратился в мультимодального помощника
🗣 Чат-бот научился распознавать изображения и голосовые команды, а также отвечать на запросы голосом. Новые возможности появятся в чат-боте с обновлением, которое станет в течение следующих 2-х недель доступно платным и корпоративным подписчикам сервиса.
🖼 В ChatGPT можно будет загрузить изображение, скажем, достопримечательности, чтобы затем голосом расспросить чат-бот об истории места. Чат-бот при этом также сможет ответить пользователю голосом.
🚲 Вариантов использования нового функционала — множество: в анонсе OpenAI показывают, как с помощью чат-бота можно настроить под себя велосипед или уложить детей спать.
OpenAI анонсировали мультимодальные возможности еще весной, когда вышла GPT-4, но добавлять их стали только теперь.
🔮 Исследователи считают, что мультимодальные модели — ключевой этап на пути создания сильного искусственного интеллекта (AGI). AGI предполагает, что ИИ-модели могут решать любые задачи, которые может решить человек, даже если изначально алгоритм под них не заточен.
Собственно, OpenAI и сами намекали, что в конечном итоге хотели бы создать AGI, а в индустрии весной упорно ходили слухи, что это случится уже с выходом GPT-5.
🗣 Чат-бот научился распознавать изображения и голосовые команды, а также отвечать на запросы голосом. Новые возможности появятся в чат-боте с обновлением, которое станет в течение следующих 2-х недель доступно платным и корпоративным подписчикам сервиса.
🖼 В ChatGPT можно будет загрузить изображение, скажем, достопримечательности, чтобы затем голосом расспросить чат-бот об истории места. Чат-бот при этом также сможет ответить пользователю голосом.
🚲 Вариантов использования нового функционала — множество: в анонсе OpenAI показывают, как с помощью чат-бота можно настроить под себя велосипед или уложить детей спать.
OpenAI анонсировали мультимодальные возможности еще весной, когда вышла GPT-4, но добавлять их стали только теперь.
🔮 Исследователи считают, что мультимодальные модели — ключевой этап на пути создания сильного искусственного интеллекта (AGI). AGI предполагает, что ИИ-модели могут решать любые задачи, которые может решить человек, даже если изначально алгоритм под них не заточен.
Собственно, OpenAI и сами намекали, что в конечном итоге хотели бы создать AGI, а в индустрии весной упорно ходили слухи, что это случится уже с выходом GPT-5.
🔥6❤1👍1
🇺🇸 Скажем, из утверждения «Джордж Вашингтон был 1-м президентом США» логически можно сделать вывод, что 1-м президентом США был Джордж Вашингтон. Но для языковых моделей все не так очевидно.
Такое когнитивное искажение получило название «обратного проклятия» (Reversal Curse).
🧠 Такие проблемы с простейшими логическими выводами у LLM говорят о том, что на ИИ все еще нельзя рассчитывать при анализе или поиске информации.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9🤯1😢1
Нейросеть Pika Labs научилась зашифровывать изображение в генерации
🤫 С помощью функции Encrypt в генерацию можно добавить скрытое послание — в виде текста или картинки.
❓ Зачем? Ну, во-первых, это красиво. Во-вторых, у функционала подобного Encrypt, кажется, есть шансы стать популярным для различных маркетинговых кампаний.
🪩 Инструкцию по шифрованию можно найти здесь. Саму нейросеть можно попробовать на Discord.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2🔥1