Google вот-вот выпустит конкурента GPT-4, ИИ написал неудачный некролог, TikTok будет помечать созданный нейросетями контент — и другие важные новости за неделю
✅ Нейросеть Яндекса научилась генерировать субтитры к русскоязычным видео и онлайн-стримам. Функция доступна на любых сайтах в Яндекс.Браузере — от соцсетей до сайтов телеканалов. Сервис почти не занимает оперативную память, поэтому работает даже на старых компьютерах.
✅ Портал новостей Microsoft MSN опубликовал некролог умершего спортсмена, написанный ИИ. Нейросеть прямо в заголовке назвала экс-баскетболиста NBA Брендона Хантера «бесполезным» и почему-то отметила его успехи в видеоиграх. По всей видимости, ИИ пока доступны не все литературные жанры.
✅ Google готовит запуск Gemini AI и уже дал тестовый доступ нескольким компаниям. Эксперты прогнозируют, что Gemini станет сильным конкурентом GPT-4. Помимо открытых данных в интернете Gemini использует данные Google, что делает ее более ориентированной на пользователя.
✅ В то же время Open AI готовит свой ответ — мультимодальную модель Gobi. В отличие от ChatGPT, Gobi изначально поддерживает текст, изображения, код и другие форматы данных. Но называть ее GPT5 пока рано — компания только готовится к полноценному обучению нейросети.
✅ Чат-бот Google Bard научился искать информацию в почте Gmail, Google Drive и других сервисах компании. Например, в интерфейсе одного чата можно найти нужное письмо от коллеги, внести правки в документ или проложить маршрут до кафе. Другим ИИ-моделям для этого обычно нужны дополнительные расширения и настройки.
✅ Компания Deci представила модели генеративного ИИ, которые в 15 раз превосходят алгоритм Meta. Модели DeciDiffusion и DeciLM 6B помогут ИИ-разработчикам сократить затраты на вычисления на 80%.
✅ Активность в ChatGPT начала расти впервые за три месяца. Скорее всего, снижение трафика было связано с летними каникулами у школьников и студентов, а значит, можно сделать вывод об основной аудитории чат-бота.
✅ TikTok начнет автоматически помечать сгенерированный ИИ контент. Вероятно, уже скоро примеру последуют и другие медиаплатформы. Любопытно, будут ли соцсети будущего наводнены ИИ-контентом или его количество будут контролировать?
✅ Чат-бот GigaChat от Сбера теперь доступен прямо в Telegram. Позже нейросеть появится и во ВК. Кажется, это гораздо удобнее, чем на отдельном сайте.
✅ Тинькофф продолжает борьбу с телефонными мошенниками. На этот раз банк создал целую галерею выдуманных персонажей для Защитника Олега — в разговоре со спамерами они всячески тянут время, чтобы мошенники позвонили как можно меньшему числу людей.
✅ Amazon улучшил помощника Alexa с помощью генеративного ИИ. Она понимает язык тела, жесты и зрительный контакт. Также Alexa научилась выражать эмоции и запоминать контекст даже, если диалог был долгим.
✅ YouTube анонсировал несколько ИИ-инструментов для авторов. Среди них — фото- и видеофоны, созданные с помощью ИИ, предложения тем для видео и поиск музыки. Теперь еще больше контента будет создаваться при помощи ИИ.
✅ Microsoft назначил дату выпуска ИИ-сервиса Copilot — он станет доступен платным клиентам с ноября. Запуск произошел меньше, чем через год после выхода ChatGPT. Генеративный ИИ становится по-настоящему массовым продуктом.
✅ Нейросеть Яндекса научилась генерировать субтитры к русскоязычным видео и онлайн-стримам. Функция доступна на любых сайтах в Яндекс.Браузере — от соцсетей до сайтов телеканалов. Сервис почти не занимает оперативную память, поэтому работает даже на старых компьютерах.
✅ Портал новостей Microsoft MSN опубликовал некролог умершего спортсмена, написанный ИИ. Нейросеть прямо в заголовке назвала экс-баскетболиста NBA Брендона Хантера «бесполезным» и почему-то отметила его успехи в видеоиграх. По всей видимости, ИИ пока доступны не все литературные жанры.
✅ Google готовит запуск Gemini AI и уже дал тестовый доступ нескольким компаниям. Эксперты прогнозируют, что Gemini станет сильным конкурентом GPT-4. Помимо открытых данных в интернете Gemini использует данные Google, что делает ее более ориентированной на пользователя.
✅ В то же время Open AI готовит свой ответ — мультимодальную модель Gobi. В отличие от ChatGPT, Gobi изначально поддерживает текст, изображения, код и другие форматы данных. Но называть ее GPT5 пока рано — компания только готовится к полноценному обучению нейросети.
✅ Чат-бот Google Bard научился искать информацию в почте Gmail, Google Drive и других сервисах компании. Например, в интерфейсе одного чата можно найти нужное письмо от коллеги, внести правки в документ или проложить маршрут до кафе. Другим ИИ-моделям для этого обычно нужны дополнительные расширения и настройки.
✅ Компания Deci представила модели генеративного ИИ, которые в 15 раз превосходят алгоритм Meta. Модели DeciDiffusion и DeciLM 6B помогут ИИ-разработчикам сократить затраты на вычисления на 80%.
✅ Активность в ChatGPT начала расти впервые за три месяца. Скорее всего, снижение трафика было связано с летними каникулами у школьников и студентов, а значит, можно сделать вывод об основной аудитории чат-бота.
✅ TikTok начнет автоматически помечать сгенерированный ИИ контент. Вероятно, уже скоро примеру последуют и другие медиаплатформы. Любопытно, будут ли соцсети будущего наводнены ИИ-контентом или его количество будут контролировать?
✅ Чат-бот GigaChat от Сбера теперь доступен прямо в Telegram. Позже нейросеть появится и во ВК. Кажется, это гораздо удобнее, чем на отдельном сайте.
✅ Тинькофф продолжает борьбу с телефонными мошенниками. На этот раз банк создал целую галерею выдуманных персонажей для Защитника Олега — в разговоре со спамерами они всячески тянут время, чтобы мошенники позвонили как можно меньшему числу людей.
✅ Amazon улучшил помощника Alexa с помощью генеративного ИИ. Она понимает язык тела, жесты и зрительный контакт. Также Alexa научилась выражать эмоции и запоминать контекст даже, если диалог был долгим.
✅ YouTube анонсировал несколько ИИ-инструментов для авторов. Среди них — фото- и видеофоны, созданные с помощью ИИ, предложения тем для видео и поиск музыки. Теперь еще больше контента будет создаваться при помощи ИИ.
✅ Microsoft назначил дату выпуска ИИ-сервиса Copilot — он станет доступен платным клиентам с ноября. Запуск произошел меньше, чем через год после выхода ChatGPT. Генеративный ИИ становится по-настоящему массовым продуктом.
❤4👍4🔥2😁1
Alibaba научил свою нейросеть аутпейнтингу видео 👩🎨
Masked 3D Diffusion Model (M3DDM) умеет дорисовывать клипы — это как Generative Fill, но только для видео ☝️.
Оценить модель пока можно только на примерах, которые опубликовали авторы.
🧪 В ближайшее время обещают запустить отдельный сайт, где потестить M3DDM можно будет уже на своих клипах.
⌨️ В ожидании можете завести себе аккаунт на китайской площадке Taobao — он понадобится для доступа к нейросети.
Masked 3D Diffusion Model (M3DDM) умеет дорисовывать клипы — это как Generative Fill, но только для видео ☝️.
Оценить модель пока можно только на примерах, которые опубликовали авторы.
🧪 В ближайшее время обещают запустить отдельный сайт, где потестить M3DDM можно будет уже на своих клипах.
⌨️ В ожидании можете завести себе аккаунт на китайской площадке Taobao — он понадобится для доступа к нейросети.
🔥3❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Дипфейки стримеров круглосуточно продают товары в китайском интернете
🕙 Дипфейки уже используют популярные в КНР e-commerce платформы и соцсети. Для «клонирования» достаточно записи 1 минуты стрима, хотя еще пару лет назад нейросети нужно было обработать как минимум полчаса видео.
❗️Да, на видео выше — ненастоящий человек.
💸 Созданием клонов занимаются отдельные сервисы (Silicon Intelligence, Xiaoice), которые берут около $1 тыс. за создание самого простого клона. Более продвинутый вариант обойдется на несколько тысяч долларов дороже — он сможет в прямом эфире реагировать на комментарии пользователей и менять поведение в зависимости от количества зрителей.
🛋 С технологией есть и проблемы: в Китае клонов для рекламы часто хотят использовать производители мебели, но дипфейки пока не научились реалистично взаимодействовать со стулом или кроватью. Не очень понятно и как происходит добавление рекламируемого товара в «синтетический» стрим — на этапе создания клона или другим способом уже вовремя эфира.
😱 Эксперты говорят, что стримерам с миллионной аудиторией вряд ли стоит беспокоиться за свою карьеру, а вот их коллегам «2-го эшелона», возможно, и стоит опасаться, что их скоро полностью заменят дипфейки.
🌎 Silicon Intelligence уже сгенерировали 400 тыс. синтетических стримеров. Цель компании — 100 млн дипфейков к 2025 году.
🕙 Дипфейки уже используют популярные в КНР e-commerce платформы и соцсети. Для «клонирования» достаточно записи 1 минуты стрима, хотя еще пару лет назад нейросети нужно было обработать как минимум полчаса видео.
❗️Да, на видео выше — ненастоящий человек.
🛋 С технологией есть и проблемы: в Китае клонов для рекламы часто хотят использовать производители мебели, но дипфейки пока не научились реалистично взаимодействовать со стулом или кроватью. Не очень понятно и как происходит добавление рекламируемого товара в «синтетический» стрим — на этапе создания клона или другим способом уже вовремя эфира.
🌎 Silicon Intelligence уже сгенерировали 400 тыс. синтетических стримеров. Цель компании — 100 млн дипфейков к 2025 году.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯4🔥2😱2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
YouTube добавит генеративные возможности в Shorts ✂️
Функция Dream Screen позволит создавать с помощью нейросети статичный или анимированный фон для коротких видео✨ .
🔐 Тестировать Dream Screen начнут до конца года, авторам постепенно начнут давать доступ к инструменту в 2024 году.
🔮 YouTube обещает, что Dream Screen — это только начало. Дальше видеохостинг собирается добавить возможность через промпт менять не только фон видео, но и весь в клип в целом (подробностей пока не говорят).
⚠️ Shorts — важная история для YouTube в контексте борьбы за аудиторию с TikTok. По данным самого сервиса, Shorts набирают по 70 млрд просмотров ежедневно.
🤨 Формат стал таким популярным, что некоторые сотрудники видеохостинга всерьез опасаются, что Shorts отбирают аудиторию у основного продукта.
Функция Dream Screen позволит создавать с помощью нейросети статичный или анимированный фон для коротких видео
🔐 Тестировать Dream Screen начнут до конца года, авторам постепенно начнут давать доступ к инструменту в 2024 году.
🔮 YouTube обещает, что Dream Screen — это только начало. Дальше видеохостинг собирается добавить возможность через промпт менять не только фон видео, но и весь в клип в целом (подробностей пока не говорят).
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT превратился в мультимодального помощника
🗣 Чат-бот научился распознавать изображения и голосовые команды, а также отвечать на запросы голосом. Новые возможности появятся в чат-боте с обновлением, которое станет в течение следующих 2-х недель доступно платным и корпоративным подписчикам сервиса.
🖼 В ChatGPT можно будет загрузить изображение, скажем, достопримечательности, чтобы затем голосом расспросить чат-бот об истории места. Чат-бот при этом также сможет ответить пользователю голосом.
🚲 Вариантов использования нового функционала — множество: в анонсе OpenAI показывают, как с помощью чат-бота можно настроить под себя велосипед или уложить детей спать.
OpenAI анонсировали мультимодальные возможности еще весной, когда вышла GPT-4, но добавлять их стали только теперь.
🔮 Исследователи считают, что мультимодальные модели — ключевой этап на пути создания сильного искусственного интеллекта (AGI). AGI предполагает, что ИИ-модели могут решать любые задачи, которые может решить человек, даже если изначально алгоритм под них не заточен.
Собственно, OpenAI и сами намекали, что в конечном итоге хотели бы создать AGI, а в индустрии весной упорно ходили слухи, что это случится уже с выходом GPT-5.
🗣 Чат-бот научился распознавать изображения и голосовые команды, а также отвечать на запросы голосом. Новые возможности появятся в чат-боте с обновлением, которое станет в течение следующих 2-х недель доступно платным и корпоративным подписчикам сервиса.
🖼 В ChatGPT можно будет загрузить изображение, скажем, достопримечательности, чтобы затем голосом расспросить чат-бот об истории места. Чат-бот при этом также сможет ответить пользователю голосом.
🚲 Вариантов использования нового функционала — множество: в анонсе OpenAI показывают, как с помощью чат-бота можно настроить под себя велосипед или уложить детей спать.
OpenAI анонсировали мультимодальные возможности еще весной, когда вышла GPT-4, но добавлять их стали только теперь.
🔮 Исследователи считают, что мультимодальные модели — ключевой этап на пути создания сильного искусственного интеллекта (AGI). AGI предполагает, что ИИ-модели могут решать любые задачи, которые может решить человек, даже если изначально алгоритм под них не заточен.
Собственно, OpenAI и сами намекали, что в конечном итоге хотели бы создать AGI, а в индустрии весной упорно ходили слухи, что это случится уже с выходом GPT-5.
🔥6❤1👍1
🇺🇸 Скажем, из утверждения «Джордж Вашингтон был 1-м президентом США» логически можно сделать вывод, что 1-м президентом США был Джордж Вашингтон. Но для языковых моделей все не так очевидно.
Такое когнитивное искажение получило название «обратного проклятия» (Reversal Curse).
🧠 Такие проблемы с простейшими логическими выводами у LLM говорят о том, что на ИИ все еще нельзя рассчитывать при анализе или поиске информации.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9🤯1😢1
Нейросеть Pika Labs научилась зашифровывать изображение в генерации
🤫 С помощью функции Encrypt в генерацию можно добавить скрытое послание — в виде текста или картинки.
❓ Зачем? Ну, во-первых, это красиво. Во-вторых, у функционала подобного Encrypt, кажется, есть шансы стать популярным для различных маркетинговых кампаний.
🪩 Инструкцию по шифрованию можно найти здесь. Саму нейросеть можно попробовать на Discord.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2🔥1
📱 Джони Айв и Сэм Альтман работают над айфоном эпохи ИИ
💬 Бывший дизайнер Apple, разработавший внешний вид практически всех ключевых устройств компании, и CEO OpenAI обсуждают создание нового ИИ-устройства.
Что это может быть за устройство, какая компания будет его разрабатывать, будет ли вообще какой-то результат от переговоров Альтмана и Айва (которые уже давно дружат) — пока непонятно❓ .
🏦 Известно, что в обсуждениях также принимает участие глава японского инвестиционного холдинга SoftBank Масаёси Сон.
Financial Times пишет, что Айв и Альтман хотят получить от SoftBank на разработку «ИИ-айфона» $1 млрд. По данным газеты, в проекте участвует дизайн-компания LoveForm, которую Айв создал после ухода из Apple в 2019 году. Источники издания рассказывают, что Айв и Альтман активно брейнстормят на тему, как может выглядеть девайс для более интуитивного взаимодействия с ИИ🫡 .
📆 Официально анонсировать новый проект могут через несколько месяцев.
(На картинке выше — вариант, как может выглядеть девайс от OpenAI и Айва, от нейросети Midjourney).
Что это может быть за устройство, какая компания будет его разрабатывать, будет ли вообще какой-то результат от переговоров Альтмана и Айва (которые уже давно дружат) — пока непонятно
🏦 Известно, что в обсуждениях также принимает участие глава японского инвестиционного холдинга SoftBank Масаёси Сон.
Financial Times пишет, что Айв и Альтман хотят получить от SoftBank на разработку «ИИ-айфона» $1 млрд. По данным газеты, в проекте участвует дизайн-компания LoveForm, которую Айв создал после ухода из Apple в 2019 году. Источники издания рассказывают, что Айв и Альтман активно брейнстормят на тему, как может выглядеть девайс для более интуитивного взаимодействия с ИИ
📆 Официально анонсировать новый проект могут через несколько месяцев.
(На картинке выше — вариант, как может выглядеть девайс от OpenAI и Айва, от нейросети Midjourney).
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3🔥2
У ЦРУ будет свой ChatGPT, голливудские сценаристы победили ИИ, фотоагентство Getty запустило свою нейросеть — и другие важные новости за неделю
✅ Спустя почти полгода забастовки голливудские сценаристы добились от студий своего. В частности, студии пообещали, что не будут использовать ИИ для написания и доработки сценариев, не будут заставлять сценариста пользоваться помощью ИИ, не будут использовать работу сценариста для обучения ИИ-моделей;
✅ Свой чат-бот разрабатывает даже ЦРУ. Основная задача сервиса — дать возможность сотрудникам ведомства быстро найти нужную информацию в огромном архиве информации, накопленном за десятилетия существования ЦРУ. Доступ к чат-боту также получат коллеги из ФБР, АНБ и еще почти 2-х десятков ведомств;
✅ Бывшая CEO Tinder Ренате Ниборг рассказала о новом проекте — приложении Meeno. Сервис не будет очередным дейтинг аппом, а станет для пользователя ИИ-ментором, который будет учить, как построить крепкие отношения;
✅ Spotify с помощью ИИ будет дублировать топовые подкасты на другие языки. Ведущие будут говорить с узнаваемыми интонациями, но на испанском, немецком и французском языках. Перевод обеспечит инструмент Whisper от OpenAI. Подкасты, дублированные с помощью ИИ, смогут послушать платные и бесплатные подписчики стриминга;
✅ Meta* провела ежегодную конференцию Meta Connect, на которой раскрыла подробности о хедсете Quest 3; показала ИИ-модель Emu, с помощью которой можно создавать стикеры и сразу делиться ими в мессенджере; анонсировала умные очки, созданные вместе с Ray-Ban, по цене от $299; представила ассистента Meta AI;
✅ Власти США могут обязать облачных провайдеров раскрывать данные о клиентах, которые арендуют мощности больше установленного лимита (лимит еще предстоит определить). Предлагаемая мера направлена против возможных угроз, связанных с использованием американской инфраструктуры для создания ИИ-моделей иностранными государствами и компаниями;
✅ Фотоагентство Getty запустило свою нейросеть для генерации изображений. Нейросеть Generative AI (да, вот так незамысловато) обучали на фотоархиве агентства. Getty обещает платить фотографам, работы которых использует нейросеть, чтобы показать пример Stable Diffusion, на которую агентство в феврале подало в суд;
✅ Google дал возможность сайтам отказаться от индексации своего контента ИИ-моделями компании — нынешними и будущими. Ирония ситуации в том, что Google уже обучил того же Bard на чужом контенте, а теперь постфактум решил попросить на это разрешение;
✅ Microsoft прикрутил поддержку Dall-E к виртуальной клавиатуре SwiftKey. Теперь, используя клавиатуру на Android-устройствах, можно использовать виртуальную клавишу Bing, которая позволит быстро писать промпты и генерировать изображения. Изображениями потом можно сразу поделиться в популярных мессенджерах;
✅ OpenAI ведет переговоры с инвесторами о продаже акций по цене, которая поднимет оценочную стоимость компании до $90 млрд — это почти в 3 раза больше, чем в начале года. При такой оценке OpenAI станет одним из самых дорогих стартапов в мире.
*Организация, запрещенная на территории РФ
✅ Спустя почти полгода забастовки голливудские сценаристы добились от студий своего. В частности, студии пообещали, что не будут использовать ИИ для написания и доработки сценариев, не будут заставлять сценариста пользоваться помощью ИИ, не будут использовать работу сценариста для обучения ИИ-моделей;
✅ Свой чат-бот разрабатывает даже ЦРУ. Основная задача сервиса — дать возможность сотрудникам ведомства быстро найти нужную информацию в огромном архиве информации, накопленном за десятилетия существования ЦРУ. Доступ к чат-боту также получат коллеги из ФБР, АНБ и еще почти 2-х десятков ведомств;
✅ Бывшая CEO Tinder Ренате Ниборг рассказала о новом проекте — приложении Meeno. Сервис не будет очередным дейтинг аппом, а станет для пользователя ИИ-ментором, который будет учить, как построить крепкие отношения;
✅ Spotify с помощью ИИ будет дублировать топовые подкасты на другие языки. Ведущие будут говорить с узнаваемыми интонациями, но на испанском, немецком и французском языках. Перевод обеспечит инструмент Whisper от OpenAI. Подкасты, дублированные с помощью ИИ, смогут послушать платные и бесплатные подписчики стриминга;
✅ Meta* провела ежегодную конференцию Meta Connect, на которой раскрыла подробности о хедсете Quest 3; показала ИИ-модель Emu, с помощью которой можно создавать стикеры и сразу делиться ими в мессенджере; анонсировала умные очки, созданные вместе с Ray-Ban, по цене от $299; представила ассистента Meta AI;
✅ Власти США могут обязать облачных провайдеров раскрывать данные о клиентах, которые арендуют мощности больше установленного лимита (лимит еще предстоит определить). Предлагаемая мера направлена против возможных угроз, связанных с использованием американской инфраструктуры для создания ИИ-моделей иностранными государствами и компаниями;
✅ Фотоагентство Getty запустило свою нейросеть для генерации изображений. Нейросеть Generative AI (да, вот так незамысловато) обучали на фотоархиве агентства. Getty обещает платить фотографам, работы которых использует нейросеть, чтобы показать пример Stable Diffusion, на которую агентство в феврале подало в суд;
✅ Google дал возможность сайтам отказаться от индексации своего контента ИИ-моделями компании — нынешними и будущими. Ирония ситуации в том, что Google уже обучил того же Bard на чужом контенте, а теперь постфактум решил попросить на это разрешение;
✅ Microsoft прикрутил поддержку Dall-E к виртуальной клавиатуре SwiftKey. Теперь, используя клавиатуру на Android-устройствах, можно использовать виртуальную клавишу Bing, которая позволит быстро писать промпты и генерировать изображения. Изображениями потом можно сразу поделиться в популярных мессенджерах;
✅ OpenAI ведет переговоры с инвесторами о продаже акций по цене, которая поднимет оценочную стоимость компании до $90 млрд — это почти в 3 раза больше, чем в начале года. При такой оценке OpenAI станет одним из самых дорогих стартапов в мире.
*Организация, запрещенная на территории РФ
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Глава Meta* дал интервью популярному подкастеру Лексу Фридману (3,3 млн подписчиков на YouTube).
🛣 Фридман и Цукерберг находились за несколько сотен километров друг от друга и для общения использовали хедсеты Quest Pro.
📷 Подкастер и его гость участвовали в интервью в виде фотореалистичных аватаров (Codec Avatars), созданных RealityLabs — подразделением Meta, отвечающим в компании за VR и AR.
🕦 Фридман говорит, что ему пришлось съездить в офис Meta в Питтсбруге, где его отсканировали, чтобы потом создать аватар. Подкастер отмечает, что весь процесс занял довольно продолжительное время. Цукерберг успокаивает, что в планах компании упростить весь процесс до такой степени, когда аватар можно будет создать с помощью смартфона.
Полностью часовой подкаст можно посмотреть здесь.
*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
У самого популярного приложения прошлого года вышел апдейт, который никто не заметил 💤
Помните, было такое приложение Lensa AI? В конце прошлого года в нем появились Magic Avatars — возможность генерировать аватары себя любимого в самых разных стилях с помощью Stable Diffusion 🥹.
Несколько месяцев весь интернет сходил с ума по Magic Avatars. За один только ноябрь прошлого года количество скачиваний Lensa выросло на 631% — до 1,6 млн. Уважаемые СМИ написали не один текст о потенциальной опасности приложения для персональной информации пользователя и негативном влиянии на самооценку😮 .
🫤 Прошел год, Lensa переформатировались в фоторедактор и несколько дней назад выпустили Magic Avatars 2.0 — но никто не обратил на это внимание. У ролика с анонсом обновления чуть больше тысячи просмотров на YouTube.
Как говорится, sic transit gloria mundi.
Помните, было такое приложение Lensa AI? В конце прошлого года в нем появились Magic Avatars — возможность генерировать аватары себя любимого в самых разных стилях с помощью Stable Diffusion 🥹.
Несколько месяцев весь интернет сходил с ума по Magic Avatars. За один только ноябрь прошлого года количество скачиваний Lensa выросло на 631% — до 1,6 млн. Уважаемые СМИ написали не один текст о потенциальной опасности приложения для персональной информации пользователя и негативном влиянии на самооценку
Как говорится, sic transit gloria mundi.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
Новый mocap-метод для создания самых реалистичных фейспалмов 🤦
Исследователи из Германии и Франции показали новый способ создания Motion Capture — Decaf. С помощью нейросети (автокодера) Decaf реалистично передает взаимодействие рук с лицом 👨🦱🥊.
❗️ Вам может показаться это мелочью, но авторы говорят, что Decaf дает принципиально новый по качеству результат, который до этого никому получить не удавалось.
📸 Для этого даже не требуется сложносочиненных конструкций с множеством камер — достаточно 1 видео, записанного на 1 камеру.
👥 Над Decaf трудились люди из Института Макса Планка (одного из ведущих научно-исследовательских институтов в мире), а также французской компании Valeo.ai, которая разрабатывает системы навигации для беспилотных автомобилей на основе ИИ.
Исследователи из Германии и Франции показали новый способ создания Motion Capture — Decaf. С помощью нейросети (автокодера) Decaf реалистично передает взаимодействие рук с лицом 👨🦱🥊.
❗️ Вам может показаться это мелочью, но авторы говорят, что Decaf дает принципиально новый по качеству результат, который до этого никому получить не удавалось.
📸 Для этого даже не требуется сложносочиненных конструкций с множеством камер — достаточно 1 видео, записанного на 1 камеру.
👥 Над Decaf трудились люди из Института Макса Планка (одного из ведущих научно-исследовательских институтов в мире), а также французской компании Valeo.ai, которая разрабатывает системы навигации для беспилотных автомобилей на основе ИИ.
🔥3👍1
Пользователи забывают про приложения с генеративным ИИ в 1-й месяц 🤔
К такому выводу в новом исследовании пришли специалисты Sequoia Capital.
📈 Авторы пишут, что приложению, построенному с генеративным ИИ, очень легко набрать большую пользовательскую базу из-за хайпа вокруг технологии. Например, ChatGPT понадобилось около 2-х месяцев, чтобы достичь 100 млн юзеров (у TikTok на это ушло 9 месяцев, у Instagram* — 30 месяцев).
Проблемы начинаются дальше — уже в 1-й месяц частота использования генеративных приложений серьезно падает, а в некоторых случаях пользователи просто удаляют такие программы с устройства🗑 .
🎞 Например, у YouTube так называемый уровень удержания (Retention Rate — RR) составляет 85%, а у ChatGPT — только 56%. Для других ИИ-приложений уровень RR хуже: 45% — у Runway, 39% — у Lensa.
В случае с активными пользователями (DAU/MAU) все еще хуже. Если, например, у WhatsApp* доля активных пользователей составляет 85%, то у ChatGPT — всего 14%🫡 .
🌞 Это, конечно, не значит, что генеративный ИИ никому не нужен, и в целом Sequoia смотрит в ИИ-будущее оптимистично. Но пока компаниям не удается создать приложение с искусственным интеллектом, к которому большинство пользователей возвращались хотя бы каждый день и пользовались бы продолжительное время.
*WhatsApp и Instagram входят в Meta — организацию, запрещенную на территории РФ
К такому выводу в новом исследовании пришли специалисты Sequoia Capital.
Проблемы начинаются дальше — уже в 1-й месяц частота использования генеративных приложений серьезно падает, а в некоторых случаях пользователи просто удаляют такие программы с устройства
В случае с активными пользователями (DAU/MAU) все еще хуже. Если, например, у WhatsApp* доля активных пользователей составляет 85%, то у ChatGPT — всего 14%
🌞 Это, конечно, не значит, что генеративный ИИ никому не нужен, и в целом Sequoia смотрит в ИИ-будущее оптимистично. Но пока компаниям не удается создать приложение с искусственным интеллектом, к которому большинство пользователей возвращались хотя бы каждый день и пользовались бы продолжительное время.
*WhatsApp и Instagram входят в Meta — организацию, запрещенную на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1🤔1
Напомнить все: из сервиса, который записывает все действия человека, сделали гаджет
✍️ Весной мы уже рассказывали про Rewind — сервис для Mac и Windows, который записывает буквально все, что делает пользователь устройства, а потом в формате чат-бота может ему об этом напомнить.
🤔 Разработчики решили, что сервиса мало и нужно сделать Rewind-гаджет, который будет записывать все, что в течение дня говорит человек. Цель та же — если вдруг забыли, о чем говорили с коллегами по работе, друзьями, родственниками и т. д., то Pendant поможет вспомнить.
Чтобы обеспечить безопасность информации, все записанное аудио хранится локально на устройстве. Создатели устройства говорят, что речь тех, кто случайно попал на запись, но при этом не дал вербального согласия, записана не будет🙅 .
🤔 Хотя, конечно, всех вопросов к безопасности данных объяснения разработчиков не снимают.
🤫 Rewind пока не раскрывают технические характеристики устройства, но можно предположить, что девайс, как и сервис, будет работать на GPT-4.
💸 Pendant можно предзаказать на сайте за $59. В стартапе рассказали, что за пару дней после анонса предзаказов оставили более 3-х тысяч.
✍️ Весной мы уже рассказывали про Rewind — сервис для Mac и Windows, который записывает буквально все, что делает пользователь устройства, а потом в формате чат-бота может ему об этом напомнить.
Чтобы обеспечить безопасность информации, все записанное аудио хранится локально на устройстве. Создатели устройства говорят, что речь тех, кто случайно попал на запись, но при этом не дал вербального согласия, записана не будет
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤1
Чтобы с пользой провести выходные достаточно прочитать новый выпуск нашего дайджеста
💡 В нем как всегда самые важные новости и тренды за месяц с аналитикой, после которой у вас не останется никаких вопросов.
В этот раз мы разобрались:
🎵 Зачем Spotify хочет спрятать тексты песен под пейволл
⚠️ Как Shorts стали угрозой основному бизнесу YouTube
🤖 Почему зумеры выбирают ИИ, а бумеры и миллениалы его недолюбливают
😮 И еще почти два десятка тем!
Приятного чтения!😍
💡 В нем как всегда самые важные новости и тренды за месяц с аналитикой, после которой у вас не останется никаких вопросов.
В этот раз мы разобрались:
🎵 Зачем Spotify хочет спрятать тексты песен под пейволл
🤖 Почему зумеры выбирают ИИ, а бумеры и миллениалы его недолюбливают
Приятного чтения!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🤯1