This media is not supported in your browser
VIEW IN TELEGRAM
🗣 ИИ научили синтезировать реалистичную речь с помощью YouTube и подкастов
В большинстве случаев ИИ, который генерирует речь, обучают на датасетах, где записана речь профессиональных актеров. Из-за этого человеческому уху синтетический голос кажется безэмоциональным и монотонным 😑.
Чтобы исправить ситуацию, исследователи из университета Карнеги-Меллона в США решили тренировать искусственный интеллект на видео с YouTube и подкастах. Прослушав почти 900 часов такого контента, модель научилась реалистично делать паузу, использовать междометия и слова-паразиты 🤬. Работу ИИ можно оценить на записи выше.
👍 👎 Людей, которых просили оценить реалистичность голоса, поставили ему 3,89 по пятибалльной шкале. Это выше, чем в среднем получают подобные ИИ-модели (настоящий человеческий голос получил оценку 4,01).
В большинстве случаев ИИ, который генерирует речь, обучают на датасетах, где записана речь профессиональных актеров. Из-за этого человеческому уху синтетический голос кажется безэмоциональным и монотонным 😑.
Чтобы исправить ситуацию, исследователи из университета Карнеги-Меллона в США решили тренировать искусственный интеллект на видео с YouTube и подкастах. Прослушав почти 900 часов такого контента, модель научилась реалистично делать паузу, использовать междометия и слова-паразиты 🤬. Работу ИИ можно оценить на записи выше.
👍 👎 Людей, которых просили оценить реалистичность голоса, поставили ему 3,89 по пятибалльной шкале. Это выше, чем в среднем получают подобные ИИ-модели (настоящий человеческий голос получил оценку 4,01).
🔥13
Media is too big
VIEW IN TELEGRAM
Чудо-сервис для работы с CGI от Циклопа из «Людей Икс» 🪄
🧙♀️ Wonder Studio не требует дорогостоящего оборудования для mocap-а, а работа со спецэффектами становится не сложнее, чем использование фильтров в Photoshop, утверждают создатели. Сервис с помощью ИИ «распознает актера с одной камеры, отвечает за операторскую работу, свет и цветокоррекцию, заменяет человека на CG-модель». Журналистам удалось посмотреть на Wonder Studio в работе, и они говорят, что результаты действительно впечатляют 😧.
🎬 Оба основателя компании Wonder Dynamics, которая разрабатывает Wonder Studio, не понаслышке знают, что такое производство фильмов — и Никола Тодорович и Тай Шеридан профессиональные актеры. Шеридан, например, снимался в главной роли у Стивена Спилберга в «Первому игроку приготовиться» и нескольких частях «Людей Икс». На разработку Wonder Studio у них ушло 3 года. Тодорович и Шеридан настаивают, что их сервис создан, чтобы помочь профессионалам, а не заменить их с помощью алгоритмов 🤝.
🦸♂️ Wonder Studio находится на стадии бета-тестирования, но его уже используют в своем следующем проекте режиссеры Джо и Энтони Руссо («Мстители», «Серый человек», «Первый мститель»).
Спецэффекты становятся одной из главных областей применения искусственного интеллекта. За последнее время мы уже рассказывали о двух похожих продуктах: Move AI и MARZ.
🧙♀️ Wonder Studio не требует дорогостоящего оборудования для mocap-а, а работа со спецэффектами становится не сложнее, чем использование фильтров в Photoshop, утверждают создатели. Сервис с помощью ИИ «распознает актера с одной камеры, отвечает за операторскую работу, свет и цветокоррекцию, заменяет человека на CG-модель». Журналистам удалось посмотреть на Wonder Studio в работе, и они говорят, что результаты действительно впечатляют 😧.
🎬 Оба основателя компании Wonder Dynamics, которая разрабатывает Wonder Studio, не понаслышке знают, что такое производство фильмов — и Никола Тодорович и Тай Шеридан профессиональные актеры. Шеридан, например, снимался в главной роли у Стивена Спилберга в «Первому игроку приготовиться» и нескольких частях «Людей Икс». На разработку Wonder Studio у них ушло 3 года. Тодорович и Шеридан настаивают, что их сервис создан, чтобы помочь профессионалам, а не заменить их с помощью алгоритмов 🤝.
🦸♂️ Wonder Studio находится на стадии бета-тестирования, но его уже используют в своем следующем проекте режиссеры Джо и Энтони Руссо («Мстители», «Серый человек», «Первый мститель»).
Спецэффекты становятся одной из главных областей применения искусственного интеллекта. За последнее время мы уже рассказывали о двух похожих продуктах: Move AI и MARZ.
😱10🔥6
OpenAI выпустил GPT-4. Что в ней нового?
Как и обещал Microsoft — 14 марта OpenAI официально презентовал следующую версию языковой модели GPT — GPT-4.
Основные изменения в новой версии:
🖼 GPT-4 понимает не только текст, но и визуальную информацию (пока без видео). Мультимодальная модель может рассказать, что именно изображено на иллюстрации, и даже объяснить ее смысл. В демо GPT-4 объяснил визуальную шутку, где к айфону подключен древний VGA-кабель, а также рассказал, что можно приготовить из ингредиентов, изображенных на картинке;
🧠 GPT-4 отличается хорошей памятью. Если предыдущая версия могла запомнить 8 тыс. слов, то GPT-4 легко запомнит 25 тыс. OpenAI анонсировал суперверсию ИИ, которая запоминает около 64 тыс. слов (т. е. около 50 страниц текста). Это позволит модели вести длинные диалоги и генерировать более объемные тексты;
💬 GPT-4 готова отвечать на вопросы на 26 языках, включая русский;
😌 GPT-4 будет не так просто вывести из себя, чтобы модель начала угрожать, оскорблять или просто нести чушь. Для этого ее тренировали на огромном количестве «вредоносных» текстовых подсказок;
👩🎓 GPT-4 прошла более 20 самых распространенных тестов на знание, в том числе математики, письма, чтения, физики, химии. В отдельных случаях модель показала результаты лучше, чем 88% проходивших тесты;
GPT-4 уже тестируют несколько крупных компаний, включая платежный сервис Stripe. В OpenAI также признались, что обновленный поисковик Bing от Microsoft, анонсированный несколькими неделями ранее, уже работал на новой версии GPT. Также в компании отказались подробно рассказывать о технических характеристиках GPT-4 — чтобы не выдать лишнюю информацию конкурентам 🤐.
GPT-4 все еще не идеальна: знания модели ограничены сентябрем 2021 года, а в отдельных случаях ИИ «галлюцинирует» — выдает некорректную или попросту выдуманную информацию 😵💫.
💵 Сейчас модель доступна только подписчикам платного сервиса ChatGPT Plus, разработчики могут записать в лист ожидания API. Бесплатная версия пока не анонсирована.
Как и обещал Microsoft — 14 марта OpenAI официально презентовал следующую версию языковой модели GPT — GPT-4.
Основные изменения в новой версии:
🖼 GPT-4 понимает не только текст, но и визуальную информацию (пока без видео). Мультимодальная модель может рассказать, что именно изображено на иллюстрации, и даже объяснить ее смысл. В демо GPT-4 объяснил визуальную шутку, где к айфону подключен древний VGA-кабель, а также рассказал, что можно приготовить из ингредиентов, изображенных на картинке;
🧠 GPT-4 отличается хорошей памятью. Если предыдущая версия могла запомнить 8 тыс. слов, то GPT-4 легко запомнит 25 тыс. OpenAI анонсировал суперверсию ИИ, которая запоминает около 64 тыс. слов (т. е. около 50 страниц текста). Это позволит модели вести длинные диалоги и генерировать более объемные тексты;
💬 GPT-4 готова отвечать на вопросы на 26 языках, включая русский;
😌 GPT-4 будет не так просто вывести из себя, чтобы модель начала угрожать, оскорблять или просто нести чушь. Для этого ее тренировали на огромном количестве «вредоносных» текстовых подсказок;
👩🎓 GPT-4 прошла более 20 самых распространенных тестов на знание, в том числе математики, письма, чтения, физики, химии. В отдельных случаях модель показала результаты лучше, чем 88% проходивших тесты;
GPT-4 уже тестируют несколько крупных компаний, включая платежный сервис Stripe. В OpenAI также признались, что обновленный поисковик Bing от Microsoft, анонсированный несколькими неделями ранее, уже работал на новой версии GPT. Также в компании отказались подробно рассказывать о технических характеристиках GPT-4 — чтобы не выдать лишнюю информацию конкурентам 🤐.
GPT-4 все еще не идеальна: знания модели ограничены сентябрем 2021 года, а в отдельных случаях ИИ «галлюцинирует» — выдает некорректную или попросту выдуманную информацию 😵💫.
💵 Сейчас модель доступна только подписчикам платного сервиса ChatGPT Plus, разработчики могут записать в лист ожидания API. Бесплатная версия пока не анонсирована.
❤5🔥3👍2
Media is too big
VIEW IN TELEGRAM
Google спешит напомнить, что у него тоже есть ИИ 👋
🏃♂️ Google очень не хочет прийти последним в ИИ-гонке, и поэтому в один день с анонсом GPT-4 объявил об интеграции искусственного интеллекта в свои офисные инструменты, объединенные общим названием Workspace: Gmail, Документы, Таблицы, Meet, Календарь и другие.
📩 📄 На первом этапе алгоритмы добавят в почтовый сервис и текстовый редактор. В Документах теперь, например, можно задать искусственному интеллекту тему для текста и приложение сгенерирует черновик. Gmail благодаря ИИ теперь может написать за вас ответ и подготовить пересказ слишком длинного письма.
🤖 ИИ обещают интегрировать в остальные сервисы каждые пару недель, так что скоро ждите, в том числе, генеративную нейросеть в Презентациях, которая создаст по текстовой подсказке иллюстрации для слайдов.
🙁 Но не спешите радоваться — пока прокачанные Gmail и Документы будут доступны только «проверенным» пользователям в США. Кажется, это еще один признак того, что Google очень торопится со своими ИИ-анонсами.
🏃♂️ Google очень не хочет прийти последним в ИИ-гонке, и поэтому в один день с анонсом GPT-4 объявил об интеграции искусственного интеллекта в свои офисные инструменты, объединенные общим названием Workspace: Gmail, Документы, Таблицы, Meet, Календарь и другие.
📩 📄 На первом этапе алгоритмы добавят в почтовый сервис и текстовый редактор. В Документах теперь, например, можно задать искусственному интеллекту тему для текста и приложение сгенерирует черновик. Gmail благодаря ИИ теперь может написать за вас ответ и подготовить пересказ слишком длинного письма.
🤖 ИИ обещают интегрировать в остальные сервисы каждые пару недель, так что скоро ждите, в том числе, генеративную нейросеть в Презентациях, которая создаст по текстовой подсказке иллюстрации для слайдов.
🙁 Но не спешите радоваться — пока прокачанные Gmail и Документы будут доступны только «проверенным» пользователям в США. Кажется, это еще один признак того, что Google очень торопится со своими ИИ-анонсами.
🤔6😱1
BMW показал дисплей, который займет всё лобовое стекло автомобиля 😱
Panoramic Vision представляет собой проекционный дисплей, который выводит важную информацию по всей площади лобового стекла автомобиля — не только для водителя, но и для пассажира ℹ️.
В немецкой компании говорят, что Panoramic Vision позволит водителю в принципе не отводить взгляд от дороги, что естественно повышает безопасность поездки 👷♂️.
Дисплей начнут устанавливать в электромобилях концерна уже в 2025 году.
🛸 Нечто похожее на Panoramic Vision, но еще более футуристичное, BMW показывал в январе на презентации концепт-кара Vision Dee (см. видео с девушкой). Там на лобовое стекло проецировалась не только важная информация, а целые 3D-сцены.
Panoramic Vision представляет собой проекционный дисплей, который выводит важную информацию по всей площади лобового стекла автомобиля — не только для водителя, но и для пассажира ℹ️.
В немецкой компании говорят, что Panoramic Vision позволит водителю в принципе не отводить взгляд от дороги, что естественно повышает безопасность поездки 👷♂️.
Дисплей начнут устанавливать в электромобилях концерна уже в 2025 году.
🛸 Нечто похожее на Panoramic Vision, но еще более футуристичное, BMW показывал в январе на презентации концепт-кара Vision Dee (см. видео с девушкой). Там на лобовое стекло проецировалась не только важная информация, а целые 3D-сцены.
🔥11👍1
Сооснователь OpenAI запустил цифровой паспорт для децентрализованного интернета будущего 🛃
Стартап Worldcoin представил технологию World ID — децентрализованный цифровой паспорт, который должен упростить для пользователей процесс подтверждения личности в интернете, при этом не требуя раскрывать персональные данные 🤫.
Один из основателей Worldcoin — это Сэм Альтман, глава и сооснователь компании OpenAI.
🔐 World ID хранится локально на смартфоне пользователя и использует криптографический протокол доказательства с нулевым разглашением (Zero-Knowledge Proof) для подтверждения личности. Решение в перспективе закрывает важный вопрос, о том, кому должны принадлежать ваши персональные данные — вам или бигтехам, которые сегодня зарабатывают на них миллиарды долларов.
Как объясняют создатели, цифровой паспорт не привязан к биометрии пользователя, его телефону или любой другой личной информации. World ID можно сравнить с печатью в документе, которая подтверждает его подлинность, а в данном случае — подтверждает, что пользователь не бот 🤖. При этом, где именно вы использовали World ID не знают даже разработчики приложения (так они утверждают, по крайней мере) 🙈.
✖️ 🇷🇺✖️ Если вы живете не в России, то можете уже завести себе модную штуку, скачав соответствующее приложение. Правда, толку от него сейчас мало, так как крупных сервисов, которые поддерживали бы продвинутую аутентификацию, сейчас попросту нет. Первым девайсом, который полноценно поддерживает World ID, стал The Orb — сканер сетчатки глаза, разработанный Worldcoin, и позволяющий получить виртуальное удостоверение личности.
Стартап Worldcoin представил технологию World ID — децентрализованный цифровой паспорт, который должен упростить для пользователей процесс подтверждения личности в интернете, при этом не требуя раскрывать персональные данные 🤫.
Один из основателей Worldcoin — это Сэм Альтман, глава и сооснователь компании OpenAI.
🔐 World ID хранится локально на смартфоне пользователя и использует криптографический протокол доказательства с нулевым разглашением (Zero-Knowledge Proof) для подтверждения личности. Решение в перспективе закрывает важный вопрос, о том, кому должны принадлежать ваши персональные данные — вам или бигтехам, которые сегодня зарабатывают на них миллиарды долларов.
Как объясняют создатели, цифровой паспорт не привязан к биометрии пользователя, его телефону или любой другой личной информации. World ID можно сравнить с печатью в документе, которая подтверждает его подлинность, а в данном случае — подтверждает, что пользователь не бот 🤖. При этом, где именно вы использовали World ID не знают даже разработчики приложения (так они утверждают, по крайней мере) 🙈.
✖️ 🇷🇺✖️ Если вы живете не в России, то можете уже завести себе модную штуку, скачав соответствующее приложение. Правда, толку от него сейчас мало, так как крупных сервисов, которые поддерживали бы продвинутую аутентификацию, сейчас попросту нет. Первым девайсом, который полноценно поддерживает World ID, стал The Orb — сканер сетчатки глаза, разработанный Worldcoin, и позволяющий получить виртуальное удостоверение личности.
🔥8❤1
Midjourney научился корректно генерировать пальцы и зубы, на ИИ-адвоката подали в суд, Siri мешает Apple в разработке чат-бота — и другие важные новости за неделю
✅ Вышла пятая версия Midjourney: генерации стали еще реалистичнее, а главное, у людей на сгенерированных картинках теперь правильное количество пальцев и зубов!;
✅ В истории про ИИ-адвоката случился новый сюжетный поворот — на создателей алгоритма подали в суд за оказание юридических услуг ненадлежащего качества (по факту услуги оказать так и не удалось);
✅ Meta* сворачивает NFT-активность в Facebook* и Instagram* — токены, которые еще недавно представляли, как будущее монетизации для авторов контента, больше нельзя будет использовать на платформах;
✅Вдогонку к предыдущей новости: Марк Цукерберг, вероятно, поддался на давление со стороны инвесторов, которые немножко поседели, когда увидели миллиардные убытки metaverse-подразделения Meta*. Теперь компания намерена сосредоточиться на инвестициях в ИИ;
✅Цукербрега можно понять, ведь инвестиции в метавселенные за первые 3 месяца текущего года обвалились почти в 4 раза по сравнению с аналогичным периодом 2022 года — с $2 млрд до $587 млн. Инвестиции в ИИ при этом выросли с $613 млн за первые 3 месяца 2022 года до $2,3 млрд за аналогичный период в 2023-м ;
✅ Новости из мира чат-ботов: стартап Anthropic, который получил $400 млн от Google, запустил чат-бота по имени Claude; Apple тоже работает над ответом ChatGPT на основе Siri, но процесс тормозит низкое качество программного кода, на котором работает голосовой помощник; китайцы Baidu представили свой чат-бот Ernie, но он настолько всех не впечатлил, что акции компании в моменте подешевели на 10%;
✅ МТС разрабатывает конкурента YouTube и TikTok на базе своего не слишком популярного сервиса WASD.
*Организации, запрещенные на территории РФ
✅ Вышла пятая версия Midjourney: генерации стали еще реалистичнее, а главное, у людей на сгенерированных картинках теперь правильное количество пальцев и зубов!;
✅ В истории про ИИ-адвоката случился новый сюжетный поворот — на создателей алгоритма подали в суд за оказание юридических услуг ненадлежащего качества (по факту услуги оказать так и не удалось);
✅ Meta* сворачивает NFT-активность в Facebook* и Instagram* — токены, которые еще недавно представляли, как будущее монетизации для авторов контента, больше нельзя будет использовать на платформах;
✅Вдогонку к предыдущей новости: Марк Цукерберг, вероятно, поддался на давление со стороны инвесторов, которые немножко поседели, когда увидели миллиардные убытки metaverse-подразделения Meta*. Теперь компания намерена сосредоточиться на инвестициях в ИИ;
✅Цукербрега можно понять, ведь инвестиции в метавселенные за первые 3 месяца текущего года обвалились почти в 4 раза по сравнению с аналогичным периодом 2022 года — с $2 млрд до $587 млн. Инвестиции в ИИ при этом выросли с $613 млн за первые 3 месяца 2022 года до $2,3 млрд за аналогичный период в 2023-м ;
✅ Новости из мира чат-ботов: стартап Anthropic, который получил $400 млн от Google, запустил чат-бота по имени Claude; Apple тоже работает над ответом ChatGPT на основе Siri, но процесс тормозит низкое качество программного кода, на котором работает голосовой помощник; китайцы Baidu представили свой чат-бот Ernie, но он настолько всех не впечатлил, что акции компании в моменте подешевели на 10%;
✅ МТС разрабатывает конкурента YouTube и TikTok на базе своего не слишком популярного сервиса WASD.
*Организации, запрещенные на территории РФ
👍6❤2
Media is too big
VIEW IN TELEGRAM
Microsoft показал умного ассистента Copilot — помощника-скрепку на анаболиках 📎
👨✈️ Microsoft анонсировал ИИ-ассистента Copilot, интегрированного во все офисные приложения компаний. «Второй пилот» — это чат-бот внутри приложения, который в зависимости от контекста может предложить варианты написания текста на заданную тему, создать с нуля слайды для презентации, сгенерировать график функции или подготовить длинную и короткую версии электронного письма. Работает Copilot на нескольких языковых моделях, включая свежую GPT-4.
📹 В будущем Microsoft хочет интегрировать в Copilot сервис Designer, добавить генерацию видео и возможность использовать ассистента совместно с коллегами.
😵💫 Copilot пока работает в тестовом режиме, но Microsoft заранее предупреждает, что ИИ несовершенен, галлюцинирует, ошибается и вообще лучше всегда перепроверить, что там Copilot вам насоветовал.
🥊 Кажется, как и в случае с умным поисковиком, Microsoft опять удалось обыграть Google и показать сервис, который хочется начать использовать прямо сейчас. Google за пару дней до Copilot тоже объявил об интеграции ИИ в свои офисные приложения, но анонс получился невнятным, как это бывает у компании в последнее время. С другой стороны, Microsoft провел шикарную презентацию обновленного Bing, а через пару дней выяснилось, что компания просто умело спрятала многочисленные ошибки поисковика.
👨✈️ Microsoft анонсировал ИИ-ассистента Copilot, интегрированного во все офисные приложения компаний. «Второй пилот» — это чат-бот внутри приложения, который в зависимости от контекста может предложить варианты написания текста на заданную тему, создать с нуля слайды для презентации, сгенерировать график функции или подготовить длинную и короткую версии электронного письма. Работает Copilot на нескольких языковых моделях, включая свежую GPT-4.
📹 В будущем Microsoft хочет интегрировать в Copilot сервис Designer, добавить генерацию видео и возможность использовать ассистента совместно с коллегами.
😵💫 Copilot пока работает в тестовом режиме, но Microsoft заранее предупреждает, что ИИ несовершенен, галлюцинирует, ошибается и вообще лучше всегда перепроверить, что там Copilot вам насоветовал.
🥊 Кажется, как и в случае с умным поисковиком, Microsoft опять удалось обыграть Google и показать сервис, который хочется начать использовать прямо сейчас. Google за пару дней до Copilot тоже объявил об интеграции ИИ в свои офисные приложения, но анонс получился невнятным, как это бывает у компании в последнее время. С другой стороны, Microsoft провел шикарную презентацию обновленного Bing, а через пару дней выяснилось, что компания просто умело спрятала многочисленные ошибки поисковика.
🔥7👍1
🦙 В Стэнфорде конкурента GPT обучили за $600, сэкономив миллионы долларов
Университет представил языковую модель Alpaca, созданную на основе модели LLaMA от Meta*. Главное отличие Alpaca от разработки OpenAI в ее дешевизне — мы не знаем, сколько точно стоит обучение такой модели как GPT, но, скорее всего, сумма составляет несколько миллионов долларов. Для Alpaca, которая еще и не требовательна к ресурсам, эта сумма составила всего несколько сотен долларов 😱.
✍️ Чтобы сэкономить, исследователи из Стэнфорда собственноручно записали 175 текстовых инструкций формата «Создай список обещаний на Новый год» с вариантами ответов, которые затем загрузили в GPT, чтобы сгенерировать еще больше подобных примеров. На выходе у них получилось 52 тыс. вариантов, что обошлось исследователям в $500.
🛠 Еще $100 и 8 часов рабочего времени авторы потратили на то, чтобы с помощью полученных синтетических данных, используя систему Nvidia A100, «докрутить» LLaMA, на которой работает Alpaca.
✖️ Авторы говорят, что их модель сравнима по результатам с теми, которые выдает GPT-3,5. Эксперимент Стэнфорда можно повторить и на новейшей GPT-4, правда, для ее дальнейшего использования есть ограничения. Так, LLaMA нельзя использовать в коммерческих целях, а OpenAI запрещает использовать информацию, сгенерированную GPT, для создания конкурентов языковой модели.
*Организация, запрещенная на территории РФ
Университет представил языковую модель Alpaca, созданную на основе модели LLaMA от Meta*. Главное отличие Alpaca от разработки OpenAI в ее дешевизне — мы не знаем, сколько точно стоит обучение такой модели как GPT, но, скорее всего, сумма составляет несколько миллионов долларов. Для Alpaca, которая еще и не требовательна к ресурсам, эта сумма составила всего несколько сотен долларов 😱.
✍️ Чтобы сэкономить, исследователи из Стэнфорда собственноручно записали 175 текстовых инструкций формата «Создай список обещаний на Новый год» с вариантами ответов, которые затем загрузили в GPT, чтобы сгенерировать еще больше подобных примеров. На выходе у них получилось 52 тыс. вариантов, что обошлось исследователям в $500.
🛠 Еще $100 и 8 часов рабочего времени авторы потратили на то, чтобы с помощью полученных синтетических данных, используя систему Nvidia A100, «докрутить» LLaMA, на которой работает Alpaca.
✖️ Авторы говорят, что их модель сравнима по результатам с теми, которые выдает GPT-3,5. Эксперимент Стэнфорда можно повторить и на новейшей GPT-4, правда, для ее дальнейшего использования есть ограничения. Так, LLaMA нельзя использовать в коммерческих целях, а OpenAI запрещает использовать информацию, сгенерированную GPT, для создания конкурентов языковой модели.
*Организация, запрещенная на территории РФ
🔥8👍1
This media is not supported in your browser
VIEW IN TELEGRAM
📝➡️🖼 Runway показал новую версию Text2Video модели Gen
В отличие от первой версии, о который мы писали здесь, Gen-2 может не просто редактировать исходное видео, но генерировать его с нуля по текстовой подсказке 🪄. Еще нейросеть может превращать в короткий клип загруженное изображение, а также работать в комбинированном формате: вы можете загрузить в нейросеть изображение, а затем написать текстовую подсказку с описанием того, каким именно должно быть ваше видео 🎬.
Пока продолжительность роликов не превышает нескольких секунд, а их качество пока не назовешь идеальным. Тем не менее текстовой подсказке алгоритм следует довольно точно, а детализированность результата уже значительно выше той, что показывают конкуренты (тем более, что нейросетей конкурентов нет в открытом доступе). Мало того, Runway уже работают и над возможностью генерировать аудио с помощью Gen 🎶.
Чтобы попробовать новую версию Gen, придется зарегистрироваться на сайте Runway и ждать, когда она станет доступна.
В отличие от первой версии, о который мы писали здесь, Gen-2 может не просто редактировать исходное видео, но генерировать его с нуля по текстовой подсказке 🪄. Еще нейросеть может превращать в короткий клип загруженное изображение, а также работать в комбинированном формате: вы можете загрузить в нейросеть изображение, а затем написать текстовую подсказку с описанием того, каким именно должно быть ваше видео 🎬.
Пока продолжительность роликов не превышает нескольких секунд, а их качество пока не назовешь идеальным. Тем не менее текстовой подсказке алгоритм следует довольно точно, а детализированность результата уже значительно выше той, что показывают конкуренты (тем более, что нейросетей конкурентов нет в открытом доступе). Мало того, Runway уже работают и над возможностью генерировать аудио с помощью Gen 🎶.
Чтобы попробовать новую версию Gen, придется зарегистрироваться на сайте Runway и ждать, когда она станет доступна.
😱4👍2🔥2❤1
Media is too big
VIEW IN TELEGRAM
👩 Очень умный почтовый клиент с голосом Скарлетт Йоханссон
Бывший сотрудник ИИ-стартапа Covariant Джастин Элви у себя в твиттере показал почтовый клиент на основе языковой модели GPT-3,5 и голосовой модели от ElevenLabs. Последнюю Элви, по его словам, тренировал с помощью речи виртуальной помощницы из фильма «Она» (ее, если кто забыл, озвучивала Скарлетт Йоханссон) 🏋️♀️.
📨 Сначала GPT-3,5 генерирует краткое содержание писем, а затем его зачитывает синтетический голос. В демо голосовая помощница Саманта рассказывает о важных письмах, которые пришли пользователю, и отвечает на них.
🆒 Выглядит действительно круто, единственное, к чему можно придраться в демонстрации — довольно продолжительные паузы между запросом и генерацией ответа.
Бывший сотрудник ИИ-стартапа Covariant Джастин Элви у себя в твиттере показал почтовый клиент на основе языковой модели GPT-3,5 и голосовой модели от ElevenLabs. Последнюю Элви, по его словам, тренировал с помощью речи виртуальной помощницы из фильма «Она» (ее, если кто забыл, озвучивала Скарлетт Йоханссон) 🏋️♀️.
📨 Сначала GPT-3,5 генерирует краткое содержание писем, а затем его зачитывает синтетический голос. В демо голосовая помощница Саманта рассказывает о важных письмах, которые пришли пользователю, и отвечает на них.
🆒 Выглядит действительно круто, единственное, к чему можно придраться в демонстрации — довольно продолжительные паузы между запросом и генерацией ответа.
🔥6👍2❤1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ, который создаст вашего клона для маркетинговых видео 👥
Стартап Tavus разработал одноименную платформу для быстрой редактуры маркетинговых видео с помощью ИИ. Например, вам нужно записать десяток однотипных видео, где меняется только имя адресата. С помощью Tavus можно просто изменить имя в редакторе, а ИИ сам вставит его в нужный момент в ролике.
📹 Чтобы начать использовать Tavus, пользователю нужно записать 15-минутный ролик, на котором будет обучаться алгоритм. Затем нужно записать «шаблон» для ролика, который предстоит редактировать, меняя вводные данные (название компании, имя клиента и т. д.). С недавнего времени Tavus поддерживает ChatGPT, с помощью которого можно сгенерировать текст для видео ✅.
🚨 Не будут ли злоумышленники использовать Tavus для создания дипфейков? Разработчики утверждают, что нет: платформа не позволяет загружать чужие видео, а каждый пользователь проходит процедуру верификации.
💵 Базовый тариф Tavus стоит $275 в месяц. На сайте можно запросить демо сервиса.
Стартап Tavus разработал одноименную платформу для быстрой редактуры маркетинговых видео с помощью ИИ. Например, вам нужно записать десяток однотипных видео, где меняется только имя адресата. С помощью Tavus можно просто изменить имя в редакторе, а ИИ сам вставит его в нужный момент в ролике.
📹 Чтобы начать использовать Tavus, пользователю нужно записать 15-минутный ролик, на котором будет обучаться алгоритм. Затем нужно записать «шаблон» для ролика, который предстоит редактировать, меняя вводные данные (название компании, имя клиента и т. д.). С недавнего времени Tavus поддерживает ChatGPT, с помощью которого можно сгенерировать текст для видео ✅.
🚨 Не будут ли злоумышленники использовать Tavus для создания дипфейков? Разработчики утверждают, что нет: платформа не позволяет загружать чужие видео, а каждый пользователь проходит процедуру верификации.
💵 Базовый тариф Tavus стоит $275 в месяц. На сайте можно запросить демо сервиса.
🔥5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Создатели Assassin’s Creed анонсировали нейросеть, которая пишет диалоги для видеоигр 🎮
💬 Ghostwriter от французского издателя и разработчика игр UbiSoft может сгенерировать диалог по описанию персонажей и контексту, в котором происходит диалог. Инструмент генерирует 2 варианта диалога на заданную тему, которые пользователь потом может отредактировать. На основе правок ИИ создает новые варианты, с каждым изменением все более приближенные к «идеалу».
👥 UbiSoft планирует использовать Ghostwriter для генерации диалогов NPC — неигровых персонажей, которые выступают в роли «массовки» на уровнях, или персонажей, которые выдают главному герою миссии для выполнения ⚔️.
Теперь основная задача — эффективно интегрировать Ghostwriter в процесс разработки. В будущем компания хочет разработать платформу, которая позволит игровым сценаристам создавать кастомные ИИ-модели под игры, над которыми они работают в данный момент 🤖.
💬 Ghostwriter от французского издателя и разработчика игр UbiSoft может сгенерировать диалог по описанию персонажей и контексту, в котором происходит диалог. Инструмент генерирует 2 варианта диалога на заданную тему, которые пользователь потом может отредактировать. На основе правок ИИ создает новые варианты, с каждым изменением все более приближенные к «идеалу».
👥 UbiSoft планирует использовать Ghostwriter для генерации диалогов NPC — неигровых персонажей, которые выступают в роли «массовки» на уровнях, или персонажей, которые выдают главному герою миссии для выполнения ⚔️.
Теперь основная задача — эффективно интегрировать Ghostwriter в процесс разработки. В будущем компания хочет разработать платформу, которая позволит игровым сценаристам создавать кастомные ИИ-модели под игры, над которыми они работают в данный момент 🤖.
❤6🔥1
Разработчики видеоигры Gears of War показали результаты работы приложения MetaHuman Animator, которое создает лицевую анимацию на основе видео, записанного на обычный айфон (на один айфон, а не на шесть) 📱.
Актер просто говорит текст, глядя в камеру, а затем на компьютере c установленным MetaHuman за несколько минут создается 3D-анимация
В ходе презентации разработчики также показали, как технология будет выглядеть в деле — на примере игры Hellblade 2, которая должна выйти в этом году
Epic обещают выпустить MetaHuman Animator уже летом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8😱4❤2🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI, кажется, решил одну из главных проблем ChatGPT 💪
Это проблема устаревшей информации, на которой обучался чат-бот, ограниченной концом 2021 года. Теперь сервис поддерживает плагины, которые, в частности, позволят ему залезать в интернет за свежими данными.
☝️ Сейчас набор расширений и число пользователей, которые смогут их протестировать, ограничены. На старте доступны плагины для Slack, Shopify, туристического сервиса Expedia, интеграционной платформы Zappier и других — всего 12 расширений. Кроме того — и это, пожалуй, наиболее многообещающее — OpenAI добавили в ChatGPT поддержку экспериментального браузера, который и позволит чат-боту искать в интернете актуальную информацию (проблема надежности источников при этом все еще остается)🌐 .
Важность появления плагинов можно сравнить с моментом, когда Apple разрешил сторонним разработчикам создавать приложения для своих устройств. То есть ChatGPT постепенно превращается из сервиса в настоящую платформу✔️ .
В демо (см. видео) разработчики показали, как ChatGPT может подобрать подходящий ресторан с помощью плагина OpenTable, затем найти рецепт салата и рассчитать его калорийность с помощью расширения Wolfram, а потом создать список покупок, используя Instacart.
Это проблема устаревшей информации, на которой обучался чат-бот, ограниченной концом 2021 года. Теперь сервис поддерживает плагины, которые, в частности, позволят ему залезать в интернет за свежими данными.
☝️ Сейчас набор расширений и число пользователей, которые смогут их протестировать, ограничены. На старте доступны плагины для Slack, Shopify, туристического сервиса Expedia, интеграционной платформы Zappier и других — всего 12 расширений. Кроме того — и это, пожалуй, наиболее многообещающее — OpenAI добавили в ChatGPT поддержку экспериментального браузера, который и позволит чат-боту искать в интернете актуальную информацию (проблема надежности источников при этом все еще остается)
Важность появления плагинов можно сравнить с моментом, когда Apple разрешил сторонним разработчикам создавать приложения для своих устройств. То есть ChatGPT постепенно превращается из сервиса в настоящую платформу
В демо (см. видео) разработчики показали, как ChatGPT может подобрать подходящий ресторан с помощью плагина OpenTable, затем найти рецепт салата и рассчитать его калорийность с помощью расширения Wolfram, а потом создать список покупок, используя Instacart.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍4
Не все так однозначно: чат-боты Microsoft и Google распространяют фейки, ссылаясь друг на друга 🤥
На это обратил внимание Verge. На данный момент ошибку, о которой идет речь дальше, исправили.
Оказывается, если у чат-бота, встроенного в поисковик Bing, спросить, отключили ли его конкурента — чат-бот Bard от Google — то он ответит утвердительно 🔌.
В качестве источника этой информации Bing указывает — следите за руками — заметку, посвященную твиту, в котором обсуждается шуточный комментарий на сайте Hacker News 🤯. В комментарии пользователь рассказывал, что спросил у Bard, когда его закроют, на что Bard ответил, что его уже закрыли — 21 марта 2023 года, потому что чат-ботом никто не пользовался ☹️.
Да, мы понимаем, что разработчики и Bing, и Bard предупреждают, что их модели работают не идеально (и сами об этом уже несколько раз писали). Но новый случай — еще одна иллюстрация того, что ИИ-поисковики в ближайшие месяцы, а возможно и годы, точно не заменят свои привычные «ламповые» версии 📻. Это подтверждает и недавнее исследование, согласно которому GPT-4 даже «лучше» распространяет фейки, чем предыдущая версия языковой модели.
Кстати, предупреждения от разработчиков работают так себе. Недавно в соцсетях завирусился тред журналиста британской газеты Guardian Криса Морана. Моран рассказал, что с ними связался коллега, который хотел узнать, почему Guardian удалил один из материалов с сайта. Оказалось, что такого материала никогда не было — точнее был, но только в воображении ChatGPT, который на этот текст ссылался 🤦.
На это обратил внимание Verge. На данный момент ошибку, о которой идет речь дальше, исправили.
Оказывается, если у чат-бота, встроенного в поисковик Bing, спросить, отключили ли его конкурента — чат-бот Bard от Google — то он ответит утвердительно 🔌.
В качестве источника этой информации Bing указывает — следите за руками — заметку, посвященную твиту, в котором обсуждается шуточный комментарий на сайте Hacker News 🤯. В комментарии пользователь рассказывал, что спросил у Bard, когда его закроют, на что Bard ответил, что его уже закрыли — 21 марта 2023 года, потому что чат-ботом никто не пользовался ☹️.
Да, мы понимаем, что разработчики и Bing, и Bard предупреждают, что их модели работают не идеально (и сами об этом уже несколько раз писали). Но новый случай — еще одна иллюстрация того, что ИИ-поисковики в ближайшие месяцы, а возможно и годы, точно не заменят свои привычные «ламповые» версии 📻. Это подтверждает и недавнее исследование, согласно которому GPT-4 даже «лучше» распространяет фейки, чем предыдущая версия языковой модели.
Кстати, предупреждения от разработчиков работают так себе. Недавно в соцсетях завирусился тред журналиста британской газеты Guardian Криса Морана. Моран рассказал, что с ними связался коллега, который хотел узнать, почему Guardian удалил один из материалов с сайта. Оказалось, что такого материала никогда не было — точнее был, но только в воображении ChatGPT, который на этот текст ссылался 🤦.
🤔6👍3