☁️ OpenAI говорят, что Sora («небо» в переводе с японского) не просто следует промпту, но и понимает, какое место генерируемые объекты занимают в «физическом» мире. Что-то подобное мы слышали в недавнем анонсе Runway.
🧨 Те примеры генераций, которыми поделились разработчики, действительно выглядят потрясающе — тот же Gen-2 ничем подобным похвастаться не может. Длятся они, правда, не по минуте, а около 10–15 секунд.
🛑 Другое дело, что обычным пользователям модель недоступна и оценить ее реальные возможности не получится. OpenAI открыл Sora только для избранных разработчиков, художников, дизайнеров и киноделов. Все остальные в ближайшее время доступа к модели не получат. Все из-за опасений, что модель может быть использована для распространения фотореалистичных фейков.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3
🤜🤛 Суд в США встал на сторону OpenAI в споре с писателями. Но не до конца
🫤 Окружной суд Калифорнии решил, что истцы не предоставили достаточных доказательств того, что ChatGPT, в частности, обучали на пиратских копиях их произведений, а также, что сервис нанес авторам финансовый ущерб.
👎 Не согласился суд и с тем, что работа чат-бота может нанести серьезный ущерб интеллектуальной собственности в будущем (назвав такие доводы спекуляцией), а также с тем, что контент, генерируемый ChatGPT, копирует произведения истцов.
☝️ Всего группа писателей обвинила OpenAI по шести пунктам, среди которых прямое и косвенное нарушение копирайта, нечестная конкуренция и неосновательное обогащение.
Из шести пунктов суд принял претензии и должен будет вынести решение только по одному — прямое нарушение копирайта.
🥂 Но OpenAI рано праздновать победу. По факту прямое нарушение авторского права — основная претензия истцов, если его удастся доказать, то это может иметь серьезные последствия для сервиса, как и иск New York Times, а также еще несколько коллективных исков от писателей.
Кроме того, истцы до 13 марта могут скорректировать первоначальные исковые требования и вновь обратиться с ними в суд.
🫤 Окружной суд Калифорнии решил, что истцы не предоставили достаточных доказательств того, что ChatGPT, в частности, обучали на пиратских копиях их произведений, а также, что сервис нанес авторам финансовый ущерб.
Из шести пунктов суд принял претензии и должен будет вынести решение только по одному — прямое нарушение копирайта.
🥂 Но OpenAI рано праздновать победу. По факту прямое нарушение авторского права — основная претензия истцов, если его удастся доказать, то это может иметь серьезные последствия для сервиса, как и иск New York Times, а также еще несколько коллективных исков от писателей.
Кроме того, истцы до 13 марта могут скорректировать первоначальные исковые требования и вновь обратиться с ними в суд.
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡2🤔2🔥1
Альтман ищет $7 трлн, Nvidia круче Amazon и Alphabet, в Сан-Франциско жгут роботакси — и другие важные новости за неделю
✅ Появилась информация о сумме, которую Сэм Альтман ищет на свой проект по созданию инфраструктуры для производства чипов. Глава OpenAI попытается убедить инвесторов дать ему $7 трлн. Это астрономическая сумма — почти 10% мирового ВВП — хотя, скорее всего, речь идет об инвестициях, которые растянуты на несколько лет;
✅ Nvidia обогнала Amazon и Alphabet по рыночной капитализации. На момент написания текста стоимость компании достигла $1,825 трлн против $1,820 трлн у Alphabet и $1,776 трлн — у Amazon. Причина, конечно же, в буме генеративного ИИ для которого нужно все больше и больше мощностей. С начала года стоимость акций Nvidia взлетела на 40%;
✅ Яндекс добавил возможности нейросети Yandex GPT в свой браузер. Теперь он может отредактировать текст или написать его с нуля, перевести видео на другой язык или пересказать его, сделать саммарайзинг веб-странички. Даже сгенерировать картинку теперь можно, не выходя из браузера;
✅ В Сан-Франциско на уходящей неделе было неспокойно. У офиса OpenAI в городе несколько десятков человек протестовали против сотрудничества компании с Пентагоном и разработки AGI. Чуть ли не в тот же день разъяренная толпа луддитов набросилась на роботакси Waymo, отпинала его, а потом сожгла;
✅ OpenAI работает над конкурентом поисковика Google, который частично будет работать на мощностях Bing. Что будет из себя представлять новый продукт — отдельный сервис или дополнение к ChatGPT — пока неясно. Удастся ли OpenAI нарушить доминирование Google на рынке поисковиков с помощью ИИ — вопрос. Тому же Bing пока не удалось;
✅ Сбер запустил сервис для упрощения создания контента с виртуальными инфлюенсерами. В Studio.iVFX можно прямо в браузере создать анимацию и внешний вид персонажа, настроить виртуальное освещение, фон и т. д. Обещают, что использование сервиса позволяет сократить затраты на производство в три–пять раз;
✅ НХЛ покажет повторы нескольких хоккейных матчей в 3D на платформе Roblox. В пространстве NHL Blast можно будет увидеть «повтор» трех товарищеских матчей, состоявшихся в начале февраля в рамках NHL All-Star.
✅ Появилась информация о сумме, которую Сэм Альтман ищет на свой проект по созданию инфраструктуры для производства чипов. Глава OpenAI попытается убедить инвесторов дать ему $7 трлн. Это астрономическая сумма — почти 10% мирового ВВП — хотя, скорее всего, речь идет об инвестициях, которые растянуты на несколько лет;
✅ Nvidia обогнала Amazon и Alphabet по рыночной капитализации. На момент написания текста стоимость компании достигла $1,825 трлн против $1,820 трлн у Alphabet и $1,776 трлн — у Amazon. Причина, конечно же, в буме генеративного ИИ для которого нужно все больше и больше мощностей. С начала года стоимость акций Nvidia взлетела на 40%;
✅ Яндекс добавил возможности нейросети Yandex GPT в свой браузер. Теперь он может отредактировать текст или написать его с нуля, перевести видео на другой язык или пересказать его, сделать саммарайзинг веб-странички. Даже сгенерировать картинку теперь можно, не выходя из браузера;
✅ В Сан-Франциско на уходящей неделе было неспокойно. У офиса OpenAI в городе несколько десятков человек протестовали против сотрудничества компании с Пентагоном и разработки AGI. Чуть ли не в тот же день разъяренная толпа луддитов набросилась на роботакси Waymo, отпинала его, а потом сожгла;
✅ OpenAI работает над конкурентом поисковика Google, который частично будет работать на мощностях Bing. Что будет из себя представлять новый продукт — отдельный сервис или дополнение к ChatGPT — пока неясно. Удастся ли OpenAI нарушить доминирование Google на рынке поисковиков с помощью ИИ — вопрос. Тому же Bing пока не удалось;
✅ Сбер запустил сервис для упрощения создания контента с виртуальными инфлюенсерами. В Studio.iVFX можно прямо в браузере создать анимацию и внешний вид персонажа, настроить виртуальное освещение, фон и т. д. Обещают, что использование сервиса позволяет сократить затраты на производство в три–пять раз;
✅ НХЛ покажет повторы нескольких хоккейных матчей в 3D на платформе Roblox. В пространстве NHL Blast можно будет увидеть «повтор» трех товарищеских матчей, состоявшихся в начале февраля в рамках NHL All-Star.
👍6
Boximator позволяет «оживлять» выбранные области на изображении без использования текстовой подсказки.
Да-да, аналогичная функция уже есть у Gen-2, моделей Google и других конкурентов.
🔌 Boximator не является «полноценной» нейросетью — разработчики называют его плагином, который можно подключать к существующим диффузионным моделям для генерации видео.
🍼 Даже по опубликованным разработчиками примерам видно, что нейросети пока тяжело дается консистентность — в некоторых случаях создается ощущение, что клип сшит из нескольких разных генераций, настолько по-разному выглядят анимированные объекты в движении. Но в качестве эдакого Proof of Concept выглядит здорово.
🎮 Если хотите проверить модель самостоятельно, то тут есть два варианта. Можно дождаться демоверсии Boximator, которую обещают через два–три месяца. Второй вариант более экзотический: можно отправить любое изображение разработчикам на почту вместе с промптом и попросить его анимировать.
Подробности здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Стартап, известный своими моделями для синтеза голоса, решил использовать нашумевшую Sora, чтобы представить новый инструмент.
В качестве наглядного примера они использовали видео, сгенерированные Sora.
📝 Релиз обещают скоро, пока можно записаться в очередь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Уилл Смит повторил нейромем с собой в главной роли
🫡 Почти год назад интернет никак не мог наиграться с нейросетью ModelScope, которая генерировала по-хорошему жуткие клипы.
🍜 Одной из самых запоминающихся генераций стал Уилл Смит, поедающий спагетти. Спустя 12 месяцев актер напомнил о проклятом видео.
💬 Вы спросите причем тут Sora? Дело в том, что глава OpenAI Сэм Альтман в своем X-аккаунте предложил пользователям скидывать промпты, по которым новая нейросеть сгенерирует клип.
👊 Один из пользователей попросил сгенерировать — вы угадали — Уилла Смита, поедающего спагетти. Альтман на сообщение не отреагировал, зато отреагировал сам актер.
🍜 Одной из самых запоминающихся генераций стал Уилл Смит, поедающий спагетти. Спустя 12 месяцев актер напомнил о проклятом видео.
👊 Один из пользователей попросил сгенерировать — вы угадали — Уилла Смита, поедающего спагетти. Альтман на сообщение не отреагировал, зато отреагировал сам актер.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Компания выпустила обновление AI Assistant для программ Acrobat и Reader.
Assistant также поддерживает все файлы, которые поддерживают Reader и Acrobat.
Конечно, подобных программ вышел уже не один десяток (в том числе и в виде дополнений к ChatGPT), но зато теперь все эти функции собраны на одной популярной «площадке» 🏟.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Groq — новый чип, который делает LLM в десятки раз быстрее ⚡️
🗣 На выходных в соцсетях завирусилось короткое видео работы Groq (не путать с Grok) — чипа от одноименного стартапа, который позволяет языковым моделям за секунду давать ответы на запросы пользователя.
Сами разработчики называют Groq аббревиатурой LPU или Language Processing Unit.
⚙️ Упрощенная, по сравнению с GPU, архитектура чипа специально заточена под работу языковых моделей и позволяет, как утверждается, ускорить обработку информации в десятки раз в зависимости от модели.
💪 Если Groq способен обрабатывать около 500 токенов информации в секунду, то для GPT-3.5 или Gemini Pro этот показатель составляет около 30–50 токенов. Скорость чипа подтверждают и сторонние тесты. Скорость ответа крайне важный фактор при внедрении LLM, когда речь идет, например, о голосовых помощниках.
📺 В демо, которое показали аж на канале CNN, с усиленным Groq чат-ботом пообщались глава Groq Джонатан Росс и ведущая канала. ИИ с минимальной задержкой и развернуто отвечал на вопросы ведущей — даже когда она перебивала его во время ответа.
Серьезное ограничение Groq на данный момент — чип способен запускать LLM, но не подходит для их обучения. Для него все равно понадобятся старые добрые GPU.
Сами разработчики называют Groq аббревиатурой LPU или Language Processing Unit.
💪 Если Groq способен обрабатывать около 500 токенов информации в секунду, то для GPT-3.5 или Gemini Pro этот показатель составляет около 30–50 токенов. Скорость чипа подтверждают и сторонние тесты. Скорость ответа крайне важный фактор при внедрении LLM, когда речь идет, например, о голосовых помощниках.
📺 В демо, которое показали аж на канале CNN, с усиленным Groq чат-ботом пообщались глава Groq Джонатан Росс и ведущая канала. ИИ с минимальной задержкой и развернуто отвечал на вопросы ведущей — даже когда она перебивала его во время ответа.
Серьезное ограничение Groq на данный момент — чип способен запускать LLM, но не подходит для их обучения. Для него все равно понадобятся старые добрые GPU.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
Цукерберг вспомнил про VR-нейробраслет 👌
В недавнем интервью глава Meta* упомянул нейробраслет, концепт которого был представлен в 2021 году.
🧠 Устройство должно считывать сигналы мозга, чтобы передавать информацию о движении рук VR-устройству.
🏪 Оказалось, что про устройство не забыли и «в течение нескольких лет» оно должно появиться на полках магазинов.
📆 Meta* начала разработку девайса после того, как в 2019 году купила стартап CTRL Labs. Стартап с 2015 года работал над браслетом, считывающим движения пальцев через сигналы мозга.
👀 Браслет точно пригодится для более удобной работы с VR-интерфейсами. Как мы помним, вариант, который Apple предложил в Vision Pro, Марку не понравился.
*Организация, запрещенная на территории РФ
В недавнем интервью глава Meta* упомянул нейробраслет, концепт которого был представлен в 2021 году.
🧠 Устройство должно считывать сигналы мозга, чтобы передавать информацию о движении рук VR-устройству.
🏪 Оказалось, что про устройство не забыли и «в течение нескольких лет» оно должно появиться на полках магазинов.
📆 Meta* начала разработку девайса после того, как в 2019 году купила стартап CTRL Labs. Стартап с 2015 года работал над браслетом, считывающим движения пальцев через сигналы мозга.
*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤔1
X объединится с Midjourney, в iMessage появилось постквантовое шифрование, авиакомпания попала на деньги из-за чат-бота — и другие важные новости за короткую рабочую неделю
✅ Reddit предоставит доступ неназванной ИИ-компании к пользовательскому контенту, накопленному на площадке более чем за 10 лет. По некоторым данным, неназванной компанией может быть Google. Сумма сделки — $60 млн в год. В конце прошлого года вокруг Reddit случился большой скандал, когда компания объявила, что будет брать деньги с разработчиков сторонних приложений за использование API;
✅ По слухам, соцсеть X ведет переговоры о партнерстве с Midjourney. Подробностей о том, как будет выглядеть такое сотрудничество, пока нет. Можно лишь предположить, что в соцсети можно будет, например, сгенерировать собственный аватар;
✅ ИИ-стартап Scale AI заключил контракт с Пентагоном на создание инструментов для тестирования LLM. Военное ведомство интересуют возможности по использованию LLM в военном деле, в частности в планировании и принятии решений. Недавно о сотрудничестве с Пентагоном объявил OpenAI;
✅ Apple добавил постквантовое шифрование в iMessage в новых обновлениях iOS и macOS. Сейчас толку от протокола PQ3 мало, но в предполагаемом будущем, где у каждого хакера будет квантовый компьютер, должно пригодиться. До Apple аналогичные методы шифрования появились у мессенджера Signal;
✅ Анонсирована Stable Diffusion 3. Известно только то, что модель будет существовать в нескольких версиях — от 800 млн до 8 млрд параметров. Для теста нужно записаться в очередь;
✅ Канадской авиакомпании пришлось вернуть деньги клиенту из-за ошибки чат-бота. Джейку Моффатту нужно было срочно купить билеты на рейс из-за смерти бабушки. Когда он спросил у чат-бота на сайте Air Canada об условиях Bereavement Rates (скидок в случае полета, связанного со смертью родственника), тот ответил, что за возвратом средств можно обратиться в течение 90 дней. На самом деле такого пункта в правилах компании нет. Компания пыталась доказать, что не несет ответственности за информацию, которую дает клиентам чат-бот. По решению трибунала по гражданским делам компания частично возместила Моффатту стоимость билетов, а также издержки, связанные с жалобой;
✅ На этой неделе ChatGPT сошел с ума: чат-бот в течение 16 часов генерировал несуществующие слова, не мог закончить предложения, неожиданно переходил с английского на испанский. В OpenAI глюк объяснили неудачным апдейтом;
✅ После выхода Sora стало известно, что в Adobe создали отдельное подразделение из 50 человек, которое будет заниматься генеративным видео с упором на практическое применение;
✅ Сбер объявил о начале разработки ИИ для человекоподобных роботов. В основе модели будет лежать мультимодальная нейросеть, которая будет управлять различными частями робота. Разработка ИИ станет для компании частью большого проекта по созданию собственного робота;
✅ Peugeot добавит ChatGPT в последние модели автомобилей. Помимо использования чат-бота в качестве руководства пользователя, его можно будет попросить занять детей в долгой поездке;
✅ Кинопоиск первым среди российских онлайн-кинотеатров выпустил приложение для хедсета Vision Pro. Последуют ли примеру Кинопоиска другие стриминг-сервисы, сказать сложно: спрос на устройство ценой больше ₽500 тыс. не слишком высок. Например, в сети магазинов МТС предзаказ на Vision Pro оставили всего 500 человек.
✅ Reddit предоставит доступ неназванной ИИ-компании к пользовательскому контенту, накопленному на площадке более чем за 10 лет. По некоторым данным, неназванной компанией может быть Google. Сумма сделки — $60 млн в год. В конце прошлого года вокруг Reddit случился большой скандал, когда компания объявила, что будет брать деньги с разработчиков сторонних приложений за использование API;
✅ По слухам, соцсеть X ведет переговоры о партнерстве с Midjourney. Подробностей о том, как будет выглядеть такое сотрудничество, пока нет. Можно лишь предположить, что в соцсети можно будет, например, сгенерировать собственный аватар;
✅ ИИ-стартап Scale AI заключил контракт с Пентагоном на создание инструментов для тестирования LLM. Военное ведомство интересуют возможности по использованию LLM в военном деле, в частности в планировании и принятии решений. Недавно о сотрудничестве с Пентагоном объявил OpenAI;
✅ Apple добавил постквантовое шифрование в iMessage в новых обновлениях iOS и macOS. Сейчас толку от протокола PQ3 мало, но в предполагаемом будущем, где у каждого хакера будет квантовый компьютер, должно пригодиться. До Apple аналогичные методы шифрования появились у мессенджера Signal;
✅ Анонсирована Stable Diffusion 3. Известно только то, что модель будет существовать в нескольких версиях — от 800 млн до 8 млрд параметров. Для теста нужно записаться в очередь;
✅ Канадской авиакомпании пришлось вернуть деньги клиенту из-за ошибки чат-бота. Джейку Моффатту нужно было срочно купить билеты на рейс из-за смерти бабушки. Когда он спросил у чат-бота на сайте Air Canada об условиях Bereavement Rates (скидок в случае полета, связанного со смертью родственника), тот ответил, что за возвратом средств можно обратиться в течение 90 дней. На самом деле такого пункта в правилах компании нет. Компания пыталась доказать, что не несет ответственности за информацию, которую дает клиентам чат-бот. По решению трибунала по гражданским делам компания частично возместила Моффатту стоимость билетов, а также издержки, связанные с жалобой;
✅ На этой неделе ChatGPT сошел с ума: чат-бот в течение 16 часов генерировал несуществующие слова, не мог закончить предложения, неожиданно переходил с английского на испанский. В OpenAI глюк объяснили неудачным апдейтом;
✅ После выхода Sora стало известно, что в Adobe создали отдельное подразделение из 50 человек, которое будет заниматься генеративным видео с упором на практическое применение;
✅ Сбер объявил о начале разработки ИИ для человекоподобных роботов. В основе модели будет лежать мультимодальная нейросеть, которая будет управлять различными частями робота. Разработка ИИ станет для компании частью большого проекта по созданию собственного робота;
✅ Peugeot добавит ChatGPT в последние модели автомобилей. Помимо использования чат-бота в качестве руководства пользователя, его можно будет попросить занять детей в долгой поездке;
✅ Кинопоиск первым среди российских онлайн-кинотеатров выпустил приложение для хедсета Vision Pro. Последуют ли примеру Кинопоиска другие стриминг-сервисы, сказать сложно: спрос на устройство ценой больше ₽500 тыс. не слишком высок. Например, в сети магазинов МТС предзаказ на Vision Pro оставили всего 500 человек.
🔥5👍3
🧪 Исследователи из Иллинойсского университета провели эксперимент, с помощью которого хотели установить, как GPT и другие языковые модели справятся с ролью «автономного хакера».
Для этого они взяли 10 LLM (закрытые и с открытым кодом) и использовали их через API и фреймворк LangChain, который упрощает разработку приложений на основе LLM.
Сами OpenAI утверждали, напоминают исследователи, что их разработки обладают лишь ограниченными возможностями для совершения «злонамеренных действий».
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡2🥰2😱2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
📺 По китайскому ТВ покажут нейроаниме
Государственный канал CCTV анонсировал выход аниме-сериала, созданного с помощью text-to-video модели.
✏️ Все серии аниме будут основаны на классических произведениях китайской поэзии.
Не уточняется, что за text-to-video модель используется, но судя по трейлеру, многое будет сделано традиционными "ручными" инструментам
🫡 Полностью анонс можно посмотреть здесь.
🤝 Проект разрабатывала государственная China Media Group (CMG) совместно с шанхайской ИИ-студией. Во время анонса CMG рассказали о запуске отдельной ИИ-студии для разработки подобных проектов.
Не показывайте эту новость тем, кто расстроился из-за аниме Netflix, где нейросеть всего лишь нарисовала фон.
Государственный канал CCTV анонсировал выход аниме-сериала, созданного с помощью text-to-video модели.
Не уточняется, что за text-to-video модель используется, но судя по трейлеру, многое будет сделано традиционными "ручными" инструментам
Не показывайте эту новость тем, кто расстроился из-за аниме Netflix, где нейросеть всего лишь нарисовала фон.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3👎2
Genie (Generative Interactive Environments) позволяет генерировать интерактивное окружение из нейроизображений, фотографий, набросков.
🎞 Модель тренировали на большом датасете видео, находящихся в открытом доступе, с упором на клипы из игр-платформеров, а также видео, где робототехника взаимодействует с различными объектами.
🤝 Универсальность Genie позволяет ей использовать генерации, созданные другими нейросетями для создания виртуального окружения. В качестве примера авторы показали работу Genie с гугловской нейросетью Imagen.
Недавно мы рассказывали, как энтузиаст сделал ремейк Angry Birds с помощью нейросетей. Для этого ему понадобились сразу три модели.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2