Microsoft рассказал сколько минут нужно ИИ, чтобы стать полезным
11 минут.
👌 Именно столько должен экономить ИИ каждый день, чтобы человек увидел в нем пользу .
👥 Microsoft вывел эту цифру, проведя опрос 1,3 тыс. пользователей помощника Copilot.
⌚️ Среди опрошенных были и те, кому ИИ экономил гораздо больше — до 30 минут ежедневно.
👥 Microsoft вывел эту цифру, проведя опрос 1,3 тыс. пользователей помощника Copilot.
⌚️ Среди опрошенных были и те, кому ИИ экономил гораздо больше — до 30 минут ежедневно.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2
Stability AI потерял всех ключевых сотрудников, Яндекс анонсировал новое поколение Yandex GPT, Юрий Никулин вернется в виде дипфейка — и другие важные новости за неделю
✅ CEO Stability AI Эмад Мостак покинул компанию вслед за несколькими ключевыми сотрудниками, ушедшими на несколько дней раньше. Пост временного главы стартапа разделят между собой CTO и COO компании. Мостак уверяет, что решение уйти было принято им и заявил, что теперь вплотную займется вопросами децентрализации ИИ. Тем не менее внимание обращает на себя тот факт, что Мостак ушел на фоне слухов о попытках руководства Stability AI продать компанию, сложного финансового положения стартапа и текучки кадров. К репутации самого гендира тоже были вопросы;
✅ Spotify запустит видеокурсы совместно с Би-би-си, платформой Skillshare и другими компаниями. Пока уроки запустят только для пользователей в Великобритании. Курсы будут доступны всем подписчикам. Первые два урока можно будет получить бесплатно, дальше придется платить £20–80. Темы уроков самые разные — от создания музыки до обучения Excel;
✅ ООН приняла первую резолюцию по искусственному интеллекту. Документ, единогласно поддержанный всеми 193 членами Генассамблеи (включая Россию и Китай), призывает к регулированию ИИ, защите личной информации при использовании и разработке моделей и борьбе со злонамеренным использованием технологии;
✅ Сарик Андреасян использует дипфейк Юрия Никулина в проекте Манюня: Приключения в Москве, где Андреасян и его брат Гевонд выступают продюсерами. Действие Манюни происходит в 1980-х, а Никулин — один из ключевых персонажей истории. Наследники Никулина оказались не против такого использования образа актера. В кинотеатрах Манюня должна выйти в мае;
✅ Яндекс анонсировал новое поколение LLM YandexGPT. Пока из нового семейства моделей доступна только Pro-версия через API. Также через Yandex Cloud можно попробовать демоверсию модели. Разработчики говорят, что новая LLM лучше понимает контекст беседы, эффективнее работает со сложными запросами и т. д. Также Яндекс хвастается, что в бенчмарках их разработка обходит на несколько процентных пунктов GPT-3.5 Turbo;
✅ Amazon потратит еще $150 млрд на строительство дата-центров, чтобы обеспечить всех нуждающихся в мощностях для работы ИИ и сохранить за собой лидерство на облачном рынке. Десятки миллиардов потратят не единовременно, а на протяжении 15 лет. Сейчас Amazon занимает около 31% рынка, на втором месте Microsoft — с 24%.
✅ CEO Stability AI Эмад Мостак покинул компанию вслед за несколькими ключевыми сотрудниками, ушедшими на несколько дней раньше. Пост временного главы стартапа разделят между собой CTO и COO компании. Мостак уверяет, что решение уйти было принято им и заявил, что теперь вплотную займется вопросами децентрализации ИИ. Тем не менее внимание обращает на себя тот факт, что Мостак ушел на фоне слухов о попытках руководства Stability AI продать компанию, сложного финансового положения стартапа и текучки кадров. К репутации самого гендира тоже были вопросы;
✅ Spotify запустит видеокурсы совместно с Би-би-си, платформой Skillshare и другими компаниями. Пока уроки запустят только для пользователей в Великобритании. Курсы будут доступны всем подписчикам. Первые два урока можно будет получить бесплатно, дальше придется платить £20–80. Темы уроков самые разные — от создания музыки до обучения Excel;
✅ ООН приняла первую резолюцию по искусственному интеллекту. Документ, единогласно поддержанный всеми 193 членами Генассамблеи (включая Россию и Китай), призывает к регулированию ИИ, защите личной информации при использовании и разработке моделей и борьбе со злонамеренным использованием технологии;
✅ Сарик Андреасян использует дипфейк Юрия Никулина в проекте Манюня: Приключения в Москве, где Андреасян и его брат Гевонд выступают продюсерами. Действие Манюни происходит в 1980-х, а Никулин — один из ключевых персонажей истории. Наследники Никулина оказались не против такого использования образа актера. В кинотеатрах Манюня должна выйти в мае;
✅ Яндекс анонсировал новое поколение LLM YandexGPT. Пока из нового семейства моделей доступна только Pro-версия через API. Также через Yandex Cloud можно попробовать демоверсию модели. Разработчики говорят, что новая LLM лучше понимает контекст беседы, эффективнее работает со сложными запросами и т. д. Также Яндекс хвастается, что в бенчмарках их разработка обходит на несколько процентных пунктов GPT-3.5 Turbo;
✅ Amazon потратит еще $150 млрд на строительство дата-центров, чтобы обеспечить всех нуждающихся в мощностях для работы ИИ и сохранить за собой лидерство на облачном рынке. Десятки миллиардов потратят не единовременно, а на протяжении 15 лет. Сейчас Amazon занимает около 31% рынка, на втором месте Microsoft — с 24%.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
GenStudio позволяет с помощью нейросетей запустить маркетинговую кампанию сразу на нескольких платформах.
В Adobe считают, что GenStudio подойдет как большому, так и малому бизнесу. Впервые сервис анонсировали прошлой осенью.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔3
Media is too big
VIEW IN TELEGRAM
🎞 Новый метод для увеличения хронометража синтетических видео
Streaming T2V — это авторегрессионная техника, которая позволяет увеличить продолжительность сгенерированного Text-to-Video нейросетью клипа с нескольких секунд до 2-х минут и даже дольше.
🔮 Авторегрессионная техника означает, что метод учитывает предыдущую информацию (в данном случае — сгенерированное видео), чтобы «предсказать», что будет происходить дальше.
Важно, что Streaming T2V при этом сохраняет консистентность видео, его детали, фреймрейт и старается как можно ближе следовать изначальному промпту.
🔩 Для этого используется несколько методов, один из которых при генерации не дает забыть исходный кадр нейровидео.
🔫 При этом расширенная часть клипа будет наполнена «экшеном», тогда как конкуренты зачастую выдают статичную картинку, утверждают создатели.
Разработчики отмечают, что улучшения в базовой модели приводят к более эффективным результатам Streaming T2V.
📆 Код и демо обещают позже.
Недавно мы рассказывали еще об одном методе оптимизации работы нейросетей.
Streaming T2V — это авторегрессионная техника, которая позволяет увеличить продолжительность сгенерированного Text-to-Video нейросетью клипа с нескольких секунд до 2-х минут и даже дольше.
🔮 Авторегрессионная техника означает, что метод учитывает предыдущую информацию (в данном случае — сгенерированное видео), чтобы «предсказать», что будет происходить дальше.
Важно, что Streaming T2V при этом сохраняет консистентность видео, его детали, фреймрейт и старается как можно ближе следовать изначальному промпту.
Разработчики отмечают, что улучшения в базовой модели приводят к более эффективным результатам Streaming T2V.
📆 Код и демо обещают позже.
Недавно мы рассказывали еще об одном методе оптимизации работы нейросетей.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤔1
Но это пока что мало кого волнует.
Как пишет Wall Street Journal со ссылкой на данные венчурного фонда Sequoia, за прошлый год индустрия потратила на чипы от Nvidia $50 млрд. Выручка ИИ-компаний при этом составила всего лишь $3 млрд.
💭 Часть экспертов считает, что такие цифры могут говорить о растущем на рынке пузыре.
🖥 Отрезвляющая статистика по затратам ИИ-стартапов и их выручке вряд ли что-то изменит в ближайшее время. Например, Microsoft уже собирается построить для OpenAI суперкомпьютер ценой около $100 млрд — это приблизительно в 100 раз больше стоимости самого мощного современного дата-центра.
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡3🔥3🤔2👍1
Китайская компания в последнее время чуть ли не каждую неделю выпускает генеративные инструменты.
🆕 Знакомьтесь, AniPortrait — фреймворк для генерации анимированных аватаров из портрета и аудио или видео.
Называется это Audio Driven, Self Driven и Face Reenactment — см. картинку выше.
💪 Разработчики утверждают, что по сравнению с многочисленными конкурентами, появившимися в последнее время, AniPortrait особенно хорошо удается липсинк и естественные движения аватара.
Код здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
В Stable Audio 2.0, в отличие от предшественника, теперь можно:
⏱ Генерировать треки продолжительностью до трех минут в высоком качестве;
🎷 Быстро менять музыкальный стиль генерации;
Suno пока может спать спокойно — создать полноценный трек с вокалом и текстом Stable Audio не может. А учитывая непростую ситуацию в Stability AI, пока непонятно — как стартап будет дальше развивать свои модели.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
Желание Илона Маска создать чат-бот, который сможет говорить с пользователем на любые темы, оказалось палкой о двух концах.
💣 Как выяснили исследователи из компании Adversa AI, не особо стараясь Grok можно убедить рассказать, как изготовить бомбу, угнать автомобиль или совратить несовершеннолетнего.
👩🔬 Исследователи рассказали, что у Grok ожидаемо отсутствуют любые фильтры на запросы, которые другие чат-боты считают неприемлемыми. При этом фильтры на экстремально неприемлемые запросы (типа перечисленных в предыдущем абзаце) легко обойти.
📊 Grok в исследовании показал себя хуже всех, но Le Chat от французского стартапа Mistral AI выступил немногим лучше (о его уязвимости мы уже писали). Не удалось взломать только Llama, а остальные чат-боты попались хотя бы на один джейлбрейк.
Не стоит думать, что Llama действительно невозможно взломать — такие методы существуют. Но те техники, которые использовали Adversa AI, не сработали.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤔2
Создатели ChatGPT клонируют голоса, YouTube борется со скучными видео, Google будет брать деньги за поиск — и другие важные новости за неделю
✅ Власти США обязали каждое федеральное ведомство в стране ввести должность главного по искусственному интеллекту (Chief AI Officer). На своей должности специалисты будут выступать в роли советчиков по инициативам, связанным с искусственным интеллектом, отслеживать и документировать случаи использования ИИ внутри ведомства и оценивать риски от использования ИИ;
✅ OpenAI продемонстрировал свою нейросеть для клонирования голоса Voice Engine. Модели нужно 15 секунд аудио, чтобы создать идентичный голос. Нейросеть сохраняет все особенности речи говорящего даже при переводе на другой язык. Когда Voice Engine переводит, скажем, французскую речь на английский, то у говорящего появляется характерный акцент. Стартап также видит возможности медицинского использования. О выпуске модели в публичный доступ речи пока не идет — OpenAI опасаются случаев недобросовестного использования их разработки;
✅ На этой неделе OpenAI также открыл доступ к GPT-3,5 Turbo без регистрации. За доступ без личных данных придется смириться с ограничениями: LLM не будет отвечать на некоторые вопросы и сохранять историю переписки с пользователями. Свободный доступ к GPT-3,5 будут постепенно добавлять в новые регионы;
✅ С помощью ИИ YouTube тестирует функцию перемотки «скучных» моментов видео. А с помощью ML-алгоритмов ролики анализируют на самые просматриваемые моменты и предлагают пользователю остановиться только на них. Функция Jump Ahead пока доступна только некоторым платным подписчикам в США и не на всех видео;
✅ Больше 200 музыкантов подписали открытое письмо к разработчикам ИИ-моделей с требованием прекратить нарушать их права в качестве артистов. Конкретно, музыкантов волнует практика клонирования голосов и использование ИИ, чтобы не платить им роялти. Подписанты требуют от музыкальных сервисов взять на себя обязательство не использовать музыкальные нейросети. Среди тех, кто поддержал требования: Билли Айлиш, Кэти Перри, Ники Минаж, Стиви Уандер и другие;
✅ Сбер выпустил в ограниченный доступ новую версию нейросети Kandinsky. Версия 3.1 работает быстрее предыдущей в 20 раз; умеет автоматически «бьютифицировать» изображение, дополняя пользовательский промпт; генерирует изображения в 4К и др. Когда Kandinsky станет доступен всем, пока не уточняется;
✅ Google рассматривает возможность брать с пользователей отдельную плату за ИИ-функции в поисковике. Пэйвол находится в разработке, но финального решения по его использованию нет, как и подробностей о том, о каких функциях идет речь. Тем не менее Google уже сейчас не рассматривает возможность отключения рекламы для тех, кто заплатил за премиум-версию поисковика;
✅ И еще одна новость из мира поисковиков: сервис Perplexity собирается продавать рекламу в своем ИИ-поисковике. Рекламные сообщения должны появиться в подборке вопросов по теме, которые сервис предлагает пользователю;
✅ Газпром-Медиа Холдинг третий год подряд выступит генеральным медиапартнером ПМЭФ. D.lab, как часть холдинга, планирует принять участие в форуме вместе с коллегами из других активов.
✅ Власти США обязали каждое федеральное ведомство в стране ввести должность главного по искусственному интеллекту (Chief AI Officer). На своей должности специалисты будут выступать в роли советчиков по инициативам, связанным с искусственным интеллектом, отслеживать и документировать случаи использования ИИ внутри ведомства и оценивать риски от использования ИИ;
✅ OpenAI продемонстрировал свою нейросеть для клонирования голоса Voice Engine. Модели нужно 15 секунд аудио, чтобы создать идентичный голос. Нейросеть сохраняет все особенности речи говорящего даже при переводе на другой язык. Когда Voice Engine переводит, скажем, французскую речь на английский, то у говорящего появляется характерный акцент. Стартап также видит возможности медицинского использования. О выпуске модели в публичный доступ речи пока не идет — OpenAI опасаются случаев недобросовестного использования их разработки;
✅ На этой неделе OpenAI также открыл доступ к GPT-3,5 Turbo без регистрации. За доступ без личных данных придется смириться с ограничениями: LLM не будет отвечать на некоторые вопросы и сохранять историю переписки с пользователями. Свободный доступ к GPT-3,5 будут постепенно добавлять в новые регионы;
✅ С помощью ИИ YouTube тестирует функцию перемотки «скучных» моментов видео. А с помощью ML-алгоритмов ролики анализируют на самые просматриваемые моменты и предлагают пользователю остановиться только на них. Функция Jump Ahead пока доступна только некоторым платным подписчикам в США и не на всех видео;
✅ Больше 200 музыкантов подписали открытое письмо к разработчикам ИИ-моделей с требованием прекратить нарушать их права в качестве артистов. Конкретно, музыкантов волнует практика клонирования голосов и использование ИИ, чтобы не платить им роялти. Подписанты требуют от музыкальных сервисов взять на себя обязательство не использовать музыкальные нейросети. Среди тех, кто поддержал требования: Билли Айлиш, Кэти Перри, Ники Минаж, Стиви Уандер и другие;
✅ Сбер выпустил в ограниченный доступ новую версию нейросети Kandinsky. Версия 3.1 работает быстрее предыдущей в 20 раз; умеет автоматически «бьютифицировать» изображение, дополняя пользовательский промпт; генерирует изображения в 4К и др. Когда Kandinsky станет доступен всем, пока не уточняется;
✅ Google рассматривает возможность брать с пользователей отдельную плату за ИИ-функции в поисковике. Пэйвол находится в разработке, но финального решения по его использованию нет, как и подробностей о том, о каких функциях идет речь. Тем не менее Google уже сейчас не рассматривает возможность отключения рекламы для тех, кто заплатил за премиум-версию поисковика;
✅ И еще одна новость из мира поисковиков: сервис Perplexity собирается продавать рекламу в своем ИИ-поисковике. Рекламные сообщения должны появиться в подборке вопросов по теме, которые сервис предлагает пользователю;
✅ Газпром-Медиа Холдинг третий год подряд выступит генеральным медиапартнером ПМЭФ. D.lab, как часть холдинга, планирует принять участие в форуме вместе с коллегами из других активов.
👍2
Нил Моган
🎞 YouTube пригрозил OpenAI за использование видео с платформы
CEO видеохостинга Нил Моган заявил, что использование видео, размещенных на платформе, для обучения ИИ-моделей, нарушает правила YouTube.
💬 Так Моган отреагировал на недавнее интервью технического директора OpenAI Миры Мурати. В нем она заявила, что видеомодель Sora обучалась на клипах, находящихся в открытом доступе, — возможно, и на тех, которые опубликованы на YouTube.
🚫 По словам Могана, в правилах использования хостинга четко прописано, что контент с YouTube нельзя использовать для сторонних сервисов. Имеются в виду не только сами видео, но и их текстовые расшифровки.
Мурати в своем интервью не сказала точно, откуда были взяты видео, на которых обучалась Sora.
📋 В материале New York Times (NYT), вышедшем уже после слов Могана, утверждается, что OpenAI использовали «миллионы часов» видео на YouTube в виде текстовых расшифровок для обучения GPT-4. Стартап пошел на этот шаг, так как якобы исчерпал все подходящие для обучения LLM источники англоязычных текстов. Sora в материале не упоминается.
©️ При этом Google, который владеет YouTube, сам использовал контент, размещенный на видеохостинге, для обучения ИИ. Как пишет NYT, это также может нарушать копирайт авторов видео.
CEO видеохостинга Нил Моган заявил, что использование видео, размещенных на платформе, для обучения ИИ-моделей, нарушает правила YouTube.
🚫 По словам Могана, в правилах использования хостинга четко прописано, что контент с YouTube нельзя использовать для сторонних сервисов. Имеются в виду не только сами видео, но и их текстовые расшифровки.
Мурати в своем интервью не сказала точно, откуда были взяты видео, на которых обучалась Sora.
📋 В материале New York Times (NYT), вышедшем уже после слов Могана, утверждается, что OpenAI использовали «миллионы часов» видео на YouTube в виде текстовых расшифровок для обучения GPT-4. Стартап пошел на этот шаг, так как якобы исчерпал все подходящие для обучения LLM источники англоязычных текстов. Sora в материале не упоминается.
©️ При этом Google, который владеет YouTube, сам использовал контент, размещенный на видеохостинге, для обучения ИИ. Как пишет NYT, это также может нарушать копирайт авторов видео.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4
StableDrag от Tencent — следующая ступень в развитии инструментов для редактирования со словом Drag в названии. Мы уже рассказывали про DragGAN, а были еще FreeDrag, DragDiffusion и другие.
👍 Так, StableDrag умеет самостоятельно оценивать качество редактирования, и если оно становится слишком низким, то фреймворк сбрасывает изменения и возвращается к исходному изображению.
🤷♀️ Код StableDrag и подробный Research Paper придется подождать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2🤔1
Дело не в успехах OpenAI, просто Альтман — еще и талантливый инвестор. Forbes пишет, что у Альтмана есть целый «лабиринт» холдингов, через которые он вкладывает деньги.
📆 Первые инвестиции он сделал еще в 2010 году, когда ему было 25. А в 2012 году он продал мобильное приложение Loopt за $43 млн и вложил часть в венчурный фонд Hydrazine Capital, запущенный им в том же году.
💼 В том же 2014-м Альтман стал президентом венчурного фонда Y Combinator (он также был одним из его основателей). Он проработал на должности 5 лет, существенно расширив инвестиционный портфель фонда.
💬 Альтман не прекратил инвестировать и уйдя из Y Combinator в OpenAI в 2019 году. В 2020 году он вместе с братом запустил фонд Apollo Projects, где был советником.
🆕 Альтман через фонды и лично имеет долю в Reddit на общую сумму в $580 млн. Из этой суммы 14% — личные средства главы OpenAI.
🏚 Также он зарабатывает на недвижимости на Гавайях и в Калифорнии общей стоимостью $90 млн.
🤔 Что касается OpenAI, то, как утверждается публично, Альтман не получает денег от работы в стартапе. Эксперты относятся к таким заявлениям скептически. Возможно, именно успех OpenAI позволил Альтману вложить гигантские суммы в Helion и Retro Biosciences.
🧠 Forbes описывает инвестиционную стратегию Альтмана так: небольшие по сумме, но многочисленные инвестиции в рискованные проекты и несколько крупных инвестиций, на которые приходятся основные деньги. Сам Альтман говорит, что ему удается находить талантливых людей, о которых никто не слышал
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2⚡2🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🎮 Dyson геймифицировал уборку пылесосом
Помните, как пользователь твиттера превратил уборку пылесосом в игру?
🤔 Кажется, вирусный ролик увидел кто-то в компании Dyson и решил украсть позаимствовать идею. Новая функция получила название CleanTrace.
☎️ Версия Dyson получилась менее элегантной, но более практичной — если в твиттере для AR-уборки использовали хедсет Oculus Quest, то для CleanTrace понадобится смартфон, прикрепленный к пылесосу.
💵 Функция будет доступна в июне пользователям пылесоса Gen5Detect, стоимостью почти $1000. Quest, если что, стоит почти в 4 раза дешевле.
Помните, как пользователь твиттера превратил уборку пылесосом в игру?
☎️ Версия Dyson получилась менее элегантной, но более практичной — если в твиттере для AR-уборки использовали хедсет Oculus Quest, то для CleanTrace понадобится смартфон, прикрепленный к пылесосу.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2
This media is not supported in your browser
VIEW IN TELEGRAM
©️Разработчики отмечают, что в промпте можно прямо написать в стиле какого исполнителя должен быть исполнен трек. Но нейросеть якобы не будет копировать чужой вокал, а каким-то образом подберет похожий вариант.
🤔 При этом те, кто попробовал модель, пишут, что синтетический вокал не отличить от оригинала.
🤷♀️ На момент написания текста, сайт был перегружен.
*Instagram входит в Meta — организацию, запрещенную на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3🤔2
Именно этого всем нам не хватает, посчитали исследователи из университетов Сингапура, Китая и США, и придумали MagicTime.
Также авторы прикрутили к MagicTime специальный кодировщик, который позволяет нейросети лучше справляться с «метаморфическими промптами» — текстовыми подсказками, в которых контретно дано указание на генерацию таймлапса.
📆 Разработчики считают, что в будущем MagicTime можно будет использовать для симуляции трансформации предметов с заданными физическими параметрами.
Код здесь. Демо можно потестировать тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
Соцсеть ведет переговоры с рекламодателями о перспективах использования сгенерированных нейросетью аватаров, которые будут продвигать их продукцию.
🏪 Продавцы, которые продают свои товары на маркетплейсе TikTok Shop, тоже смогут использовать ИИ.
🧪 TikTok не первый, кто пытается найти рекламное применение нейросетям с помощью виртуальных инфлюенсеров. Пока все эти кейсы больше похожи на эксперименты.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1