D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
Midjourney теперь только платный, Disney больше не разрабатывает метавселенную, мировой ВВП вырастет на $7 трлн благодаря ИИ — и другие важные новости за неделю

Итальянский регулятор заблокировал доступ к ChatGPT в стране, потому что сервис нарушил законы, касающиеся использования личной информации, и не запрашивал возраст пользователя. У OpenAI есть 20 дней, чтобы все исправить;

Midjourney отказался от бесплатного периода для новых пользователей нейросети, после того как сгенерированные изображения ареста Дональда Трампа и папы Римского в модном пуховике произвели фурор в интернете. Правда, разработчики говорят, что картинки тут ни при чем — просто пользователей стало слишком много;

Специалисты из Goldman Sachs подсчитали, что использование ИИ прибавит к мировому ВВП около 7% за 10 лет — это около $7 трлн;

В Disney под сокращение попала команда, занимавшаяся метавселенной. Без работы остались около 50 человек. Подразделение просуществовало чуть больше года;

Google перепрофилирует команду, которая занималась разработкой виртуального помощника Google Ассистент. Теперь основную часть времени сотрудники будут работать над чат-ботом Bard;

В игры на Netflix скоро можно будет играть на телевизоре, используя айфон как геймпад;

Apple купил стартап WaveOne, который разрабатывает решения для сжатия видео с помощью ИИ-алгоритмов. Возможно, технологию будут использовать в работе стримингового сервиса Apple TV+;

Разработчик из России выпустил приложение «Курсор», полностью созданное ChatGPT;

Zoom добавит в сервис новые ИИ-возможности. Например, если вы опоздали на созвон, то искусственный интеллект перескажет, что вы пропустили;

Браузер Opera тоже оснастят искусственным интеллектом: он сможет генерировать посты для соцсетей и расскажет, что из себя представляет сайт, на который вы зашли;

Создатели Stable Diffusion представили новую модель Animai, которая создает анимацию из одного изображения.
👍121🔥1
🔥 Самые запоминающиеся ролики от генератора проклятых видео ModelScope 🔥

В конце марта на Hugging Face появился построенный на диффузионной модели text2video-генератор ModelScope, разработанный одним из подразделений китайского техгиганта Alibaba. Модель не назовешь революционной (до Gen-2 ей еще очень далеко), но генерируемые ей короткие клипы оказались настолько сюрреалистичными, что моментально превратились в мемы 💬.

Все началось с Уилла Смита, поедающего лапшу, а дальше полет фантазии было не остановить — некоторые пользователи даже пытались рассказать полноценные истории, добавляя закадровый голос и объединяя десятки двухсекундных роликов в 1 видео. Мы собрали самые… запоминающиеся генерации 😱.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6😁3
Создатель Википедии не прочь поручить написание статей нейросетям ✍️

Но с некоторыми оговорками. Об этом Джимми Уэйлс рассказал в интервью британской газете Evening Standard.

По его словам, пока речи об этом не идет, так как сегодняшние ИИ-модели недостаточно хороши, потому что любят выдумывать информацию. Уэйлс считает, что до момента, когда чат-бот можно будет просто попросить написать статью для онлайн-энциклопедии, еще далеко 📆.

«Но я не знаю, насколько далеко. Точно ближе, чем я мог бы себе представить еще 2 года назад», — отметил он 🤔.

Более реалистичным в обозримом будущем Уэйлс считает вариант, когда ИИ будет помогать в написании статей. Например, проверять нет ли в двух текстах утверждений, противоречащих друг другу.

🤝 Но самым перспективным Уэйлс считает использование ИИ для поиска вещей, о которых еще нет статей в Википедии. Он предполагает, что благодаря ИИ объем контента на ресурсе мог бы вырасти в 3 раза, при этом бюджет на работу Википедии вырос бы не более чем на £1 000.

Редакторы Википедии предлагали еще один вариант использования ChatGPT для экономии времени: чат-бот мог бы писать черновик статьи на заданную тему, а затем редактор-человек его бы дорабатывал 🔨.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
🎙 Вот что ИИ животворящий делает: платформа, которая озвучит видео вашим голосом на 30+ языках

🛠 Rask AI позиционирует себя как ультимативный сервис для работы с озвучкой и переводом видео с помощью ИИ. Например, программа может создать синтетическую версию вашего голоса и воспроизвести его на одном из нескольких десятков поддерживаемых языков.

Целевая аудитория Rask AI — видеоблогеры и другие контентмейкеры, которые хотят увеличить охват за счет международной аудитории 🪐.

👥 Rask AI качественно справляется с задачей, даже если на видео несколько человек. «Иван Васильевич» с английской озвучкой, например, звучит очень убедительно, хотя и с некоторыми оговорками (за видео спасибо коллегам). Программа также умеет автоматически создавать субтитры. В будущем разработчики обещают добавить липсинк и закадровый голос.

На сайте проекта можно потестировать сервис, загружая свои видео 🫡.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍1
⚠️ Стэнфорд выпустил 400-страничный отчет о настоящем и будущем ИИ. Главное из текста

📊 Впервые за 10 лет частные инвестиции в ИИ сократились. В период между 2021 и 2022 годом инвестиции в искусственный интеллект сократились почти на 27%. Можно предположить, что это связано с концентрацией рынка ИИ: крупные инвестиции идут меньшему количеству игроков. При этом инвестиции в ИИ в 2022 году по сравнению с 2013 годом выросли в 18 раз.

💲 Компании, использующие ИИ, смогли сократить расходы и увеличить выручку. Алгоритмы помогли сэкономить на управлении цепочками поставок и рисками, на сервисных операциях, а также в области корпоративных финансов. ИИ также помог повысить продажи и скорость разработки продуктов.

😎 Разработкой ИИ теперь занимаются компании, а не институты. Вплоть до 2014 года разработкой ИИ-моделей занимались ученые, теперь эта роль практически полностью принадлежит коммерческим компаниям. В 2022 году институты выпустили всего 3 серьезные ML-модели, а различные компании — 32. У институтов просто нет таких бюджетов, которые есть на технологическом рынке.

🚫 Количество случаев, когда ИИ используется не по назначению, серьезно выросло. Речь идет о дипфейках или, например, о незаконной слежке. С 2012 года число подобных случаев выросло в 26 раз. Очевидно, что это не предел, ведь темпы эволюции алгоритмов резко ускорились в последние 2–3 года.

📃 Количество принятых законов, касающихся ИИ, выросло в десятки раз. Если в 2016 году был принят лишь 1 закон, где упоминался искусственный интеллект, то в 2022 году — уже 37. Количество упоминаний ИИ в законотворческой деятельности 81 страны за этот же срок увеличилось в 6,5 раза.

🇨🇳 Больше всего развитию ИИ рады в Китае. 78% граждан КНР считают, что в использовании ИИ больше плюсов, чем минусов. За ними идут Саудовская Аравия (76%) и Индия (71%). В США так считают только 35%.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍41
This media is not supported in your browser
VIEW IN TELEGRAM
Плагин, который позволяет использовать NeRF-модели с Unreal Engine 5

Расширение выпустил стартап Luma AI. Плагин позволяет использовать NeRF-модель компании с последней версией графического движка Unreal 🧡. То есть вы можете создать 3D-объект с помощью нерфа, а затем перенести его в Unreal. При этом фишки движка (например, продвинутое освещение) будут корректно взаимодействовать с импортированным предметом 👏.

Если вдруг забыли, что из себя представляет NeRF — это модель, которая создает 3D-объект из 2D-изображений. При этом в качестве изображений могут выступать фото, снятые на обычный смартфон.

Плагин пригодится, в частности, при разработке игр и другого графического контента, а также для работы с VR, если у вас достаточно мощный компьютер 😼.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍2😱2
This media is not supported in your browser
VIEW IN TELEGRAM
📣 Умная платформа, которая возьмет создание аудиорекламы на себя

Creative Studio от стартапа Adthos может написать сценарий для рекламы, добавить музыку, голос и звуковые эффекты. На выходе разработчики обещают полностью готовый продукт, который пользователь может по желанию отредактировать. Текст рекламы можно еще и привязать к локации, где она потом будет звучать 📌

Под капотом сервиса находится GPT-4, а также библиотека из сотен синтетических голосов, некоторые из которых сгенерированы из голосов знаменитых актеров. Актеры, как утверждается, в курсе и участвовали в проекте на коммерческой основе 🤑.

В Adthos подчеркивают, что их платформа — спасение для небольших компаний, которые за несколько минут получат качественную рекламу. На сайте компании можно подписаться на пробный 30-дневный период. Стоимость подписки начинается от $50 в месяц.

Кстати, в Adthos признают, что в случае успеха их платформа и те, что появятся в будущем, могут отобрать работу у сегодняшних профессионалов. Но особой проблемы в этом стартап не видит, ведь те, кто научатся работать с ИИ, «повысят свою продуктивность и будут процветать» 🤷‍♀️.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Сотрудники Samsung сливают корпоративные секреты ChatGPT, ИИ обеспечит человечеству сокращенную рабочую неделю, создатели Stable Diffusion задумались об IPO — и другие важные новости за неделю

Яндекс выпустил бета-версию генеративной нейросети Шедеврум. Модель доступна в виде мобильного приложения для iOS и Android, которое больше похоже на соцсеть. Чтобы генерировать свои картинки, а не только любоваться чужими, придется записаться в вейтлист;

Глава компании Metaphysic, который прославился реалистичным дипфейками Тома Круза, решил закопирайтить свой ИИ-образ. Так Том Грэхэм намерен бороться с созданием дипфейков без согласия, кхм, владельца лица;

Сотрудники Samsung сливали засекреченную информацию ChatGPT: просили чат-бот поправить ошибки в программном коде, а также загружали записи с закрытой корпоративной встречи, чтобы сделать презентацию. Компания ограничила доступ к чат-боту, но конфиденциальную информацию уже не вернешь;

Крупнейшая американская ритейл-сеть Walmart работает над интеграцией GPT-4 в существующие и находящиеся в разработке сервисы. Например, языковую модель могут добавить в веб-сервис Text to Shop, который позволяет добавлять товары в корзину, набирая текст или используя голос;

Нобелевский лауреат Кристофер Писсаридес считает, что искусственный интеллект поможет человечеству перейти на четырехдневную рабочую неделю, взяв на себя всю рутинную работу;

Нейросеть Midjourney теперь умеет создавать промпты по загруженному изображению;

Microsoft сообщил, что сервис для генерации изображений Image Creator стал общедоступным. На самом деле, доступ открывают постепенно, в некоторых регионах он пока не работает. Проверяйте здесь;

Газпром-Медиа запустил сервис Video Tagging System (VTS) для распознавания видеоконтента, предметов на видео, голоса, лиц и т. д. Разработчики говорят, что VTS, например, позволяет ускорить процесс создания промороликов в 20 раз;

Создатели Stable Diffusion размышляют о выходе компании на биржу. Stability AI может провести IPO в ближайшие несколько лет.
👍7
Приложение, которое уложит ребенка спать с помощью Midjourney и GPT-4 💤

Oscar сгенерирует сказку по вводным данным от пользователя: кто будут главные персонажи, какими будут общие детали сюжета, и какой урок должен вынести для себя ребенок в финале сказки (например, «подумай, прежде чем действовать» или «научись прощать») ☝️.

На создание сказки с иллюстрациями от Midjourney у приложения уйдет до двух минут. В последнем обновлении разработчики добавили поддержку GPT-4, которая отвечает за сюжет. Иллюстрации, судя по всему, не генерируются для каждой истории, а используются из заранее созданного набора.

Сказку можно сохранить, чтобы рассказать еще раз потом, а для генерации новых историй нужно покупать монеты. На 1 монету можно сгенерировать 1 историю. 5 монет стоят ₽199 💸.

‼️ Поддержки русского языка пока нет. Сказки можно сгенерировать на английском, немецком, французском, испанском и итальянском.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
82
Что такое эмоциональный ИИ и где его использует уже сегодня 🙂

Эмоциональный ИИ (иногда его называют аффективными вычислениями) — это подвид искусственного интеллекта, который распознает человеческие эмоции. Для этой задачи используют технологий биометрии, распознавания лиц, обработки естественного языка и так далее.

По свежим прогнозам именно этот сегмент ИИ может вырасти с $37,8 млрд в 2021 году до $620 млрд в 2030 году.

Области применения

🛍 Реклама С помощью алгоритмов эмоционального ИИ компании создают таргетированную рекламу, которая повышает вовлеченность клиента. Одна из главных компаний на этом рынке — Affectiva. Стартап занимается разработкой ПО, которое анализирует мельчайшие изменения в поведении человека и его эмоциональном состоянии.

📞 Колл-центры Тут ИИ используют для анализа работы оператора и удовлетворенности клиента. Например, компания Cogito разработала сервис, который анализирует голос клиента и темы разговора, подсказывая оператору, как лучше себя вести.

😔 Психологическая помощь Некоторые уверены, что ИИ может точнее определить эмоциональное и психическое состояние пациента, чем профессиональный врач. Например, компания Twill разработала платформу Intelligent Healing, которая анализирует состояние человека и может разработать для него персональный курс терапии.

🚜 Автомобилестроение Уже сегодня существуют системы, которые анализируют состояние водителя во время поездки и адаптируются под него. Система компании Harman при первых признаках стресса может включить успокаивающую музыку или изменить настройки освещения, чтобы успокоить водителя.

Минусы при использовании эмоционального ИИ

Основная проблема при использовании подобных алгоритмов заключается в том, насколько они адаптивны. Некачественная модель может не так распознать эмоциональное состояние или мимику человека. Например, известны случаи, когда алгоритмы без видимых причин распознавали пожилого человека за рулем как уставшего. Ошибки алгоритмов могут быть особенно критичны, если говорить о применении в медицине.
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3
«Росомаха», которая вылечит кривую программу с помощью искусственного интеллекта 💊

Программист с ником BioBootloader рассказал в твиттере, что с помощью GPT-4 создал сервис Wolverine. «Росомаха» может поправить программный код, написанный на языке Python, и объяснить, в чем была ошибка программиста 👨‍🏫.

BioBootloader называет работу алгоритма «регенеративными исцеляющими способностями» — по аналогии с суперспособностями, которыми обладал Росомаха из комиксов Marvel.

⛔️ Программист продемонстрировал работу Wolverine на примере виртуального калькулятора, в код которого он намеренно добавлял ошибки.

Wolverine видит ошибки в коде ↪️ обращается к GPT-4 за советом ↪️ языковая модель исправляет ошибки и объясняет, что не так ↪️ исправления автоматически добавляются в программный код ↪️ программа работает. Если же программа все равно не работает, то Wolverine будет искать решение до победного конца!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10
🙉 Universal Music не хочет, чтобы люди слушали сгенерированную ИИ музыку

Universal Music Group (UMG), которая контролирует около трети мирового музыкального рынка, считает, что Spotify, Apple Music и другие, должны блокировать доступ к их музыкальному каталогу для разработчиков ИИ-моделей 🔞.

Объясняют необходимость такого запрета тем, что нейросетки незаконно обучаются на «настоящих» песнях, а потом генерируют треки, похожие на произведения известных исполнителей. Как технически могла бы выглядеть такая блокировка, не уточняется.

🏴‍☠️ Осенью 2022 года с похожей инициативой выступала Американская ассоциация звукозаписывающих компаний (RIAA), которая прямо называла использование защищенной копирайтом музыки для обучения ИИ-моделей пиратством.

Нельзя сказать, что UMG так уж сильно преувеличивает проблему: мы, например, писали про то, как Дэвид Гетта с помощью нейросети добавил в свой трек вокал Эминема. UMG выступает издателем музыки рэпера и недавно заставила удалить с YouTube трек музыканта, полностью созданный с помощью нейросетей 🎧.

В общем, к войне фотографов и художников против ИИ теперь официально присоединился музыкальный бизнес 🎶.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3😱3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Расширение для браузера, которое пользуется интернетом не хуже человека ⌨️ 🌐

HyperWrite работает вместе с Chrome и изначально позиционировался как ассистент для написания текстов различных форматов: постов в блоги, имейлов, статей и т.д. ✏️.

🍕 В новой версии расширения, которая пока доступна только в тестовом режиме, HyperWrite научился серфить в интернете и может, например, самостоятельно заказать пиццу или купить авиабилеты по текстовой подсказке.

То есть теперь HyperWrite становится на одну полку с проектами вроде AutoGPT и BabyAGI — ИИ-агентов, которые могут самостоятельно создавать для себя текстовые подсказки для решения поставленной пользователем задачи 💪.

Создатели расширения не раскрывают, на какой ИИ-модели работает HyperWrite, но говорят, что она «похожа на ChatGPT».

Публично обновленное расширение обещают выпустить, когда решат все вопросы с безопасностью. Например, как доверить приложению данные банковской карты или сделать так, чтобы программа не купила что-нибудь без вашего ведома 🤑.

Если хотите потестировать ассистента до релиза, то можно записаться здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52