D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Израильский стартап показал платформу для создания реалистичных цифровых аватаров

🧙‍♂️ Creative Reality Studio от компании D-ID объединяет в себе функционал языковой модели GPT-3, нейросети Stable Diffusion и собственных разработок израильского стартапа в области лицевой анимации.

Программу сравнивают с популярным приложением Lensa (которое тоже использует Stable Diffusion), но вместо статичных аватаров Creative Reality Studio создает анимированного «цифрового человека» 🕺.

🗣 Пользователь может выбрать аватар из нескольких вариантов, которые сгенерировала нейросеть, а также его голос и язык, а затем может написать для него поведенческий скрипт или использовать для этих целей GPT-3.

💳 Веб-версию приложения можно потестировать бесплатно в течение двух недель, затем придется платить $5,99 или $49,99 ежемесячно (подписка отличается продолжительностью видео, количеством генераций, а также качеством анимации аватара).
1
Deloitte выбрал технотренды на следующий год

Консалтинговая компания Deloitte выделила шесть технологических трендов, которые будут определяющими в 2023 году.

🟣VR и AR на службе корпораций. VR и AR-технологии постепенно переходят из разряда развлечения для гиков в перспективные корпоративные инструменты. Бизнес начинает понимать, что виртуальные пространства могут со временем заменить имейл-переписку, а также видео и аудиоконференции. Этот рынок может вырасти до $800 млрд уже к 2024 году;

🟣 Выстраивание доверительных отношений с искусственным интеллектом. Ценность ИИ уже никто не оспаривает, но встает вопрос о доверии новым технологиям со стороны простых сотрудников компаний — насколько они могут доверять цифровому алгоритму и логике его действий, чтобы положиться на него, как на коллегу;

🟣 Менеджмент мультиоблачной среды. Развитие облачных технологий привело к тому, что 85% бизнесов пользуются двумя и более облачными платформами, а 25% — минимум пятью. В большинстве случаев эти сервисы не интегрированы друг с другом, что усложняет рабочий процесс. Решением должно стать метаоблако или супероблако, которое объединит все платформы в одной среде;

🟣Новое решение проблемы дефицита IT-кадров. Вместо того, чтобы искать сотрудников на вечно дефицитном IT-рынке, компании должны взращивать необходимые таланты внутри. Это особенно актуально, учитывая, что необходимые скиллы устаревают за 2,5 года;

🟣 Децентрализованная архитектура и блокчейн. Будущее за системами, где право голоса и финального решения принадлежит не одному человеку или организации, а всем участникам системы. В пример можно привести кибербезопасность — гораздо безопаснее хранить личную информацию в системе с децентрализованной архитектурой, чем отдавать ее третьей компании, которую легко могут взломать;

🟣 Эволюция стационарных серверов. Искусственный интеллект и облачные сервисы не заменят привычные сервера, благодаря их вычислительной мощности. Вместо этого произойдет интеграция, которая в итоге повысит эффективность и тех, и других. Как пример, можно привести развитие IoT — такие устройства генерируют огромное количество информации, которую слишком дорого переносить в облако. Тут-то и пригодятся проверенные временем системы.
🤔4
Microsoft запрещает майнинг, Netflix возвращает деньги, Китай борется с нейрокартинками — и другие важные новости за последнюю неделю

В КНР с января 2023 года больше нельзя будет публиковать контент, сгенерированный нейросетью, не отметив его специальной вотермаркой

Словно предугадав китайские нововведения, над своей вотермаркой для синтетического контента работает OpenAI. Ей будут помечать тексты, сгенерированные моделью GPT-3

В VK будет больше Web3. В соцсети появится поддержка NFT и маркетплейс цифровых токенов

А через сервис VK Реклама теперь можно прорекламировать свой сайт с помощью видеоролика

Netflix совсем недавно запустил подписку с рекламой, но уже вынужден возвращать рекламодателям деньги — обещания по просмотрам удалось выполнить лишь на 80%

Microsoft больше не даст майнить криптовалюту, используя облачные сервера компании. Исключение сделают для тех, кто смог получить письменное разрешение
🔥6
🧠 Три богатейших человека в мире инвестировали в мозговые импланты: что ждет технологию?

⌨️ Джефф Безос и Билл Гейтс поучаствовали в инвестраунде стартапа Sychron. Компания разрабатывает мозговой имплант, который должен помочь парализованным людям коммуницировать с внешним миром, управляя компьютером силой мысли.

Суммарно в новом раунде Synchron удалось привлечь $75 млн, а общая сумма инвестиций достигла $145 млн 💵. Таким образом Synchron вошел в тройку самых «дорогих» стартапов, разрабатывающих мозговые импланты. Летом компания впервые имплантировала нейроинтерфейс пациенту из США 🇺🇸.

В топ также входят Neuralink Илона Маска и Science одного из сооснователей Neuralink Макса Ходака. Компания Ходака разрабатывает нейроинтерфейс, который использует для доступа к мозгу зрительный нерв человека 👁. Neuralink же предлагает использовать мозговой имплант не только в медицинских, но и в практических целях — например, контролировать силой мысли мобильные устройства (Маск говорил, что готов поставить имплант и себе).

Из трех компаний только Synchron протестировал свое изобретение на человеке. Science планирует сделать это в течение года-двух, Neuralink — в течение полугода. Пока компания Маска может похвастаться только видео, где имплант использует обезьяна, а некоторые считают, что Маск искусственно создал хайп вокруг технологии, которой уже не один десяток лет 🐒.

📆 Как бы там ни было, по прогнозам рынок мозговых имплантов к 2032 году вырастет в 3,5 раза и достигнет $18 млрд. В Synchron считают, что через 15–20 лет нейроинтерфейсы сравняются по количеству установок с кардиостимуляторами.
👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Разработчики Stable Diffusion организовали фестиваль, где покажут только фильмы, созданные ИИ

Стартап Runway (один из разработчиков SD) в феврале в Нью-Йорке проведет AI Film Festival. Сейчас организаторы принимают заявки на участие. Победитель AI Film Festival получит $10 тысяч, еще трое участников — от $3 тысяч до $500 💸.

Чтобы попасть в программу фестиваля, хронометраж фильма должен составлять от одной до десяти минут. Работа должна быть либо полностью сделана с помощью алгоритмов, либо ИИ должен использоваться при ее создании, например, для монтажа.

У Runway есть собственный инструмент для работы с видео — AI Magic Tools — но организаторы не ограничивают участников в выборе инструментов, которые они могут использовать .
🔥3👍2🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
🧞 ИИ-расширение для браузера, которое выполняет любую прихоть пользователя

Начинаем серию постов о самых интересных GPT3-расширениях, которые делают жизнь проще — помогут с проектом в графическом редакторе или напишут за вас почтовую рассылку. Сегодня рассказываем о DoSmth.

DoSmth — это расширение для браузера, которое, по утверждению разработчиков, может выполнять за пользователя множество рутинных задач: разослать резюме на вакансии, найти подходящий отель или просто заказать пиццу 🍕.

Пользователю даже не придется самому двигать мышкой — он просто пишет текстовую подсказку (как запрос в поисковике), модель составит список нужных действий, передаст их боту, а тот на время возьмет на себя управление курсором и клавиатурой ⌨️.

В примере выше, который показала команда, ИИ просят найти через LinkedIn главу Netflix и написать ему «смешной запрос на добавление в контакты, уложившись в 300 знаков».

Пока DoSmth находится в стадии закрытой беты, на сайте проекта можно записаться в очередь на тестирование ✍️.
🔥2👍1
🎄 27 декабря 2022 в 14:00 мск приглашаем на онлайн встречу Метавселенная: почему так много хайпа и где «новые деньги» для медиа?

Спикером выступит Екатерина Филатова: руководитель проектов New Media Lab 123production и AVRA Ассоциации, основатель международного бизнес-форума AVRA Days,
со-автор исследования «Корпоративый метаверс & Антиверс»

Екатерина является экспертом в интерактивных технологиях: AR / VR / Metavers / генеративный контент и с данной презентацией уже выступила в Сколково и Kasperskiy Tech.

За 1 час 14:00-15:00:

🔻 почему Фейсбук так активно драйвит тему Метавселенной;
🔻раскроем замысел Диснея;
🔻обсудим, с какими элементами метавселенной мы сталкиваемся уже сегодня;
🔻когда же ждать настоящей метавселенной.

Запланируйте, пожалуйста, время в своем календаре 📍
👍4👏2
🤖Синхронный синтетический перевод и автоматический пересказ видеовстреч: Microsoft добавил ИИ в Skype и Teams

В видеомессенджере компании появилась функция TruVoice, которая с помощью искусственного интеллекта в реальном времени (но с небольшим отставанием) переводит речь, симулируя голос говорящего. Инструмент реализован с помощью технологий распознавания речи и обработки естественного языка 👅.

Пока TruVoice находится на этапе тестирования и доступен для английского, немецкого, испанского, французского, китайского и еще нескольких языков. Полноценный запуск планируется в ближайшие месяцы.

Еще один сервис, где появился ИИ-функционал, — Teams. Microsoft добавил в тестовом режиме в корпоративную платформу возможность краткого пересказа содержания прошедшей встречи 🗣. Искусственный интеллект анализирует содержание встречи, создает ее текстовую версию, затем выбирает ключевые моменты и пересказывает их. Модель может также разбить запись встречи на главы и отметить моменты, где упоминалось имя пользователя.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Ассистент Железного человека помогает работать с графическим редактором

Продолжаем серию постов о самых интересных GPT3-расширениях. Мы рассказывали про персонального ассистента DoSmth, а сегодня посмотрим, как чат-бот пригодится в работе с графическим редактором.

Энтузиасты интегрировали ChatGPT в 3D-редактор Blender, где для сложных действий с объектами иногда необходимо использовать язык программирования Python. Теперь за пользователя это может сделать чат-бот. 📚.

На видео выше создатели J.A.R.V.I.S. (так звали виртуального дворецкого Тони Старка) показывают пример: с помощью ChatGPT куб перемещают в пространстве, а затем создают еще 100 объектов и располагают их в случайных местах с учетом заданных ограничений. J.A.R.V.I.S. упрощает взаимодействие с интерфейсом программы, и освобождает пользователя от необходимости учить Python 📐.

🎮 ChatGPT поможет и в создании 3D-игры. Например, чат-бот готов подсказать, как реализовать игровую механику на движке UPBGE, интегрированном в Blender.
🔥7👍1
Создатели называют NFT-платформу Revel гибридом Instagram и трейдингового сервиса Robinhood 🧜‍♀️.

Revel позволяет создавать коллекции цифровых токенов из видео, фото и нейроизображений для своих подписчиков 🪙. Для транзакций на платформе есть маркетплейс.

🕹 Экономика соцсети, в теории, будет работать за счет геймификации. Любой пользователь может создать первую коллекцию NFT, но доступ к созданию следующих коллекций получат только те, чьи токены пользовались спросом. В Revel называют такую концепцию Proof of Demand Minting — она должна контролировать инфляцию на платформе 📈.

Подписчик, собравший три NFT одного автора, будет получать бонусы каждый раз, когда автор создает новую коллекцию 🎁. Пока в качестве транзакций речь идет только об обмене токенов на токены, но скоро должна появиться и торговля 🤑.

В Revel считают конкурентами платформы OpenSea, Sorare и Magic Eden, но отмечают, что у них нет важного элемента соцсети👍.

*Instagram входит в Meta — организацию, запрещенную на территории РФ
🔥3
🎶 Круглосуточные тусовщики: энтузиасты запустили нейрорадио, которое работает 24/7

Комьюнити Harmonai и коллектив музыкантов-программистов Dadabots запустили на YouTube круглосуточное радио, музыку для которого генерируют нейросети. Diffusion Radio использует для создания музыки диффузионные модели, созданные Harmonai (например, Dance Diffusion).

По словам авторов, сейчас радио в основном играет треки в стиле EDM (Electronic Dance Music), хип-хоп и метал. Композиции довольно резко прерываются, так как нейросеть генерирует треки продолжительностью 45, 90 или 180 секунд.

Harmonai является частью Stability AI — одних из разработчиков нейросети Stable Diffusion. Dadabots уже запускали похожие проекты в одиночку. Например, они запустили на YouTube канал, где нейросеть несколько недель подряд играла только дэт-метал.

Иллюстрацию для этого поста для нас сгенерировал сервис Lexica Aperture (тексты в канал, пока что, пишет человек ).
🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
📇 Бот для пользователей Twitter, которым надоело писать твиты самостоятельно

Еще один GPT3-плагин в нашей серии постов. Мы уже рассказывали про персонального ассистента DoSmth и расширение для работы с 3D-редактором Blender. Сегодня о боте, который напишет за вас остроумный (или не очень) твит.

TweePT3 интегрируется в интерфейс веб-версии Twitter через расширение для браузера Chrome. Бот предлагает выбрать тему публикации и стиль сообщения: твит может быть под завязку забит эмодзи, содержать призыв к действию, вопрос или популярный мем.

Gizmodo пишет, что отдельные пользователи Twitter уже активно используют GPT3 для генерации твитов. Распознать такие сообщения достаточно легко — несколько синтетических твитов на одну и ту же тему будут очень похожи друг на друга. Так что разработчикам еще есть к чему стремиться, а Илон Маск, который объявил ботам войну, пока что может спать спокойно.
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI выпустил Point-E — аналог Dall-E, но для 3D-объектов

Главное отличие Point-E от конкурентов — скорость работы 🏃‍♂️. Там, где аналогам вроде DreamFusion от Google или Magic3D от Nvidia на создание трехмерного объекта по текстовой подсказке требуется минимум час, у Point-E уходит несколько минут.

Нейросеть также гораздо менее требовательна к ресурсам, чем конкуренты, но при этом способна понимать сложные текстовые подсказки.

Платить за скорость приходится качеством сгенерированных объектов — пока что они выглядят как пришельцы из середины 90-х 📺
🔥3
Nvidia показала новую версию нейросети для быстрого создания 3D-графики из 2D-изображений

А вот и еще один пример использования нейросетей для создания 3D, но уже от Nvidia.

Компания представила новую версию технологии Instant NeRF — нейросети, которые могут создать трехмерную графику на основе 2D-изображений, тратя на это минимальное количество ресурсов и времени 🤏.

Если прошлые версии алгоритма быстро справлялись с работой, но требовали серьезных вычислительных мощностей, то в новой версии, как утверждают Nvidia, NeRF требует в 60 раз меньше информации для создания полноценной 3D-графики 😱.

В примере из презентации модель Нотр-Дам-де-Пари, за счет оптимизации ресурсов в новой версии Instant NeRF, «весит» всего 250 кб против 15,2 мб в прошлой версии, передавая при этом всю архитектурную сложность первоисточника 🏰.
🔥4
🦩DeepMind показал новые возможности конкурента ChatGPT

Принадлежащая Google британская компания DeepMind показала новые возможности мультимодальной ИИ-модели Flamingo, впервые представленной весной. В отличие от своего главного конкурента — ChatGPT — Flamingo может различать отдельные предметы на изображении и объяснять, что это.

Один из сотрудников DeepMind в качестве доказательства выложил у себя в твиттере диалог с Flamingo 🗣. Сначала чат-боту показывают фото пресса для картофеля. Flamingo говорит, что это кухонный предмет, но ошибается с его назначением и называет его ножом для колки льда. После нескольких наводящих вопросов пользователя Flamingo угадывает предмет и развернуто объясняет принцип его действия .

👊 Flamingo может стать одним из ответов на ChatGPT, которого, как утверждают СМИ, в Google считают настоящей угрозой. У компании в разработке также есть свой чат-бот Sparrow и виртуальный ассистент на основе ИИ-модели Lamda.
🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🔎Google начал тестировать поиск информации внутри видео

Инструмент позволяет через поисковую строку, которая находится под видео, искать любую информацию, которая упоминается в ролике.

Пока поиск по видео доступен только в Индии и некоторым пользователям в США. Когда инструмент запустят для всех пользователей, информации нет.

Кстати, недавно мы рассказывали о стартапе TwelveLabs, который получил от инвесторов $12 млн на разработку приложения для поиска внутри видео. Правда, у TwelveLabs более продвинутые алгоритмы, которые умеют выделять в ролике ключевые моменты или даже пересказать его содержание.
👍4
Forbes составил прогнозы развития ИИ на 2023 год — мы выбрали самые интересные

🔍 Веб-поиск изменится больше, чем когда-либо с начала 2000-х. На это повлияет вышедший в конце года ChatGPT и его аналоги. Чтобы революция в поиске состоялась, разработчикам предстоит решить главную проблему — точность информации, которую пока чат-боты обеспечить на 100% не могут.

🧨 Новая версия языковой модели GPT совершит революцию в отрасли. Модель будет обучена на объеме информации на порядок больше, чем сегодняшние аналоги — около 10 трлн токенов (текстовой информации, разбитой на блоки, для простоты обучения модели), что серьезно повлияет на возможности обработки огромного количества информации. Если GPT-4 будет мультимодальной системой (обрабатывать не только текст, но и визуальную информацию), то значение этого релиза будет еще больше.

🤏 Возникнет дефицит информации для обучения нейросетей. По разным оценкам, объем всей информации в мире, на которой можно обучить ИИ-модель составляет 3,2–17,2 трлн токенов. Модель Chincilla от DeepMind уже обучена на объеме информации в 1,4 трлн токенов. Бороться с дефицитом хотят с помощью синтетической информации или использовать как источник информации публичные выступления на значимых мировых ивентах.

💵 Midjourney начнет привлекать инвестиции. Компания пойдет по стопам OpenAI (нейросеть Dall-E), которая уже привлекла от инвесторов около $1 млрд, и Stability AI (создатели Stable Diffusion), в которую вложили $100 млн.

👅 LLMOps — новые MLOps. По аналогии с инструментами и инфраструктурой для машинного обучения (MLOps) появятся полноценные платформы для разработки больших языковых моделей (LLMOps). Стартапы в этой области станут особенно «модными» среди инвесторов.
👍4😱1
💰 Компания OpenAI ожидает пятикратный рост годовой выручки: с $80 млн в 2022 году до $200 млн в 2023-м и $1 млрд в 2024-м.

Сейчас компания зарабатывает от $0,016 за одно сгенерированное изображение и от $0,004 за текст из 750 слов. Цены зависят от качества изображения и языковой модели, которую использовали для генерации текста.

Как именно компания добьется такой выручки неизвестно, так как OpenAI официально не комментирует информацию о заработках. Можно предположить, что заявленных результатов стартап будет добиваться, в частности, расширяя список компаний, которые лицензируют технологии OpenAI.

В конце года компания выпустила новый продукт с большими коммерческими перспективами — чат-бот ChatGPT.
Please open Telegram to view this post
VIEW IN TELEGRAM
ИИ зарегулируют, а нейросетей будут опасаться: TechCrunch рассказал, что будет с искусственным интеллектом в 2023 году

Вчера мы рассказывали, каким видит 2023-й год для рынка ИИ американский журнал Forbes. Сегодня — прогнозы TechCrunch.

👯‍♀️ Приложений для генерации изображений станет еще больше (этому поспособствует успех Lensa), а генеративный ИИ интегрируют в самые разные пользовательские сервисы. В следующем году нейросети станут мейнстримом, что приведет к новым скандалам, связанным с копирайтом и спорным синтетическим контентом.

Авторы чаще будут запрещать нейросетям обучаться на своих работах. Такую возможность обещают создатели Stable Diffusion уже в следующей версии. OpenAI предпочитает платить за использование чужих фото в датасетах, а GitHub отказался от использования чужого программного кода в сервисе Copilot. Таких случаев будет все больше из-за угрозы судебных разбирательств.

🤔 Инвесторы будут осторожничать с вложениями в нейрогенеративные стартапы. Нейросети остаются в категории «work in progress», когда вопросы их регулирования еще не решены, финансовые перспективы не ясны, а производимый контент слишком нестабилен по качеству. Примеры OpenAI (получил от инвесторов $1 млрд) и StabilityAI ($100 млн инвестиций) могут оказаться исключением из правила.

🗝 Рынок Open Source и децентрализованных решений продолжит расти. ИИ-модели с открытым кодом, за которыми стоит сообщество энтузиастов, появились уже в этом году. Можно вспомнить проекты BigScience, EleutherAI, OpenBioML. Растет популярность децентрализованных вычислительных центров, когда пользователи делятся мощностями своих компьютеров для работы больших ИИ-моделей.

☝️ Власти усилят регулирование искусственного интеллекта. В 2023-м чиновники озаботятся созданием юридической базы и стандартов для использования ИИ в таких высокорисковых отраслях, как медицина и банковский сектор. Так, Совет ЕС в начале декабря принял проект закона об искусственном интеллекте (AI Act), который будет регулировать использование ИИ во всех областях кроме военной. Финальная версия закона должна вступить в силу в конце следующего года.
🔥5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🧨 Стартап Runway, о котором мы уже писали, выпустил новый ролик, где показал ИИ-возможности своего видеоредактора. Выглядит завораживающе!

Кстати, все фишки, показанные в видео, можно бесплатно попробовать в веб-версии программы 😱.
👍2😱2