D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
👥 Стартап создаcт неотличимый от человека аватар из короткого видео

Американская компания HeyGen показала результат работы своего сервиса по генерации цифровых аватаров. И это впечатляет 😮.

Joshua Avatar 2.0 (назван так в честь основателя компании Джошуа Ксу) детально повторяет мимику человека, интонации голоса, акцент и т. д. 🙂

🤏⌚️ Утверждается, что для создания ультрареалистичного аватара нужно всего 2 минуты видео с человеком.

Вот тут можно записаться в очередь, чтобы попробовать сервис. За это в качестве бонуса Джошуа Ксу обещает выслать на имейл персонализированное видео от своего аватара 🤩.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
PlayHT 2.0: Text-to-Voice-модель с вероятностью 97% убедит вас, что она — человек 🧍‍♀️

💬 Основная задача PlayHT — быстрая генерация реалистичных диалогов, в которых между фразами «спикеров» нет раздражающей задержки, как у многих аналогичных решений. Разработчики говорят, что в 97% случаев сгенерированные синтетические голоса невозможно отличить от человеческих.

PlayHT 2.0 способна озвучить текст в реальном времени менее чем за секунду, а также без дополнительной настройки за 3 секунды клонировать голос.

🗣 Чтобы добиться таких результатов, разработчики по сравнению с версией 1.0 увеличили датасет для обучения до 1 млн часов диалогов на разных языках, с разными акцентами. Сама модель стала больше в 10 раз. Как и прошлая версия PlayHT 2.0 поддерживает почти 200 языков, включая русский.

Пока можно записаться на тестирование беты сервиса.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9
Искусственный интеллект узнает по стуку клавиш, что вы печатаете; Zoom хотел обучать ИИ на информации пользователей, создатели SD выпустили нейросеть для генерации кода — и другие важные новости за неделю

Zoom обновил правила использования сервиса, после чего там появился пункт об использовании информации пользователей для обучения своих ИИ-алгоритмов. Без возможности отказаться. После мини-скандала компания изменила правила еще раз и теперь можно отказаться помогать ИИ;

В поисковик Google интегрировали ИИ, который будет проверять поисковый запрос на ошибки, в том числе и смысловые. Если алгоритм найдет ошибку или поймет, что запрос составлен некорректно, то предложит варианты исправлений. Пока функция, судя по всему, работает не во всех регионах;

OpenAI запустили GPTbot, который будет индексировать содержимое сайтов по всему интернету, за исключением контента под пейволом и личной информации. Информацию будут использовать для улучшения будущих версий языковой модели GPT;

Разработчики Stable Diffusion запустили LLM для генерации кода. Stable Code существует в 3-х версиях и поддерживает 7 языков программирования, включая Python, C++, JavaScript;

Nvidia объявила о поддержке нового сервиса Training Cluster as a Service от Hugging Face, который создан для обучения ИИ-моделей. Через Training Cluster можно будет получить доступ к DGX — облачному суперкомпьютеру Nvidia. Подписка на DGX отдельно стоит $37 тыс. в месяц. Training Cluster должен запуститься в ближайшие месяцы;

Disney организовал оперативную группу, которая будет изучать возможности использования ИИ в бизнесах компании. Речь идет не только о производстве фильмов и мультиков, но и о парках развлечений, рекламе и телевидении;

Исследователи из Великобритании утверждают, что им удалось создать ИИ, который по звуку нажатия клавиш может с 93% точностью определить, что именно печатает человек. Для работы алгоритму достаточно аудиозаписи созвона в Zoom;

Huawei прикрутили генеративный ИИ к своему голосовому помощнику Celia. Ни Apple, ни Google этим пока похвастаться не могут. Теперь Celia работает в связке с LLM Pangu собственной разработки компании;

Amazon удалил с платформы книги, сгенерированные нейросетью, но опубликованные под именем реального автора. Писательница Джейн Фридман рассказала, что Amazon сначала отказывался удалять книги, но после того, как за нее вступилась Гильдия авторов США, сдался;

Стартап по созданию чипов, заточенных под работу ИИ-моделей, Tenstorrent получил $100 млн инвестиций от Hyundai и Samsung. Hyundai собирается совместно с компанией разрабатывать процессоры для роботов и машин, Samsung пока просто вложил в стартап деньги.
👍61
Тысячеликий герой: LLM, которая взаимодействует с 16 тыс. API

ToolLLaMA построена на основе LLM с открытым кодом LLaMA, дополнительно обученной на синтетическом датасете Tool Bench 🎒.

После того, как ToolLLaMA донастроили с помощью Tool Bench, модель научилась обращаться к более чем 16 тысячам API, выбирая один или несколько нужных в зависимости от запроса.

На практике это означает, что вы можете в одном запросе попросить у модели:

1️⃣ посоветовать вам фильм

2️⃣ найти кинотеатр, где он идет

3️⃣ предложить ресторан, где можно перекусить после просмотра.

ToolLLaMA обратится к нужным API и даст ответ 💬.

📑 Датасет Tool Bench можно описать, как огромный набор инструкций, сгенерированных с помощью ChatGPT, для взаимодействия с API, хранящимися на сайте RapidAPI.

ToolLLaMA даже способна работать с интерфейсами, которые встречает первый раз, просто прочитав их документацию 😱.

Демо и код модели можно найти на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
👷‍♂️ Стартап, который сдает в аренду ИИ-работников, получил $2 млн

11xAI предлагает небольшим компаниям нанимать ИИ-модели, которые возьмут рутинную работу на себя. Люди же смогут заняться чем-то более приятным и креативным 🎨.

В 11xAI считают, что такие «сотрудники» помогут малому и среднему бизнесу успешно конкурировать с большими компаниями 🥊.

📆 Скоро стартап запустит nocode-платформу, где можно будет создать автономного работника с нуля. В ближайшее время появится еще и маркетплейс, где можно будет выбрать ИИ под задачу, как вы выбираете фрилансера на каком-нибудь Upwork.

11xAI хвастаются, что им даже не пришлось уговаривать инвесторов вложить деньги — они сами понимают, какие перспективы у компании.
🔥3👍2
Что если генеративный ИИ не оправдает надежд? 😱

⌨️ Таким вопросом задался у себя в блоге Гари Маркус. Маркус — специалист в области когнитивистики, автор бестселлера Kludge об эволюции человеческого мозга и основатель компании Geometric Intelligence, специализирующейся на алгоритмах машинного обучения. Его можно назвать ИИ-скептиком, что сразу становится ясно из его нового текста.

💲 В посте он рассуждает, так ли обоснованы ожидания, что рынок генеративного ИИ вырастет в ближайшие годы до триллионов долларов. Маркус напоминает, что даже самые перспективные модели пока могут выполнять только достаточно примитивные задачи. При этом выручка того же OpenAI составляет десятки миллионов долларов при убытках в полмиллиарда.

🎈 Эксперт допускает, что пузырь генеративного ИИ в итоге лопнет и алгоритмы будут использовать только программисты для проверки кода и маркетологи — для создания рекламных текстов. Уже сейчас, отмечает автор, компании, которые разрабатывают генеративные модели, признают, что некоторые проблемы (например, галлюцинации), возможно, так и не удастся решить до конца.

⚠️ При этом, пишет Маркус, все почему-то уверовали в то, что появление генеративного ИИ «важнее огня и электричества», и странам жизненно необходимо стать победителями в «ИИ-битве». Так, власти США и Китая принимают законы и ведут такую политику в области ИИ, которые могут стать одной из причин прямого столкновения стран, опасается Маркус. Речь, конечно, о ситуации вокруг Тайваня, который является ключевым игроком на рынке компьютерных чипов.

Стоит ли, подытоживает автор, столько ставить на технологию, которая в итоге вполне может оказаться «миражом».
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
В MIT разработали невидимые метки, которые упростят отслеживание движений в VR

BrightMarkers — это флуоресцентные метки, которые видимы только со специальными инфракрасными камерами 📸.

🏓 Такая метка, «вшитая» в предмет, распечатанный на 3D-принтере, позволит быстро переносить его в в VR-пространство. Кроме того, метка, встроенная в носимое устройство (или даже в обычную ракетку), сразу добавляет ему функцию motion capture.

☝️Работает это так:

➡️метка генерируется с помощью плагина для 3D-редактора ➡️ в редакторе метку надо объединить с моделью предмета ➡️ предмет с вшитой меткой распечатывается на 3D-принтере.

❗️Важно, что метку не получится добавить, если предмет уже распечатали. Это связано с использованием при печати флуоресцентного волокна. По этой же причине метку очень сложно подделать.

🏭 В MIT видят область применения BrightMarkers не только в развлечениях. Там предлагают также использовать метки на производстве или в цепочке поставок — например, чтобы отследить передвижение детали или место происхождения товара.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
👋 OpenAI хочет заменить модераторов на ИИ

Компания хочет использовать языковую модель GPT-4 для модерации контента. В стартапе считают, что ИИ быстрее и точнее человека справиться с проверкой контента на соответствие правилам платформы.

📞 Кроме того, алгоритм быстро даст фидбек, на основе которого правила можно дополнить или изменить. При этом время обучения модели в десятки раз меньше, чем время, которое уходит на подготовку профессионального модератора.

🛠 Также владельцы сервисов смогут с помощью API создавать собственные автономные системы модерации, уверены создатели ChatGPT.

OpenAI заботятся и о людях-модераторах, которые сегодня должны мониторить контент даже самого экстремального содержания. В компании говорят, что ИИ освободит этих сотрудников от «психологической нагрузки» 🤹.

🤖🧑 Google, Meta*, TikTok уже используют автоматические системы модерации для выявления недопустимого контента на платформе — но всегда в связке с командой людей-модераторов, которые могут перепроверить работу алгоритмов.

💲 Компании тратят на это значительные ресурсы, но даже в этом случае ни одна система не гарантирует 100% эффективности. Основная проблема — огромный поток информации, которую необходимо проверять. Сами OpenAI признают, что совсем от участия человека в процессе пока отказаться не получится.

*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤔2🔥1
Meta* представила новую технологию передачи изображения в MR

🗿 Light-Field Passhrough позволяет пользователю видеть окружающую обстановку без искажений — как будто никакого хедсета у него на голове нет.

Зачем это нужно? В современных шлемах камеры расположены на небольшом удалении перед глазами пользователя. Это приводит к тому, что в MR-режиме пользователь видит мир со «сбитой» перспективой. Чтобы скорректировать ошибку в дело вступают алгоритмы, но их работа часто приводит к серьезному искажению изображения.

😎 Light-Field Passhrough с помощью специальных изогнутых линз, которые частично блокируют лучи света, решает эту проблему. Технология работает в реальном времени, даже если пользователь находится в движении. Хедсету с Light-Field Passhrough нужно меньше вычислительной мощности, так как проблему искажений частично берут на себя сами линзы, а не только ИИ.

🔮 В Meta* уверены, что их разработка в будущем поможет сделать MR «бесшовным» — то есть граница между виртуальным и реальным миром будет практически незаметна.

*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2
Инфографика: главные достижения генеративных нейросетей с начала года

Блог Everypixel опубликовал занятную статистику по использованию генеративных нейросетей с начала 2023 года.

🔼 Самой быстрорастущей нейросетью по количеству сгенерированных изображений оказался Adobe Firefly. Всего за 3 месяца пользователи создали миллиард изображений

👥 Больше всего пользователей у Midjourney15 млн

📊 80% изображений (почти 12,6 млрд) сгенерированы с помощью моделей, приложений, сервисов и платформ, созданных на основе Stable Diffusion

Всего с начала года пользователи сгенерировали 15,5 млрд изображений. Каждый день генерируется 34 млн изображений

📆 Для сравнения, фотографам понадобилось 150 лет (С 1826 год по 1975 год), чтобы сделать 15 млрд снимков (разницу в трудозатратах авторы исследования решили не упоминать)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍2🔥1😱1
ChatGPT грозит смерть, Apple придется поменять название VR-хедсета, в США запрещают книги с помощью ИИ — и другие важные новости за неделю

Gartner уверены, что генеративный ИИ находится на пике завышенных ожиданий: функции генеративного ИИ пытаются добавить в свой продукт вообще все, а не очень разбирающиеся в вопросе люди путают нейросети с AGI — универсальным ИИ. За пиком, предупреждают Gartner, обязательно наступит следующая стадия — разочарования;

В американском штате Айова руководство одной из школ додумалось использовать ИИ для поиска в школьной библиотеке книг с неприемлемым содержанием. ИИ ищет в произведениях «запрещенные идеи и описания». Если в книге удалось что-то найти, то ее помечают для изъятия из библиотеки. Уже набралось 19 книг;

Нейросеть Яндекса YandexGPT научилась на основе отзывов покупателей выделять плюсы и минусы товаров. Сгенерированный список можно увидеть в карточках товаров в поисковике и на Яндекс Маркете. Почти одновременно с Яндексом похожую функцию добавил Amazon;

Apple, возможно, придется сменить название недавно анонсированного хедсета Vision Pro. Дело в том, что в Китае название Vision Pro использует компания Huawei. В качестве запасного варианта Apple может использовать более ранний вариант названия — Reality Pro;

Netflix в тестовом режиме запустил стриминг видеоигр. Пока он доступен только в Канаде и Великобритании. Стримить можно через сайт Netflix или на телевизоре, подключенном к приставке типа Roku;

Эксперты пугают, что иск газеты New York Times к OpenAI может привести к исчезновению ChatGPT — по-крайней мере на какое-то время. Издание не хочет, чтобы чат-бот учился на его статьях. Иск пока на стадии подготовки, но если его удовлетворят, то OpenAI, вероятно, помимо выплаты штрафов придется еще и с нуля пересобирать датасеты, на которых обучали чат-бот;

В ожидании иска от NYT, OpenAI решила приобрести студию Global Illumination. Global Illumination известны как разработчики клона Minecraft под названием Biomes. Сумма сделки и цель покупки не уточняются. В OpenAI обтекаемо говорят, что новые сотрудники будут заниматься «основными продуктами» компании;

WhatsApp тестирует в мессенджере стикеры, сгенерированные нейросетью. Стикер генерируется по текстовой подсказке, потом его можно использовать в переписке;

Chrome теперь умеет в саммарайзинг. Браузер сможет выделить ключевые моменты из текста, на который вы перешли по ссылке. В Google называют функцию экспериментальной и сначала добавят ее в Chrome на iOS и на Android;

И еще про Google. Осенью компания подробно расскажет про Gemini — свой масштабный ИИ-проект, который будет состоять из нескольких моделей. По слухам, Gemini сможет работать не только с текстом, но и с изображениями;

МТС запустил облачную платформу для обучения нейросетей. Сервис от провайдера CloudMTS позволяет командам совместно работать с ML-моделями «в протестированной и оптимизированной для них облачной среде».
👍6
NeRF-экскурсии с помощью айфона 🛫

Стартап Luma AI выпустил новое приложение Flythroughs. Flythroughs позволяет создавать NeRF-панорамы, используя только камеру смартфона — как при записи обычного видео 📱.

Нечто похожее весной показывали Google.

Снимать видео можно и на улице, но разработчики сразу предупреждают, что качество в этом случае может пострадать. Чтобы NeRF получился качественным, нужно будет хорошее освещение и позаботиться, чтобы в кадр не попали люди и животные 😼.

🕙 Готовьтесь ждать — на создание панорамы у программы уйдет около 45 минут.

🏩 Самое очевидное применение такой технологии — сервисы для продажи и аренды недвижимости.

Приложение пока доступно только на iOS.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Google работает над лайф-коучем с искусственным интеллектом

💪 Специально для этих целей компания объединила свою исследовательскую ИИ-лабораторию DeepMind и подразделение Brain, которое также специализируется на умных алгоритмах.

Вместе Brain и DeepMind работают над генеративной нейросетью, которая решает личные и профессиональные вопросы. В общей сложности модель выполняет более 20 задач: помогает брейнстормить, может дать совет, выступить в роли репетитора, проанализировать текст, объяснить график функции и много чего еще 🙏.

Для тестирования модели DeepMind собрали команду из 100 экспертов с научными степенями в разных областях. В их задачи входит, например, оценка того, насколько корректно модель может ответить на вопросы, связанные с жизненными трудностями ☹️.

👰 В качестве примера приводится гипотетическая ситуация, в которой пользователь очень хочет попасть на свадьбу лучшей подруги, но не может позволить себе перелет на самолете, так как сидит без работы. ИИ должен подсказать, как объяснить ситуацию подруге, чтобы не расстроить ее.

DeepMind в официальных комментариях скорее описывают проект как экспериментальный, который не обязательно будет реализован.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3👍2😁1