D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
OpenAI регистрирует торговую марку GPT-5, люди плохо отличают синтетические голоса от настоящих, Netflix троллит актеров — и другие важные новости за неделю

Netflix ищет человека на вакансию продакт-менеджера ML-платформы с зарплатой $900 тыс. в год. В перечне задач для соискателя было указано создание контента для Netflix с помощью ИИ. Позже эту строчку убрали — возможно, чтобы не раздражать актеров и сценаристов, забастовка которых продолжается в Голливуде;

Instagram* собирается помечать контент, созданный искусственным интеллектом. Наблюдательные пользователи нашли в приложении соцсети сообщение с текстом «Изображение сгенерировано Meta AI*». Компания Марка Цукерберга официальных комментариев по теме не дает;

McKinsey подсчитал, что уже 79% сотрудников компаний хотя бы минимально пользуются генеративным ИИ на работе или дома. Больше всего (33%) по работе нейронки используют в сфере телекома, медиа и технологий;

OpenAI подала заявку на регистрацию торговой марки GPT-5. К сожалению, из этой информации невозможно сделать вывод о том, когда модель собираются выпустить, или хотя бы на каком этапе разработки она находится;

YouTube тестирует среди сотрудников самарайзинг видео с помощью ИИ. В компании говорят, что функция не заменит описания, которые делают авторы клипов, но даст пользователю дополнительный инструмент, чтобы выбрать себе подходящее видео для просмотра;

В Китае из AppStore пропадают приложения, использующие генеративный ИИ. Вероятно, все дело в новых правилах использования алгоритмов, которые вступят в силу с 15 августа. По новым правилам разработчики такого ПО должны будут получать от властей специальную лицензию;

Нейросеть Яндекса отсканировала 24 тыс. выпусков газеты «Советский спорт» для сервиса Поиск по архивам. Теперь номера газеты доступны для поиска упоминаний людей, событий, дат и т. д.;

В Goldman Sachs считают, что мировые инвестиции в ИИ вырастут к 2025 году до $200 млрд. В долгосрочной перспективе, прогнозируют специалисты, в странах-лидерах по разработке ИИ инвестиции в область составят от 1,5% до 2,5% ВВП;

Исследование Университетского колледжа Лондона показало, что люди в 27% случаев не могут отличить голос, сгенерированный нейросетью, от настоящего. При этом на цифру не влияло, проходил ли участник исследования перед этим курс на определение синтетических голосов или нет. Эксперимент проводили на английском и китайском языках.

*Instagram и Meta AI входят в Meta — организацию, запрещенную на территории РФ
4🔥4👍1
Стартап хочет поделить ИИ на две команды для борьбы с фишингом 🎣

🤖 Jericho Security предлагает использовать искусственный интеллект, чтобы защитить себя и свою компанию от продвинутых фишинговых атак, созданных искусственным интеллектом.

🧠 Идея состоит в создании 2-х «команд» алгоритмов — синей и красной. Красный ИИ будет генерировать все более продвинутые, персонализированные фишинговые атаки, а синий ИИ — все более сложные методы защиты от них: с использованием продвинутых алгоритмов распознавания языка, а также кастомных языковых моделей.

🦸‍♂️ Таким образом, считают в Jericho, «хорошие парни» всегда будут оставаться на шаг впереди хакеров, заранее зная, какие атаки они могут использовать.

Американская компания недавно получила от инвесторов $3 млн на реализацию своих идей.
👍2
Разработчик приложений для повышения продуктивности анонсировал XR-хедсет — конкурента Vision Pro 👊

Компания Immersed показала свою гарнитуру The Visor, технические характеристики которой сравнимы с представленным пару месяцев назад девайсом Apple.

😱 Судите сами: 2 microOLED-дисплея с разрешением 4K, реализация 6DoF (то есть возможность перемещаться в любом направлении), поле зрения (FoV) — 100 градусов и передача цвета в разрешении «большем, чем все, что сегодня представлено на рынке». Весит The Visor всего около 150 грамм.

При этом с точки зрения эргономики The Visor (судя по рендерам) выглядит более аккуратным устройством, чем Vision Pro, по поводу внешнего вида которого было много шуток 🤣.

Immersed работали над устройством вместе с неким «AR/VR-гигантом», название которого пока не раскрывают.

✖️🎮✖️ Если вы замечтались о том, какие игры будут на таком гаджете, то сорри — разработчики The Visor позиционируют его как устройство для работы, а не развлечений. Правда, Vision Pro, судя по всему, тоже не очень подходит для гейминга.

📆 Выход The Visor запланирован на следующий год, стоимость объявят позже.

Компания Immersed в первую очередь известна благодаря одноименной платформе для совместной работы. Сервис поддерживает XR-хедсеты и работает на Windows, Mac и Linux.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
ИИ-сервис, который подберет синтетический голос для любого случая 🗣

Murf AI готов озвучить по вашему тексту рекламу, презентацию, обучающее видео, ролик на YouTube, подкаст, видеоигру и много чего еще.

🥳 На выбор сервис предлагает 1 из 120 готовых голосов, 20 языков (есть поддержка русского) и нейросеть, с помощью которой можно клонировать свой голос. На создание голосового аватара уйдет от 1 до 4-х недель. Если вдруг пришлось записывать текст в шумном месте или на плохое оборудование, то Murf может довести его до студийного качества.

🫤 Стоит отметить, что синтетические голоса, которые предлагает Murf, сильно различаются по качеству — есть неотличимые от настоящих, а есть похожие на роботов.

🎞 Звуком дело не ограничивается — Murf AI умеет и в видеоряд, который можно создать, используя templates — то есть шаблоны. В templates, отсортированные по теме (реклама обувного магазина, вступление для документального фильма и т. д.), можно добавлять свои изображения, текст и видео, чтобы на выходе получить индивидуальный ролик.

Бесплатная версия Murf ограничена 10 минутами для генерации голоса и 10 минутами при переводе аудио в текст. Базовая подписка стоит $19.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
GPT-приложение, которое напишет стихотворение по фото с iPhone 🖋

🔩 Pamera — The Poem Camera использует языковую модель от OpenAI и идентификатор объекта (OID). Приложение анализирует фото со смартфона, а затем генерирует короткий стих из 4-х строчек (на английском).

Разработчик уверяет, что стихи, которые пишет ИИ, вдохновлены творчеством аргентинского поэта Хорхе Луиса Борхеса.

В большинстве случаев Pamera действительно удается придумывать строчки, связанные с происходящим на фото, но иногда полет фантазии может унести приложение довольно далеко 😌.

Сейчас разработчик доделывает новую версию приложения, которая будет поддерживать селфи 😮.

Приложение доступно и в российском AppStore за ₽249.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Возвращение легенды 🦸

💪 После отпуска наш дайджест возвращается в своей лучшей форме и готов рассказать, что:

Spotify окончательно расстался с AppStore

Конкурент Twitter от Марка Цукерберга бьет рекорды по количеству пользователей

Дженнифер Лопес поддержала дипфейки

В России опять растет пиратство видеоигр

И еще почти два десятка самых важных тем за прошедший месяц ‼️
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
👩‍🦰 Samsung научился создавать реалистичные волосы с помощью ИИ

Геймеры знают, что один из самых сложных объектов для реализации в 3D — человеческие волосы. Модель персонажа может быть сколько угодно реалистичной, но его прическа в лучшем случае будет напоминать плохо сделанный парик 👎.

Все потому, что годами волосы в 3D представляли собой mesh-объект, поверх которого натягивали текстуры разного цвета — это и должно было символизировать прическу.

💡 Кажется, в Samsung придумали, как решить эту проблему с помощью нейросетей.

Модель Neural Haircut обучена на фото нескольких сотен причесок, снятых с разных ракурсов. Алгоритм создает рендер, где каждый волос перенесен в 3D, как отдельный элемент, а не просто «шапка» 💂‍♀️.

👤 Процесс происходит в 2 этапа: сначала волосы переносятся в 3D вместе с бюстом того, кому они принадлежат (чтобы все вместе выглядело более реалистично), а уже потом создается детальная модель непосредственно волос.

Но есть и минусы: на компьютере даже с мощной видеокартой процесс создания 3D-волос занимает 3 дня.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Google и Universal Music хотят узаконить музыкальные дипфейки 🤖 🎶

Бигтех и музыкальный лейбл ведут переговоры о возможности лицензирования мелодий и голосов артистов 🗣.

🎧 План в том, чтобы потом пользователи могли за деньги легально клонировать голос, создать на его основе свое музыкальное произведение и выложить на платформу для стриминга без угрозы суда. Исполнитель при этом может запретить использование его голоса для этих целей.

Переговоры находятся на раннем этапе, но стороны хотят договориться о создании единой платформы, через которую можно будет создавать и использовать синтетические голоса. На выходе получится новый тип UGC, на котором музыкальная индустрия хочет заработать 👛.

👎👍 Интересно, как поменялась позиция Universal по поводу использования ИИ для создания музыки. Еще в апреле компания требовала блокировать нейросетям доступ к произведениям их артистов, а треки типа Gangsta’s Paradise в исполнении Фрэнка Синатры — удалять со стриминг-платформ.

Видимо, за несколько месяцев к мейджору пришло осознание, что бороться с трендом бесполезно и надо хотя бы попробовать его монетизировать.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ-«волшебник», который порежет длинное видео на тик токи 🧙‍♂️

✂️ Vizard сам находит самые интересные моменты в ваших видео, а затем делает из них видео для TikTok, рилзы для Instagram* и Shorts для YouTube. Сервис также может автоматически добавить к короткому видео заголовок и субтитры.

Из часового видео Vizard обещает за несколько минут сделать больше 10 клипов, которые должны привлечь новую аудиторию к вашей страничке или каналу. Если выбор нейросети не понравился, то лучшие моменты видео можно выбрать и вручную 🫳.

Мы попробовали сервис на 20-минутном видео на русском языке. На анализ у сервиса ушло около 10 минут, он нарезал из видео 6 клипов для 3-х соцсетей с субтитрами на русском языке. Получилось очень неплохо! Сервис действительно выбрал интересные моменты и даже сгенерировал для них неплохие заголовки (их потом можно самостоятельно отредактировать).

Vizard можно попробовать бесплатно с ограничением на 300 минут загруженного видео и 10 проектов. Чем больше проектов и минут — тем дороже. Самая дорогая подписка обойдется в $32 в месяц.

*Instagram входит в Meta — организацию, запрещенную на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
👥 Стартап создаcт неотличимый от человека аватар из короткого видео

Американская компания HeyGen показала результат работы своего сервиса по генерации цифровых аватаров. И это впечатляет 😮.

Joshua Avatar 2.0 (назван так в честь основателя компании Джошуа Ксу) детально повторяет мимику человека, интонации голоса, акцент и т. д. 🙂

🤏⌚️ Утверждается, что для создания ультрареалистичного аватара нужно всего 2 минуты видео с человеком.

Вот тут можно записаться в очередь, чтобы попробовать сервис. За это в качестве бонуса Джошуа Ксу обещает выслать на имейл персонализированное видео от своего аватара 🤩.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
PlayHT 2.0: Text-to-Voice-модель с вероятностью 97% убедит вас, что она — человек 🧍‍♀️

💬 Основная задача PlayHT — быстрая генерация реалистичных диалогов, в которых между фразами «спикеров» нет раздражающей задержки, как у многих аналогичных решений. Разработчики говорят, что в 97% случаев сгенерированные синтетические голоса невозможно отличить от человеческих.

PlayHT 2.0 способна озвучить текст в реальном времени менее чем за секунду, а также без дополнительной настройки за 3 секунды клонировать голос.

🗣 Чтобы добиться таких результатов, разработчики по сравнению с версией 1.0 увеличили датасет для обучения до 1 млн часов диалогов на разных языках, с разными акцентами. Сама модель стала больше в 10 раз. Как и прошлая версия PlayHT 2.0 поддерживает почти 200 языков, включая русский.

Пока можно записаться на тестирование беты сервиса.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9
Искусственный интеллект узнает по стуку клавиш, что вы печатаете; Zoom хотел обучать ИИ на информации пользователей, создатели SD выпустили нейросеть для генерации кода — и другие важные новости за неделю

Zoom обновил правила использования сервиса, после чего там появился пункт об использовании информации пользователей для обучения своих ИИ-алгоритмов. Без возможности отказаться. После мини-скандала компания изменила правила еще раз и теперь можно отказаться помогать ИИ;

В поисковик Google интегрировали ИИ, который будет проверять поисковый запрос на ошибки, в том числе и смысловые. Если алгоритм найдет ошибку или поймет, что запрос составлен некорректно, то предложит варианты исправлений. Пока функция, судя по всему, работает не во всех регионах;

OpenAI запустили GPTbot, который будет индексировать содержимое сайтов по всему интернету, за исключением контента под пейволом и личной информации. Информацию будут использовать для улучшения будущих версий языковой модели GPT;

Разработчики Stable Diffusion запустили LLM для генерации кода. Stable Code существует в 3-х версиях и поддерживает 7 языков программирования, включая Python, C++, JavaScript;

Nvidia объявила о поддержке нового сервиса Training Cluster as a Service от Hugging Face, который создан для обучения ИИ-моделей. Через Training Cluster можно будет получить доступ к DGX — облачному суперкомпьютеру Nvidia. Подписка на DGX отдельно стоит $37 тыс. в месяц. Training Cluster должен запуститься в ближайшие месяцы;

Disney организовал оперативную группу, которая будет изучать возможности использования ИИ в бизнесах компании. Речь идет не только о производстве фильмов и мультиков, но и о парках развлечений, рекламе и телевидении;

Исследователи из Великобритании утверждают, что им удалось создать ИИ, который по звуку нажатия клавиш может с 93% точностью определить, что именно печатает человек. Для работы алгоритму достаточно аудиозаписи созвона в Zoom;

Huawei прикрутили генеративный ИИ к своему голосовому помощнику Celia. Ни Apple, ни Google этим пока похвастаться не могут. Теперь Celia работает в связке с LLM Pangu собственной разработки компании;

Amazon удалил с платформы книги, сгенерированные нейросетью, но опубликованные под именем реального автора. Писательница Джейн Фридман рассказала, что Amazon сначала отказывался удалять книги, но после того, как за нее вступилась Гильдия авторов США, сдался;

Стартап по созданию чипов, заточенных под работу ИИ-моделей, Tenstorrent получил $100 млн инвестиций от Hyundai и Samsung. Hyundai собирается совместно с компанией разрабатывать процессоры для роботов и машин, Samsung пока просто вложил в стартап деньги.
👍61
Тысячеликий герой: LLM, которая взаимодействует с 16 тыс. API

ToolLLaMA построена на основе LLM с открытым кодом LLaMA, дополнительно обученной на синтетическом датасете Tool Bench 🎒.

После того, как ToolLLaMA донастроили с помощью Tool Bench, модель научилась обращаться к более чем 16 тысячам API, выбирая один или несколько нужных в зависимости от запроса.

На практике это означает, что вы можете в одном запросе попросить у модели:

1️⃣ посоветовать вам фильм

2️⃣ найти кинотеатр, где он идет

3️⃣ предложить ресторан, где можно перекусить после просмотра.

ToolLLaMA обратится к нужным API и даст ответ 💬.

📑 Датасет Tool Bench можно описать, как огромный набор инструкций, сгенерированных с помощью ChatGPT, для взаимодействия с API, хранящимися на сайте RapidAPI.

ToolLLaMA даже способна работать с интерфейсами, которые встречает первый раз, просто прочитав их документацию 😱.

Демо и код модели можно найти на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
👷‍♂️ Стартап, который сдает в аренду ИИ-работников, получил $2 млн

11xAI предлагает небольшим компаниям нанимать ИИ-модели, которые возьмут рутинную работу на себя. Люди же смогут заняться чем-то более приятным и креативным 🎨.

В 11xAI считают, что такие «сотрудники» помогут малому и среднему бизнесу успешно конкурировать с большими компаниями 🥊.

📆 Скоро стартап запустит nocode-платформу, где можно будет создать автономного работника с нуля. В ближайшее время появится еще и маркетплейс, где можно будет выбрать ИИ под задачу, как вы выбираете фрилансера на каком-нибудь Upwork.

11xAI хвастаются, что им даже не пришлось уговаривать инвесторов вложить деньги — они сами понимают, какие перспективы у компании.
🔥3👍2
Что если генеративный ИИ не оправдает надежд? 😱

⌨️ Таким вопросом задался у себя в блоге Гари Маркус. Маркус — специалист в области когнитивистики, автор бестселлера Kludge об эволюции человеческого мозга и основатель компании Geometric Intelligence, специализирующейся на алгоритмах машинного обучения. Его можно назвать ИИ-скептиком, что сразу становится ясно из его нового текста.

💲 В посте он рассуждает, так ли обоснованы ожидания, что рынок генеративного ИИ вырастет в ближайшие годы до триллионов долларов. Маркус напоминает, что даже самые перспективные модели пока могут выполнять только достаточно примитивные задачи. При этом выручка того же OpenAI составляет десятки миллионов долларов при убытках в полмиллиарда.

🎈 Эксперт допускает, что пузырь генеративного ИИ в итоге лопнет и алгоритмы будут использовать только программисты для проверки кода и маркетологи — для создания рекламных текстов. Уже сейчас, отмечает автор, компании, которые разрабатывают генеративные модели, признают, что некоторые проблемы (например, галлюцинации), возможно, так и не удастся решить до конца.

⚠️ При этом, пишет Маркус, все почему-то уверовали в то, что появление генеративного ИИ «важнее огня и электричества», и странам жизненно необходимо стать победителями в «ИИ-битве». Так, власти США и Китая принимают законы и ведут такую политику в области ИИ, которые могут стать одной из причин прямого столкновения стран, опасается Маркус. Речь, конечно, о ситуации вокруг Тайваня, который является ключевым игроком на рынке компьютерных чипов.

Стоит ли, подытоживает автор, столько ставить на технологию, которая в итоге вполне может оказаться «миражом».
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
В MIT разработали невидимые метки, которые упростят отслеживание движений в VR

BrightMarkers — это флуоресцентные метки, которые видимы только со специальными инфракрасными камерами 📸.

🏓 Такая метка, «вшитая» в предмет, распечатанный на 3D-принтере, позволит быстро переносить его в в VR-пространство. Кроме того, метка, встроенная в носимое устройство (или даже в обычную ракетку), сразу добавляет ему функцию motion capture.

☝️Работает это так:

➡️метка генерируется с помощью плагина для 3D-редактора ➡️ в редакторе метку надо объединить с моделью предмета ➡️ предмет с вшитой меткой распечатывается на 3D-принтере.

❗️Важно, что метку не получится добавить, если предмет уже распечатали. Это связано с использованием при печати флуоресцентного волокна. По этой же причине метку очень сложно подделать.

🏭 В MIT видят область применения BrightMarkers не только в развлечениях. Там предлагают также использовать метки на производстве или в цепочке поставок — например, чтобы отследить передвижение детали или место происхождения товара.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1