D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел генератор персонажей CharacterGPT — это как фильм «Она», только с блокчейном 🔗

Сервис от стартапа Alethea AI позволяет создать полностью интерактивного персонажа, которого можно обучать, как настоящую ИИ-модель. CharacterGPT создает не только внешний вид персонажа, но и его голос 🗣.

Цифровой аватар затем можно превратить в NFT, который будет храниться на блокчейне Polygon, и при желании продать другому пользователю или обменять его. В Alethea AI считают, что пользователь сможет использовать персонажа в качестве «ИИ-помощника, цифрового гида, NPC в игре или цифрового двойника» 👥.
👍2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Meta* показала модель для создания VR-видео с полной свободой передвижения 🗽

Meta показала модель HyperReel для создания реалистичных VR-видео. Главная особенность модели — реалистичность при минимальных вычислительных затратах по сравнению с конкурентами, созданными на основе NeRF (например, Immersive Light Field Video от Google).

🎥 Ролики, созданные с помощью HyperReel, «поддерживают 6 степеней свободы» — то есть пользователь может свободно перемещаться внутри ролика в любом направлении, включая повороты вокруг своей оси. Грубо говоря, HyperReel может «сшить» несколько видео, снятых под разным углом в одном пространстве, и создать из них виртуальное пространство, по которому пользователь может свободно перемещаться.

🔫 Джим Фан, который отвечает за ИИ-направление в Nvidia, написал у себя в Twitter, что HyperReel может стать новым killer app для VR.

*запрещенная на территории РФ организация
👍2
Media is too big
VIEW IN TELEGRAM
🎵 Музыкант из Лондона выпустит альбом, написанный для него нейросетью

🤖 Весной выйдет альбом Mirage FM исполнителя patten. Это «первый в истории» релиз, вся музыка на котором сгенерирована нейросетью по текстовым подсказкам.

🎙 Patten (настоящее имя Дэмиен Роач) использовал модель Riffusion, которая работает на основе нейросети Stable Diffusion. В итоге музыкант записал 21 трек в жанрах от хип-хопа до оперы.

🌿 Mirage FM выйдет в апреле, но первый сингл Fly уже можно послушать.
🔥2
😱 Big picture: почему Google испугался ChatGPT и как будет с ним бороться

В конце прошлого года OpenAI выпустил чат-бот ChatGPT, который оказался настолько универсальным, что многие начали говорить — вот он, убийца поисковика Google 🎯. Чат-бот не кидает вам ссылку на несколько источников по запросу, а дает развернутый ответ с примерами и может вести полноценный диалог с пользователем (правда, грешит использованием непроверенной информации, а часто и откровенными фейками).

😟 Google сильно напрягся после выхода ChatGPT, ведь поисковик не менялся с середины нулевых, а на руках у компании есть только прототипы Flamingo, Sparrow и LaMDA, которые неизвестно когда станут доступны публично. Ирония в том, что разработка OpenAI работает на модели, которую еще в 2017 году представил Google.

🚩 СМИ пишут, что для Google появление продукта от OpenAI стало настоящим «красным флагом». По мнению топ-менеджеров Google, новая технология способна сломать поисковую бизнес-модель компании, приносящую сотни миллиардов долларов, если та не найдет, чем ответить. Интересно, что сам глава OpenAI Сэм Альтман не считает, что ChatGPT способен убить поисковик Google.

Чтобы не проиграть молодому конкуренту, глава Google Сундар Пичаи приостановил работу над несколькими проектами, чтобы сотрудники занялись разработкой новых ИИ-прототипов. Пинчаи также оптимизировал рабочие процессы, что позволит быстрее запускать новые продукты.

🙏 Компания настолько озабочена появлением ChatGPT, что даже позвала на помощь основателей Google Ларри Пейджа и Сергея Брина, которые предложили варианты по интеграции в поисковик функционала чат-ботов. Уже в этом году компания готовится представить 20 пока не анонсированных решений на основе ИИ (среди них — нейросеть для генерации изображений) и обновленный поисковик.

🔒 Во многом Google сегодня оказался заложником своего успеха. Гигантская компания не может за несколько дней перестроить всю бизнес-модель и запустить новый, пусть даже сырой, продукт, как это делает OpenAI, опасаясь реакции рекламодателей и инвесторов.
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🗣 Siri скрестили с GPT-3

Команда разработчиков представила Zenen AI — чат-бота на основе языковой модели GPT-3, с которой можно общаться голосом. Zenen AI может придумать для вас шутку или поучаствовать в импровизации, дополняя деталями черновик сценария или выступления. Кроме того, модель порассуждает о смысле жизни, перескажет книгу или поможет вспомнить историческую дату 🧠.

🚶‍♂️🚶‍♂️🚶‍♂️На сайте разработчика можно записаться в очередь для тестирования сервиса. В будущем обещают приложение для Android и iOS.
👍3
🧙‍♂️ «Волшебник» для Figma

Diagram Labs выпустили ИИ-плагин Magician для графического редактора Figma. «Волшебник» может сгенерировать по текстовой подсказке необходимый графический объект (иконку или изображение), а также помочь с копирайтингом .

Magician можно попробовать бесплатно в течение 7 дней, дальше придется платить $9 в месяц.
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
⛔️ Конкурент ChatGPT, который не пропустит фейки

Чат-бот Perplexity — еще один конкурент ChatGPT, но с важным отличием: он дает ссылку на источник, а значит, пользователь всегда может проверить достоверность информации, которую предлагает ему ИИ 🔍.

Наш коллега уже несколько дней тестирует чат-бот и рассказывает, что Perplexity работает быстрее ChatGPT, не отваливается из-за перегруженных серверов и к тому же не требует регистрации. Еще один плюс: сервис дает ссылку не на 1 источник, а сразу на 5 😱.

Но Perplexity остается довольно сырым продуктом. Например, он может выдавать разные ответы на одинаковый запрос 🤷‍♀️.
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Помните, мы еще летом писали, как создатели триллера The Fall с помощью нейросетей убрали из фильма матерщину, чтобы попасть в нужный возрастной рейтинг?🤬 Теперь наконец-то можно посмотреть, как это работает!
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
«Эмоциональный» генератор синтетической речи получил $2 млн от инвесторов

Этот ИИ понимает контекст. Модель от стартапа ElevenLabs не просто синтезирует речь, а реагирует на происходящее в тексте и способна имитировать подходящую эмоцию. Модель различает сарказм и может посмеяться над шуткой — даже неудачной! 🤣 Попробовать сервис можно бесплатно после регистрации на сайте, если вы владеете английским или польским языками.

Что там у конкурентов? Компания Apple сильно отстает от ElevenLabs в своей технологии озвучивания электронных книг — пользователи Apple Books часто жалуются на монотонность синтетического голоса, который зачитывает текст 🤖. Как и недавний сервис от Microsoft, продукт ElevenLabs может «клонировать» голос человека по нескольким секундам аудиозаписи. Нечто похожее обещает в будущем и Amazon.
🔥3
🚂 «Яндекс» научил нейросеть расшифровывать документы XVIII века

В сервисе «Поиск по архивам» на данный момент собраны 2,5 млн страниц документов с середины XVIII до начала XX веков. Алгоритм распознает устаревшие буквы в рукописных текстах, учитывает особенности почерка✍️.

👩‍🎓 Нейросеть обучали на сотнях тысяч реальных исторических документов и десятках миллионов «синтетических» примеров. В хранилище сейчас доступны документы из Главархива Москвы, а также из архивов Оренбургской и Новгородской областей, но базу будут пополнять.

🔍 Нужную информацию в архиве можно искать по ключевым словам (например, по фамилии) или используя фильтры.

Подробнейший текст о том, как разрабатывался сервис и как обучали нейросеть можно прочитать в блоге компании на «Хабре».
«Ритуальные» приложения, экологичный VR и VIP NFT: отчет The Future 100

Приятное чтение на выходные. Маркетинговое агентство Wunderman выпустило ежегодный отчет с главными трендами 2023 года. Вот несколько для затравки.

🫴 Пользователи станут совладельцами контента в соцсетях. Платформы вроде Niche предлагают уйти от модели, когда соцсеть — единоличный владелец контента, созданного на площадке. Niche отдает эти права пользователю, подталкивая его к монетизации.

«Ритуальные» приложения вытеснят сервисы, которые требуют постоянного внимания. Приложения вроде BeReal, игры Wordle и сервиса знакомств Thursday не требуют внимания круглые сутки, а предлагают иногда совершить определенный «ритуал». Например, Thursday разрешает пользователю поискать пару только в четверг.

🌳 Компании будут обращать внимание на экологичность даже в виртуальной реальности. Платежный сервис Ripple обещает достичь углеродной нейтральности к 2030 году, бренд Burberry выпустил коллекцию NFT в партнерстве с блокчейном Blankos, который не требует майнинга, а криптовалюта Ethereum перешла на более экологичный алгоритм работы PoS.

🎮 AR-развлечения становятся мейнстримом. Большие бренды через AR хотят сделать свой продукт более интерактивным. Так, Disney выпустил короткометражку Remembering, в которой можно отсканировать QR-код и получить доступ к расширенной версии.

💎 Вместо клубных карт будут VIP NFT. Например, в Нью-Йорке скоро должен открыться ресторан, куда смогут попасть только обладатели NFT. Токены можно будет продавать или отдавать в аренду.
👍3
OpenAI не хотели выпускать ChatGPT, а потом очень удивлялись восторгам

Журнал Fortune опубликовал большой материал об OpenAI, создателе ChatGPT. Выбрали для вас самые интересные моменты лонгрида.

🆚 OpenAI задумывали как анти-DeepMind. OpenAI создали в ответ на покупку Google ИИ-компании DeepMind в 2014 году. Ее хотели сделать антиподом DeepMind: выпускать все продукты с открытым кодом и ничего на них не зарабатывать. Позже от части идеалистических планов отказались.

🔫 ChatGPT хотели «убить», не выпустив в свет. Чат-бот с начала 2022 года разрабатывали как инструмент для обучения GPT-3. Готовый продукт показали тестерам, но чат-бот их не впечатлил — они просто не понимали, зачем он нужен. Попытки модифицировать чат-бот тоже ни к чему не привели.

😇 В последний момент ChatGPT решили оставить. Чат-бот сделали доступным для всех и сильно удивились бурной реакцией пользователей. Создатели ожидали «на порядок меньше хайпа», чем получили.

🤖 OpenAI работал над еще одной версией GPT. Эта версия давала ссылки на источники информации и называлась WebGPT. Но продукт был слишком сырым.

💰 Сделка с Microsoft должна помочь OpenAI стать НКО. По условиям сделки с Microsoft и с другими инвесторами, когда (и если) OpenAI вернет им вложенные средства, компания вновь превратится в НКО. Сколько времени это займет, не знает никто. В 2022 году компания получила убыток более $500 млн.

👎 Не все довольны условиями партнерства с Microsoft. Сотрудничество с Microsoft оценили далеко не все сотрудники OpenAI. Некоторые посчитали, что компания становится слишком коммерческой, а Microsoft оказывает слишком большое влияние на то, чем стартап занимается.
🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Идеальное субботнее видео: пользователи развлекаются с новым ИИ от Nvidia, используя его в популярных фильмах: «Сияние», «Крестный отец», «Старикам здесь не место». ИИ делает так, что персонажи все время смотрят прямо в камеру — получается смешно и жутковато одновременно! 👁
Стать адвокатом искусственному интеллекту нельзя, а заряжать носимые устройства телом человека можно — эти и другие важные новости за неделю

По слухам, профессиональная версия ChatGPT уже тестируется и будет стоить $42, хотя официального анонса пока не было. Отличаться платная версия, как говорят, будет стабильностью и быстродействием, а пользователи получат приоритетный доступ к новым функциям;

Создатели ChatGPT — компания OpenAI официально объявила о многомиллиардных инвестициях со стороны Microsoft. Конкретные суммы не называются, но СМИ писали о $10 млрд;

Ученые выяснили, что человеческое тело можно использовать как аккумулятор «лишней» энергии, которая остается при работе сетей 6G, чтобы затем заряжать носимые устройства;

Искусственному интеллекту все-таки не дадут поработать адвокатом. Создатели сервиса Do Not Pay побоялись угроз со стороны властей, которые пообещали им уголовное преследование;

Twitter запустил новый инструмент для рекламодателей, который позволит компаниям таргетировать рекламные сообщения через ключевые слова;

В семье нейросетей прибыло — теперь своя есть у сервиса стоковых фотографий Shutterstock. Модель работает на основе Dall-E, а чтобы попробовать, нужен аккаунт на Shutterstock.
🔥5
Media is too big
VIEW IN TELEGRAM
Nvidia показала, как в недалеком будущем будет выглядеть редактирование видео ✂️

📹 На YouTube-канале Two Minute Papers появилась демонстрация ИИ-модели от Nvidia Text2Live, которая позволяет редактировать мельчайшие детали на видео с помощью текстовых подсказок.

👨‍🎨 Алгоритм редактирует не исходное видео, а добавляет к нему дополнительный «редактируемый слой». Благодаря этому при работе Text2Live удается избежать графических артефактов, а отредактированное видео выглядит реалистично.

Исходный код модели доступен на GitHub.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ опаснее ядерной бомбы

🧨 Так считают исследователи из Оксфорда. По их мнению, продвинутый искусственный интеллект способен уничтожить всех и каждого, и поэтому его использование должно регулироваться — как использование ядерного оружия.

🐕 Ученые сравнили ИИ с собакой, которой дают лакомства за выполнение определенных действий. Если собака почувствует возможность получить доступ к лакомствам в обход человека, она сделает для этого все возможное.

Продвинутый искусственный интеллект, который через какое-то время будет управлять множеством процессов в современном мире, однажды тоже может решить, что человек ему больше не нужен. При этом ИИ специально не будет предупреждать людей, что собирается покончить со своими создателями .

ИИ может стать такой же угрозой для человечества, какой когда-то были сами люди для других биологических видов на Земле, считают в Оксфорде 😱.
👍42
👏 Сири, создай мне AR-приложение

Примерно такая команда в ближайшее время может появиться в устройствах Apple. Компания разрабатывает ПО, которое позволит создавать приложения дополненной реальности, взаимодействуя с голосовым помощником — пользователю даже не обязательно уметь кодить 🤓.

Разработчик-новичок сможет выбирать предметы для своего приложения из готовых ассетов или создавать AR-объекты из предметов, снятых на камеру — и размещать их в дополненном пространстве.

😨 Apple опасается, что после релиза AR-гарнитуры, который должен состоятся в этом году, компания не сможет предложить покупателям большой каталог приложений, что может затормозить продажи.
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
❄️ ☘️ InstructPix2Piх за секунду поменяет зиму на весну с помощью промпта

Модель справляется с редактурой за несколько секунд и при этом не требует от пользователя навыков написания промптов, понимая обычный разговорный язык. Обычно в таких случаях используются отдельные программы, которые генерируют «правильные» подсказки 🧐.

Для обучения InstructPix2Piх разработчики использовали GPT-3 и Stable Diffusion, а также 450 тысяч пар синтетических изображений и инструкций по их редактированию.

⌨️ Исходный код доступен на GitHub, а протестировать модель можно на Hugging Face.
🔥4👍1