D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🏎 Qualcomm показал скоростную версию Stable Diffusion для мобильных

📶 Мобильная версия нейросети локально (то есть не через облако, а используя ресурсы устройства и без подключенного интернета) работает на Android-смартфоне с новейшим процессором Snapdragon 8 Gen 2 от Qualcomm. В компании уверены, что такое до них не удавалось никому в мире, но с этим можно поспорить.

В чем не приходится сомневаться, так это в скорости работы нейросети: мобильная Stable Diffusion генерирует изображение за рекордные 15 секунд, никаких ограничений на сложность текстовых подсказок при этом нет 🧐.

Для запуска Stable Diffusion 1.5 оптимизировали с помощью набора ИИ-инструментов Qualcomm AI Stack. В Qualcomm обещают, что в будущем использовать нейросеть можно будет на любом устройстве, работающем на процессоре компании: ноутбуке, XR-гарнитуре и других платформах.
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Приложение, которое позволит вернуться в свой 2007-й с помощью VR 📆

Мы уже рассказывали про стартап Wist Labs — разработчиков приложения Wist, которое делает из обычных видео, снятых на камеру смартфона, 3D-ролики.

За прошедшие несколько месяцев Wist слегка поменяло позиционирование — теперь это программа, которая позволяет снова и снова переживать воспоминания, погружаясь в них 👶. Сейчас Wist находится на стадии бета-версии и записавшиеся в лист ожидания начали получать приглашения на тестирование (запись в вейт-лист все еще открыта).

Чтобы подогреть интерес к проекту, один из основателей стартапа Эндрю Макхью опубликовал в Twitter впечатляющее демо Wist, набравшее почти миллион просмотров 👀.

Релиз Wist все еще запланирован только на iOS-устройствах и VR-гарнитурах Quest, точной даты пока нет. В будущих версиях разработчики обещают добавить «мультиплеер», чтобы воспоминания можно было прожить заново с друзьями и родственниками 👥. Кроме того, с помощью ИИ воспоминания, которые вы запускали особенно часто, будут становиться более детализированными — как именно это будет работать, не уточняется.

Да, мы тоже вспомнили про сериал «Черное зеркало» 😱.
🔥7😱4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
В MIT разработали AR-технологию, которая поможет найти иголку в стоге сена 🪡👀

Технология Массачусетского технологического университета под названием X-AR работает за счет радиоантенны и RFID-меток, которые находятся на разных предметах 📻. X-AR реализована с помощью очков смешанной реальности Hololens от Microsoft.

Во время тестирования X-AR определяла местонахождение RFID-вещи с точностью до 10 см. Когда пользователь берет в руки предмет, то X-AR подтверждает, что вещь найдена правильно .

В качестве сферы применения X-AR в MIT называют, например, склады, где гарнитура поможет рабочему быстро найти нужную вещь. Еще один вариант: производственный цех, где сборщику для работы нужны определенные детали ⚙️. Выбор предмета для поиска происходит через меню гарнитуры.

Подробнее узнать про X-AR можно, посмотрев ролик по ссылке.
👍7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Автомобили Ford будут сами уезжать от просрочивших платежи по кредиту 👋 🚙

Помните летом все хейтили BMW, которые собрались продавать по подписке подогрев сидений? Ford идет еще дальше. Автомобили компании с возможностью автономной или полуавтономной езды, согласно патенту, смогут без участия водителя уезжать по направлению к банку, как только владелец просрочит несколько платежей 🏦.

В документе описан вариант, когда финансовая организация может посчитать процесс конфискации слишком затратным, и тогда автомобиль может сам себя отвезти на свалку ♻️.

🔓 Если у машины нет функции беспилотной езды (а сейчас полноценного автопилота нет ни у одного серийного автомобиля), то можно будет дистанционно отключать некоторые важные функции, например, кондиционер или даже двигатель. Вангуем, что в следующей версии автомобиль сможет просто запереть неплательщика внутри и сразу отвезти его в тюрьму 👮‍♂️.

📡 Очевидно, что для работы технологии необходимо, чтобы автомобиль всегда был «на связи», поэтому теоретически неплательщик может попытаться уехать куда-нибудь в глушь и никогда не возвращаться. Ну, и стоит напомнить, что получение патента на технологию не означает, что Ford в ближайшее время или вообще когда-нибудь им воспользуется.
😁12
This media is not supported in your browser
VIEW IN TELEGRAM
Китайцы представили планшет, который показывает 3D с помощью искусственного интеллекта 🧠

Nubia Pad 3D от компании ZTE показывает объемное изображение без использования специальных очков. Для этого китайский производитель использовал технологию Lightfield стартапа Leia.

🔦 👀 Суть Lightfield заключается в том, что под дисплеем планшета находится фильтр, который раздельно направляет луч света в левый и правый глаз пользователя из-за чего возникает эффект автостереоскопии — так по-умному называется возможность просмотра 3D без дополнительных устройств.

ИИ в данном случае нужен для того, чтобы автоматически генерировать наилучший вариант 3D-изображения, с какой стороны пользователь бы на него не смотрел 🕺.

Стоимость Nubia Pad пока не называется, но, скорее всего, ценник перевалит за $1 000. Например, собственный планшет Leia — Lume Pad — стоит $1 100 🤑
🔥7👍2
This media is not supported in your browser
VIEW IN TELEGRAM
❗️ Британский стартап нашел смысл в покупке шести айфонов

Осенью мы уже рассказывали про программу Move AI, которая позволяет создавать качественную mocap-анимацию без специального оборудования. После бета-тестирования, в котором поучаствовали 20 тыс. человек, приложение появилось в App Store 🐣.

Разработчики обещают, что, используя обычные айфоны, можно будет получить анимацию студийного качества.

📱✖️6️⃣ Для работы понадобится от 2 до 6 смартфонов, начиная от iPhone 8 и новее, с установленной iOS 16. Видео можно записывать хоть в студии, хоть на улице — продвинутый ИИ в любом случае вытащит из ролика всю информацию, необходимую для создания анимации.

💰 Бесплатная версия ограничена по времени, за безлимит придется платить $365 в год.
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Tesla показала, как размножаются роботы 🤖♥️🤖

Во время Investor Day 2023 компания показала видео, где 2 человекоподобных робота Optimus собирают своего собрата. До работы на линии сборки ребятам еще далеко — уж слишком медленно они все делают .

Но в Tesla напирают на то, что, когда робота впервые показали в октябре прошлого года, он в принципе не мог передвигаться, а еще годом ранее роль Optimus играл человек в костюме (привет роботу Алеше!). Так что еще через полгода Optimus, возможно, составит конкуренцию роботам Boston Dynamics 🤜.

Глава Tesla Илон Маск от Optimus в восторге и уже заявил, что в будущем подобных роботов на Земле будет больше, чем людей 🌏.

🚘 Кстати, Optimus частично состоит из тех же деталей, что и электромобили Tesla, а также использует ИИ, который в машине отвечает за работу автопилота.

Даже приблизительную дату выхода робота на ивенте не назвали.
6🥰1🤯1
Snapchat и Илон Маск сразятся с ChatGPT, МТС будет следить за поведением клиентов, Binance тестирует NFT-генератор — и другие важные новости за неделю

Xiaomi показал беспроводные AR-очки Wireless AR Glass Discovery Edition, в которых можно одним кликом переключаться между реальным миром и дополненным, а также управлять устройством жестами;

Nvidia предсказали, что в течение 10 лет появятся ИИ-модели, которые будут «в миллионы раз мощнее», чем ChatGPT;

Соцсеть Snapchat разрабатывает конкурента ChatGPT. Сначала он будет доступен только платным подписчикам;

Илон Маск так расстроился, что его стартапу Neuralink не разрешили тестировать мозговой имплант на людях, что тоже занялся разработкой альтернативы ChatGPT;

МТС при создании рекламы теперь будет использовать технологию «интернета поведения» — анализировать поведенческие паттерны клиента, чтобы понять, как точно заставить его что-нибудь купить;

Децентрализованная альтернатива Twitter под названием Bluesky запустилась, но пока доступна только по инвайтам. Один из инвесторов проекта — сооснователь Twitter Джек Дорси;

ИИ-генератор NFT от Binance наминтил 10 тыс. токенов за 2,5 часа. NFT можно использовать в качестве аватаров;

OpenAI выпустил API для ChatGPT и системы распознавания речи Whisper. Теперь разработчики смогут встроить чат-бота в свой сайт по стоимости $0,002 за 750 слов;

ВКонтакте разрешил селебам и брендам выпускать на платформе коллекции NFT.
👍61
This media is not supported in your browser
VIEW IN TELEGRAM
TikTok добавил AR-beauty-маску, которую не отличить от реальности. Почему пользователи недовольны? 🫦 👎

В конце февраля в TikTok появилась новая маска Bold Glamour, которая максимально подгоняет внешность пользователя под нереалистичные стандарты обложек модных журналов: акцентирует скулы, делает идеальный макияж, меняет форму носа, лба, разрез глаз — короче, делает виртуальную пластическую операцию 💉. Видео с хештегом Bold Glamour набирают десятки миллионов просмотров 👀.

Фильтр сделан настолько качественно, что не «рассыпается», даже когда пользователь проводит рукой по лицу или меняет положение головы. Вероятно, Bold Glamour использует генеративный ИИ — скорее всего GAN. TikTok официально это не подтверждает. Обычно подобные фильтры работают с большим количеством самых разных артефактов и глюков 🫥.

К безупречной с технической точки зрения технологии у пользователей нашлась масса морально-этических вопросов. Пользователи пишут, что маска наносит сокрушительный удар по их самооценке и вообще вредит психическому здоровью. Эксперты с ними согласны, а в СМИ вышли десятки материалов, почему Bold Glamour — это вредно ✖️.
👍9😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Сервис, который даст поболтать по душам с любым PDF-документом 🗣📃

ChatPDF предлагает загрузить любой PDF-документ на компьютере и превратить его в чат-бот (из-за высокой загрузки сервиса размер файла ограничен 50 страницами).

📚 Для этого сервис сначала с помощью семантического индексирования анализирует каждый параграф текста по ключевым словам и их синонимам. Затем, когда пользователь задает вопрос по тексту, ChatGPT находит релевантный параграф и дает ответ. Мы протестировали сервис и можем подтвердить, что ChatPDF не только за пару секунд находит нужную информацию, но и подскажет, на какой странице документа она находится ☝️.

Иногда у ChatPDF случаются ошибки, он может подкинуть информацию, которой в PDF-документе нет. Разработчики обещают это исправить .

Кстати, ChatPDF один из первых сервисов, который интегрировал недавно выпущенный API ChatGPT.
🔥151
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ-сервис, который омолаживает весь Голливуд 🎬 👶

Fast Company рассказал о компании MARZ (Monsters Aliens Robots Zombies), которая с помощью своей программы Vanity омолаживает актеров. Среди их проектов: последний фильм про Человека-паука, «Очень странные дела», сериал «Академия Амбрелла», новая часть «Индианы Джонса» 📽.

🎭 Перед работой Vanity изучает лицо актера на пяти снимках, создавая с помощью ИИ его «омоложенную» маску. Затем Vanity анализирует весь отснятый материал и автоматически накладывает маску на нужного актера. Если программа где-то накосячила, то результат можно отредактировать вручную.

🤑 Vanity позволяет серьезно сэкономить на производстве. Когда омолаживанием актеров занимаются люди, которые «вручную» обрабатывают каждый кадр, то на пятисекундный фрагмент фильма может уйти до 16 часов. У Vanity на тот же самый фрагмент уйдут минуты. Благодаря программе бюджет на цифровое омоложение актеров снижается примерно вполовину — с $1 млн–$5 млн до $500 тыс.–$400 тыс.

MARZ обещают, что следующая версия Vanity сможет не просто убирать морщины, а изменять анатомию лица, чтобы омолодить актера не на 15, а на 30 лет или больше. Компания также работает над программой LipDub, которая с помощью ИИ помогает синхронизировать движение губ актера с текстом на любом языке. Это важно для неанглоязычных стран, где высокобюджетные фильмы в большинстве случаев идут в дубляже 🤬.
👍10
😱 ChatGPT для работы скоро понадобится больше 30 тыс. GPU

К такому выводу пришла исследовательская компания TrendForce. Это на 10 тыс. чипов больше, чем требуется сейчас. Причиной эксперты называют не столько требовательность чат-бота и языковой модели GPT (на ней построен ChatGPT) к ресурсам, сколько их растущую коммерциализацию 💵. Все больше сторонних компаний будут использовать чат-бот, а значит, все больше графических чипов понадобится для обработки данных.

Больше всего от такого положения дел, вероятно, выиграет Nvidia, чей процессор A100 широко используется для подобных целей 🎉. Компания может получить около $300 млн прибыли благодаря сервису OpenAI. Стоимость одного A100 варьируется от $10 тыс. до $15 тыс. При этом система DGX A100, которая состоит из нескольких GPU, продается почти за $200 тыс. 😵‍💫

Nvidia уже второй раз за последние несколько лет оказывается в нужное время в нужном месте. До этого компания хорошо заработала на майнинге криптовалют. Только за 2021 год Nvidia продала систем, заточенных под добычу, на $550 млн. 🕺
🔥9👍2
Stable Diffusion научили визуализировать мысли 👨‍🎨 🧠

Ученые из университета в японском городе Осака использовали нейросеть, чтобы восстановить изображение по снимкам, сделанным с помощью функциональной магнитно-резонансной томографии (фМРТ) 🧲. Нечто похожее мы уже видели у Meta*.

🤖Кроме SD исследователи использовали еще 2 обученные ими ИИ-модели. Одна из них отвечала за сопоставление с изображением информации с фМРТ-снимка, полученной из части мозга, которая отвечает за распознавание визуальной информации 🖼. Другая модель получала информацию со снимка той части мозга, которая отвечает за «расшифровку» визуальной информации в смысловую. Эту информацию ИИ затем сопоставлял с текстовыми описаниями изображений 🤯.

Потом информацию, полученную двумя ИИ-моделями, переносили в SD, которая генерировала изображения. По оценке исследователей, точность визуализации составляет около 80% 🎯. Ее можно оценить по скриншоту выше, где крайнее изображение слева — это картинка, которую видел человек во время томографии, а крайнее справа — результат работы алгоритмов.

Практического смысла в эксперименте пока нет: исследователи использовали снимки, полученные всего от четырех человек, и в каждом случае ИИ приходилось настраивать по-разному. Можно представить сколько времени уйдет на такой эксперимент с сотнями или тысячами участников 📆.

* — запрещенная на территории РФ организация
🔥101
❗️ GPT-4 — уже на следующей неделе!

Об этом проговорился технический директор немецкого офиса Microsoft Андреас Браун, выступая на мероприятии, посвященном искусственному интеллекту. Судя по всему, пока речь идет об официальном анонсе, а не о полноценном релизе языковой модели 👅.

📹 Браун рассказал, что GPT-4 будет мультимодальной и, в частности, будет поддерживать видео. Другими подробностями он не поделился, но пообещал, что выход модели можно будет сравнить с появлением первого айфона.

🗓 Возможно, анонс состоится в ходе конференции The Future Of Work With AI, которая состоится 16 марта. В ней примет участие глава Microsoft Сатья Наделла.

Уже сейчас мы точно знаем, чего в GPT-4 не будет — 100 трлн настраиваемых параметров. Про другие слухи о том, какой будет языковая модель, можете в ожидании анонса почитать вот здесь.
😱6🤩2
Рабочая неделя была короткой, но важные новости все равно есть

Сова Duolingo объединится с OpenAI для создания чат-ботов, которые помогут выучить новые языки;

Slack анонсировал чат-бота, который будет общаться с вашими коллегами по работе за вас;

Поисковик Bing от Microsoft впервые за почти 14 лет существования может похвастаться 100 млн активных пользователей за день. Причина, конечно же, в интеграции искусственного интеллекта;

Один из главных конкурентов OpenAI, стартап Anthropic (подробнее о нем здесь), привлек $300 млн инвестиций при оценке больше $4 млрд. Ранее $400 млн в компанию вложил Google.
👍13🔥1
Дейтинг-приложение, где у вашего аватара жизнь будет интереснее, чем у вас 🥂

В Snack можно создать версию себя, которая будет ходить на свидания с другими аватарами в местной метавселенной. Чтобы аватар был похож на свою физическую версию, пользователю придется ответить ИИ на несколько личных вопросов .

🚨 Программа сообщит пользователю, если аватар найдет ему пару, а пользователь сможет решить, стоит ли встречаться IRL. Но если аватару очень понравится свидание, то вам он ничего о нем не расскажет (шутка!).

Авторы Snack обещают в будущем дать возможность сходить сначала на виртуальное свидание, а уже потом встречаться по-настоящему 🤝.

📹 Snack существует уже 2 года. Изначально идея приложения была в том, чтобы объединить Tinder и TikTok — вместо анкет пользователи приложения выкладывали короткие видео.

🤖 Стартап получил в 2021 году $3,5 млн инвестиций, но пока так и не добился серьезной популярности. Возможно, все потому, что у сервиса не было аватаров, обученных искусственным интеллектом!
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
🗣 ИИ научили синтезировать реалистичную речь с помощью YouTube и подкастов

В большинстве случаев ИИ, который генерирует речь, обучают на датасетах, где записана речь профессиональных актеров. Из-за этого человеческому уху синтетический голос кажется безэмоциональным и монотонным 😑.

Чтобы исправить ситуацию, исследователи из университета Карнеги-Меллона в США решили тренировать искусственный интеллект на видео с YouTube и подкастах. Прослушав почти 900 часов такого контента, модель научилась реалистично делать паузу, использовать междометия и слова-паразиты 🤬. Работу ИИ можно оценить на записи выше.

👍 👎 Людей, которых просили оценить реалистичность голоса, поставили ему 3,89 по пятибалльной шкале. Это выше, чем в среднем получают подобные ИИ-модели (настоящий человеческий голос получил оценку 4,01).
🔥13
Media is too big
VIEW IN TELEGRAM
Чудо-сервис для работы с CGI от Циклопа из «Людей Икс» 🪄

🧙‍♀️ Wonder Studio не требует дорогостоящего оборудования для mocap-а, а работа со спецэффектами становится не сложнее, чем использование фильтров в Photoshop, утверждают создатели. Сервис с помощью ИИ «распознает актера с одной камеры, отвечает за операторскую работу, свет и цветокоррекцию, заменяет человека на CG-модель». Журналистам удалось посмотреть на Wonder Studio в работе, и они говорят, что результаты действительно впечатляют 😧.

🎬 Оба основателя компании Wonder Dynamics, которая разрабатывает Wonder Studio, не понаслышке знают, что такое производство фильмов — и Никола Тодорович и Тай Шеридан профессиональные актеры. Шеридан, например, снимался в главной роли у Стивена Спилберга в «Первому игроку приготовиться» и нескольких частях «Людей Икс». На разработку Wonder Studio у них ушло 3 года. Тодорович и Шеридан настаивают, что их сервис создан, чтобы помочь профессионалам, а не заменить их с помощью алгоритмов 🤝.

🦸‍♂️ Wonder Studio находится на стадии бета-тестирования, но его уже используют в своем следующем проекте режиссеры Джо и Энтони Руссо («Мстители», «Серый человек», «Первый мститель»).

Спецэффекты становятся одной из главных областей применения искусственного интеллекта. За последнее время мы уже рассказывали о двух похожих продуктах: Move AI и MARZ.
😱10🔥6
OpenAI выпустил GPT-4. Что в ней нового?

Как и обещал Microsoft — 14 марта OpenAI официально презентовал следующую версию языковой модели GPT — GPT-4.

Основные изменения в новой версии:

🖼 GPT-4 понимает не только текст, но и визуальную информацию (пока без видео). Мультимодальная модель может рассказать, что именно изображено на иллюстрации, и даже объяснить ее смысл. В демо GPT-4 объяснил визуальную шутку, где к айфону подключен древний VGA-кабель, а также рассказал, что можно приготовить из ингредиентов, изображенных на картинке;

🧠 GPT-4 отличается хорошей памятью. Если предыдущая версия могла запомнить 8 тыс. слов, то GPT-4 легко запомнит 25 тыс. OpenAI анонсировал суперверсию ИИ, которая запоминает около 64 тыс. слов (т. е. около 50 страниц текста). Это позволит модели вести длинные диалоги и генерировать более объемные тексты;

💬 GPT-4 готова отвечать на вопросы на 26 языках, включая русский;

😌 GPT-4 будет не так просто вывести из себя, чтобы модель начала угрожать, оскорблять или просто нести чушь. Для этого ее тренировали на огромном количестве «вредоносных» текстовых подсказок;

👩‍🎓 GPT-4 прошла более 20 самых распространенных тестов на знание, в том числе математики, письма, чтения, физики, химии. В отдельных случаях модель показала результаты лучше, чем 88% проходивших тесты;

GPT-4 уже тестируют несколько крупных компаний, включая платежный сервис Stripe. В OpenAI также признались, что обновленный поисковик Bing от Microsoft, анонсированный несколькими неделями ранее, уже работал на новой версии GPT. Также в компании отказались подробно рассказывать о технических характеристиках GPT-4 — чтобы не выдать лишнюю информацию конкурентам 🤐.

GPT-4 все еще не идеальна: знания модели ограничены сентябрем 2021 года, а в отдельных случаях ИИ «галлюцинирует» — выдает некорректную или попросту выдуманную информацию 😵‍💫.

💵 Сейчас модель доступна только подписчикам платного сервиса ChatGPT Plus, разработчики могут записать в лист ожидания API. Бесплатная версия пока не анонсирована.
5🔥3👍2