D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
Nvidia начала борьбу с Microsoft за корпоративный метаверс!

Nvidia представила облачное ПО (ACE – Avatar Cloud Engine), которое содержит набор инструментов на основе ИИ для создания реалистичных аватаров и виртуальных помощников, которые будут общаться с пользователями прямо в метавселенных, причем на нескольких языках. Это важное решение для корпоративного метаверса.

ACE, например, может создать синтетический голос виртуального персонажа, который сможет вести разговоры на разные темы, благодаря языковой модели NeMo Megatron. ИИ настолько мощный, что он может пройти тест Тьюринга. А теперь сама платформа Omniverse (которая и так занималась созданием виртуального ландшафта), с помощью SDK, планирует еще сильнее упрощать создание цифровых объектов для метавселенной.

Получается идеальный симбиоз и, судя по всему, Nvidia планирует стать лидером в области метавселенной и синтетических медиа 🔥
3🔥1
ИИ-проекты расшифровывают «речь» животных 🦫🐖🐁

Guardian рассказал о нескольких проектах, которые занимаются тем, что расшифровывают «голос» различных особей, используя машинное обучение. Так Плоди Брифер (доцент Копенгагенского университета) ведет ИИ-проект, который анализирует хрюканье свиней, чтобы определить, испытывает ли животное положительные или отрицательные эмоции. Хрю-хрю 🐷

Другой проект – нейросеть DeepSqueak. Он определяет, находятся ли грызуны в стрессовом состоянии, на основе их ультразвуковых сигналов.

Еще один проект – Project CETI (что расшифровывается как Cetacean Translation Initiative) – планирует использовать машинное обучение для перевода общения кашалотов.

А кто же будет расшифровывать речь кошек или собак? Ведь нам уже давно есть что друг-другу сказать (или высказать). Только представьте, как бы перевернулся мир с такими технологиями!
🔥3🥰1😱1
Другие новости этой недели


🟣 По прогнозам аналитиков AR/VR-гарнитура от Apple, которая может выйти в начале 2023 года, может стать одним из самых дорогих предложений на рынке. Гарнитура может стоить $2 000 и выйдет в количестве всего 1,5 млн штук!


🟣 Яндекс добавил в свой браузер возможность синхронного перевода видео с помощью нейросетей, которые могут переводить с английского, немецкого, испанского, французского и итальянского языков (даже если говорят с акцентом)!


🟣 Исследователи из Стэнфорда совместно с компанией Nvidia нашли способ уменьшить VR-гарнитуры до размера обычных очков. Они использовали так называемые «блинные линзы» (pancake lenses), которые позволяют уменьшить размер VR-устройства, увеличить разрешение картинки и расширить доступное поле зрения до 200 градусов!


🟣 Создатели триллера «The Fall» с помощью нейросетей убрали из фильма несколько десятков случаев употребления мата, не переснимая при этом ни одной сцены! Мат пришлось убирать по просьбе студии Lionsgate, чтобы получить прокатный рейтинг 13+.


🟣 Издание The Information подсчитало, что стоимость земли в метавселенных обвалилась на 80%. Объем торгов на шести крупнейших платформах упал с $229 млн в ноябре 2021 года до $8 млн в июне 2022 года!


🟣 Tencent представил продвинутый ИИ для создания и редактуры текстов, который получил название Effidit. Используя большие языковые модели он может закончить текст за автора, проверить на ошибки, отредактировать, написать предложение, основываясь на ключевых словах. Алгоритм работает с английским и китайским языками.


🟣 ИИ-стартап Yoodi, помогающий бизнесменам улучшить навыки публичных выступлений, получил от инвесторов $6 млн. Алгоритм с помощью технологии обработки естественного языка (NLP) анализирует речь человека (слова-паразиты, язык тела, темп, тембр речи и т.д.) и предлагает способы как ее улучшить.


🟣 Пилоты ВВС США будут тренироваться в VR-шлемах и сражаться против врагов с ИИ. Компания Red 6, которая получила контракт от военных на $70 млн, будет ответственна за новую программу тренировок, в рамках которой американцы смогут сражаться с виртуальными версиями передовых самолетов, которые разрабатывают другие страны, в том числе Китай и Россия.


🟣 Starbucks представит новую программу лояльности c NFT, которые будут привязаны к уже существующей программе Starbucks Rewards. Эта программа позволяет зарабатывать «звезды» за каждую покупку, а затем менять их на различные бонусы. Теперь, клиенты будут получать еще и цифровой токен.


🟣 В Дании на выборы собирается пойти партия искусственного интеллекта, которую разработали участники коллектива Computer Lars. Среди предложений партии: безусловный базовый доход и создание устойчивых условий развития, которые позволят более тесно сосуществовать людям и ИИ.


#теперьтызнаешьвсё
🔥21👍1🎉1
Создали ИИ, который направлен на взаимное доверие между роботами и людьми 🤗

Существует подвид искусственного интеллекта Explainable AI или XAI, который работает по принципу «пассивная машина – активный пользователь». Он означает, что пользователи постоянно должны проверять ИИ, чтобы понять почему он пришел к тому или иному решению, но при этом сам ИИ не дает вмешиваться человеку в процесс. Типа «я сам со всем разберусь!»

Теперь ученые из США и Китая создали ИИ, который работает по принципу «активная машина – активный пользователь». Это означает, что ИИ способен обучаться и реагировать на замечания, который делает человек по ходу процесса, и корректировать свое поведение!

При этом взаимодействие с ИИ не требует от пользователя знаний языков программирования – #суперкруто
🔥3
Новый генеративный ИИ в студию 💥

На GitHub опубликовали Stable Diffusion – генеративный ИИ, который называют одним из самых перспективных среди подобных алгоритмов. Он использует наработки из нейросетей Runway и CompVis, а также Dall-E 2 и Imagen.

Говорят, что модель тестировали более 10 000 человек, которые создают 1,7 миллиона изображений в день, а вашему локальному компьютеру не нужно делать много работы – обычная видеокарта с менее чем 10Гб VRAM может создать изображение 512×512 за несколько секунд.
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Nvidia представила технологию лицевой анимации на основе эмоционального состояния актера!

Есть ПО, на основе ИИ, которое называется Audio2Emotion. Оно генерирует лицевую анимацию на основе звуковой информации, то есть на входе только голос или аудиофайл, а дальше ИИ делает все самостоятельно – корректирует лицевую анимацию, ориентируясь на голос актера, и позволяет передавать такие эмоции как боль или радость.

Мир еще никогда не анимировал на основе звуковых данных 🔊
🔥1👏1🎉1
В TikTok появился свой алгоритм перевода текста в изображения 👀

Эффект можно найти под названием «AI greenscreen», который позволяет пользователям ввести текстовую подсказку, а на выходе получить созданное по нему изображение. Это изображение потом можно будет использовать в качестве фона для своего видео.

Однако, результат картинки довольно прост по сравнению с современными моделями, такими как Imagen от Google или DALL-E 2 от OpenAI.
🔥2👍1🎉1
Можно ли сравнить работу ИИ с деятельностью человеческого мозга? Предлагаем вам 2 противоположных мнения ⬇️

Да, можно!
Quanta Magazine пишет, что сейчас для обучения ИИ алгоритмы специально оставляют пробелы, которые нейросети должны заполнить самостоятельно. Яркий пример — большие языковые модели, которым дают несколько начальных слов, чтобы они закончили предложение или целый текст самостоятельно. Ученые считают, что по такой же модели учится и человеческий мозг, который пытается предсказать или восстановить отсутствующую информацию.

⛔️ Нет, нельзя!
В Гарварде провели исследование, где попросили 169 участников оценить, насколько сгенерированные картинки соответствуют описаниям, по которым они созданы. Только 22% ответили, что картинка сгенерирована «правильно». Исследователи сделали вывод, что ИИ не может по-настоящему понять взаимосвязь между словами: на существующих примерах он обучаться способен, а придумать что-то свое еще нет.

А на какой стороне ты?
👍1
Лучшие бесплатные генераторы изображений 🆓

Большинство людей не может воспользоваться такой мощной нейронкой, как Dall-E 2. Программу открыли лишь для миллиона человек, при этом нужно долго находиться в листе ожидания, а еще платить после исчерпания лимитов на генерацию изображений.

Gizmodo составил свой список топовых генераторов изображений на базе ИИ, которые находятся в бесплатном доступе! В топ-3 вошли Midjourney, Wombo Dream и Starry AI.

На картинке результаты работы этих нейронок, слева направо:

1️⃣«Мужчина и женщина стоят под маятниковым солнцем в самом сердце Аркадии»
2️⃣«Одинокий математик стоит на пыльной планете, не владея ничем»
3️⃣«Чужеземная женщина в одиночку борется с махинациями космической импери»
1👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Venture Beat выбрал 10 самых перспективных блокчейн-стартапов 💥

Среди самых перспективных оказались графовая база данных с открытым кодом Fluree, трейдинговая платформа TabTrader и стартап MeetKai, который оцифровывает весь мир, чтобы создать его копию в метавселенной. В списке еще много крутых компаний, но почему все верят в будущее блокчейна?

По прогнозам Gartner, блокчейн-бизнесы будут расти с бешеной скоростью, достигнув 176 млрд долларов к 2025 году и 3,1 трлн долларов к 2030 году 🚀

А по оценкам Grand View Research, рынок технологии блокчейн в период с 2022 по 2030 год будет расти со скоростью 85,9% в год! Поэтому инвесторы продолжают вливать миллиарды долларов в блокчейн-стартапы.
1👍1👏1😁1🎉1
Может ли языковая модель обойтись без обучения? Ответ: ДА

По результатам опроса от компаний Dimensional Research и AIegion, 96% разработчиков ИИ заявили, что сталкиваются с проблемами, связанными с обучением моделей. Речь идет о качестве данных и их разметке, которая необходима для самого обучения. Стартап YellowAI представил решение DynamicNLP, которое избавляет от всех этих проблем 🙌🏼

DynamicNLP — это уже готовая языковая модель, которая может сразу начинать работать, получая новые данные прямо во время использования. Достигается это за счет технологии «Zero Shot Learning». С такой технологией теперь не нужно размечать данные вручную. Разговорный ИИ можно будет настроить за считанные минуты, сокращая при этом объем данных и время для обучения.
👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Ford Motors создал AR-фары 💡

Фары проецируют важную информацию прямо на дорогу, чтобы водителю не нужно было отвлекаться. С помощью такой технологии можно будет узнавать о скоростных ограничениях, ближайших разворотах и обледенелых участках дороги не только водителю, но и тем, кто находится рядом: пешеходам и велосипедистам.

Ford – не первый автопроизводитель, который придумал такие фары. До них эту технологию внедрил Mercedes-Benz, который установил «Цифровые фары» на свои автомобили Maybach. Однако, Ford может стать компанией, которая выведет эти фары на массовый рынок!

В большинстве стран использование AR-фар законодательно не прописано, поэтому их использование на серийных автомобилях пока невозможно.
🔥31👍1
Июльский дайджест D. lab 🔥

Специально для тех, кто пропустил сообщение о выходе нашего июльского дайджеста в ГИДе, вы можете прочитать его здесь.

В дайджесте ты узнаешь: что будет дальше с франшизой «Игра в кальмара», о чем договорились друг с другом Netflix и Google, для чего Spotify купил ИИ-стартап и многое другое!
1👏1
Нейросеть Stable Diffusion появилась в открытом доступе 🔥

Ранее мы писали о том, что на GitHub опубликовали Stable Diffusion, который был доступен в основном для разработчиков, а теперь им могут пользоваться все! Новые пользователи получат по 200 кредитов, которые можно потратить на генерацию картинок (одна генерация может стоить 5, 10, 20 и более кредитов в зависимости от настроек 😳)

Иллюстрации: «Премиальный внедорожник Лада, выпущенный в 2045-м году» по мнению Midjourney и Stable Diffusion. Угадайте с первого раза кто где ⬆️
🔥41🎉1
Многие владельцы NFT не понимают, как работает их право на владение токеном 🤯

В отчете инвестиционной компании Galaxy Digital сказано, что подавляющее большинство NFT не передают никаких прав интеллектуальной собственности на токен, а многие NFT-компании, включая крупнейшую Yuga Labs, вообще вводят покупателей в заблуждение! После покупки появляется надпись «искусство принадлежит вам», но это не совсем так 🧐

На самом деле они предлагают только лицензию на использование определенного токена с коммерческими правами, но не само право интеллектуальной собственности. А покупатель токена получает вместе с ним «лабиринт непрозрачных, запутывающих, сложных и запретительных» правил использования этого токена!

Обязательно изучите этот материал, чтобы избежать случаев, когда вы покупаете NFT и вам говорят, что у вас есть все права на токен, а потом переводят лицензию в Creative Commons! То есть, если владелец вдруг захочет кого-то засудить за использование его токена, то у него ничего не выйдет.
👍1
Media is too big
VIEW IN TELEGRAM
Google представил ИИ-сервис, который эффективно убирает шум с изображений 💥

Алгоритм MultiNerf анализирует необработанную фотографию, а затем убирает артефакты и шумы, которые возникают, например, при съемке в темное время суток. Алгоритм работает с необработанными данными изображения, чтобы определить, как «должны были бы выглядеть» кадры без явного видеошума.

Пока MultiNerf находится на стадии тестирования, но его может попробовать любой желающий — открытый код программы опубликован на GitHub!
🔥1👏1
На iOS появился первый текстовый редактор на основе GPT-3

Приложение ParagraphAI использует GPT-3 для анализа и составления текстов на основе подсказок, которые ввел пользователь. Приложение также может проверять написанный текст на грамматические ошибки. Как видно на скриншотах выше, приложение может создать целое эссе на заданную тему в формате и стиле, который выбрал пользователь.

В бесплатной версии приложение предлагает генерирование 20 параграфов текста в день.
🔥1
Международная гонка за квантовые вычисления продолжается ⚡️

Китайская компания Baidu представила свой квантовый компьютер, который назвали Qianshi. Он оснащен 10-кубитным процессором, при этом в компании говорят, что у них уже готов 36-кубитный вариант! Baidu уже готова предоставлять вычислительные мощности Qianshi сторонним клиентам, но способы практического применения квантовых компьютеров пока находятся на достаточно примитивном уровне.

Мощности компания Baidu пока что в несколько раз меньше, чем у конкурентов. Например, в чипе от IBM – 127 кубитов, а Google до конца десятилетия собирается выпустить квантовый процессор на миллион кубитов 😳

По данным исследователя рынка IDC, к концу 2027 года мировые правительства и компании вложат около 16,4 миллиарда долларов в развитие квантовых технологий.
🔥21🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ собирается «захватить» мир моды, генерируя дизайн одежды 😱

Нейросеть Dall-E продолжает прокладывать путь в творческие индустрии. На этот раз Dall-E использовали для создания дизайна одежды: нейросеть сгенерировала десятки луков за несколько секунд 👕👗👔

Автор видео предположил, что модные дома в будущем смогут использовать ИИ для генерирования новых идей.
1🔥1😱1
На фестивале в Каннах победила короткометражка, сделанная с применением ИИ. Вот как ее создавали 🙌

Цифровой художник и аниматор Гленн Маршалл прославился созданием клипа на песню Daft Punk, в котором с помощью ИИ генерировал визуальные спецэффекты. Теперь Маршалл решил использовать ИИ для генерации целых видеофрагментов!

Автор при создании короткометражки The Crow вдохновлялся другим коротким метром — Painted, который можно посмотреть на YouTube. Кадры из Painted Маршалл загружал в нейросеть CLIP, а затем просил алгоритм создать «ворона в безлюдном пространстве».

На этом Маршалл не останавливается: он продолжает изучать нейронку CLIP и хочет научиться добавлять 3D-анимации с помощью ИИ в лайв-режиме. Ждите новых фильмов, сгенерированных с помощью ИИ 😉
🔥61