D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
❄️ ☘️ InstructPix2Piх за секунду поменяет зиму на весну с помощью промпта

Модель справляется с редактурой за несколько секунд и при этом не требует от пользователя навыков написания промптов, понимая обычный разговорный язык. Обычно в таких случаях используются отдельные программы, которые генерируют «правильные» подсказки 🧐.

Для обучения InstructPix2Piх разработчики использовали GPT-3 и Stable Diffusion, а также 450 тысяч пар синтетических изображений и инструкций по их редактированию.

⌨️ Исходный код доступен на GitHub, а протестировать модель можно на Hugging Face.
🔥4👍1
🌟 Японцы запустят персонализированную рекламу с цифровыми аватарами звёзд

CyberAgent совместно с Nvidia будет использовать искусственный интеллект для создания видео с цифровыми версиями местных знаменитостей, таргетированных на конкретных пользователей 👩‍🎤.

Это значит, что поведение аватаров и текст, который они произносят, будет индивидуальным. Для таргетирования реклама от CyberAgent будет использовать информацию о том, на какие сайты заходил пользователь и какую информацию искал. На первых порах синтетическую рекламу будет отсматривать живой человек, но в будущем ИИ хотят дать полную автономию 🤖.

💵 CyberAgent уже использует алгоритмы для производства рекламных баннеров. За 3 месяца искусственный интеллект создал 70 тысяч рекламных объявлений, при этом у одного объявления может быть 30–40 таргетированных версий. Агентство потратило почти $8 млн на систему, которая обеспечивает работоспособность ИИ.
🔥4
🗞 Основатели Instagram анонсировали новую соцсеть, в которой главное — новости и искусственный интеллект

В основе Artifact, по словам Кевина Систрома и Майка Кригера, лежат три вещи: статьи, факты и искусственный интеллект. При первом запуске соцсеть предложит новостной фид, который будет постепенно персонализироваться — в зависимости от того, какие новости интересны пользователю. За персонализацию будут отвечать ИИ-алгоритмы на основе машинного обучения.

👥 Социальный компонент, который появится в Artifact позже, будет заключаться в том, что в фид пользователя будут периодически попадать новости из лент других пользователей, на которых он подписан. Интересные новости можно будет обсудить в директе. Artifact уже называют «TikTok для текстов».

📆 Интригует, правда? На сайте проекта уже можно записаться в очередь, чтобы получить доступ к бета-версии приложения, когда она будет доступна.
This media is not supported in your browser
VIEW IN TELEGRAM
🍔 Ассистент в браузере, который закажет еду, настроит ПК, а потом расскажет об этом подписчикам в Twitter

Продолжаем рассказывать про «умные» браузерные расширения на основе GPT и ChatGPT. Предыдущие посты: раз, два, три.

Multion — это новая попытка создать расширение для браузера на основе ChatGPT, которое по факту будет выполнять функции голосового помощника. В видеодемонстрации Multion заказывает гамбургер в ближайшем ресторане, помогает разобраться с видеоредактором Final Cut Pro и подписывает пользователя на почтовую рассылку 🛠.

Собственноручно ассистента протестировать пока нельзя, но можно встать в очередь на сайте проекта.
🔥5
☠️ Создатель Gmail дал Google ещё 2 года

После этого сервисы вроде ChatGPT полностью сломают бизнес-модель компании, написал Пол Бакхейт в своем треде в Twitter. ИИ «убьёт» страничку Google с результатами поиска, которая сейчас является главным источником заработка для компании.

«Даже если они догонят ИИ, то все равно не смогут интегрировать его, не уничтожив самую ценную часть своего бизнеса», — сказал он 💣.

Программист не одинок в своих прогнозах. Недавно мы рассказывали, что в Google сильно напряглись из-за появления ChatGPT и бросили все силы на разработку конкурента чат-бота.
This media is not supported in your browser
VIEW IN TELEGRAM
Nvidia прокачала NeRF-модель и добавила к ней VR

Помните, как Nvidia оптимизировала Instant NeRF и в 60 раз сократила количество ресурсов, которых требует модель для работы?

Теперь пользователь может еще и быстро сгенерировать виртуальное пространство из 2D-изображения: синтетического или запечатленного на камеру. С VR-объектами можно использовать все передовые фишки Nvidia для рендеринга: алгоритмы динамического масштабирования, сглаживания, фовеации и т.д. — если вам это о чем-то говорит, конечно 😝.

Для получения лучшего результата компания также добавила опциональную поддержку второго GPU 💪.

Исходный код доступен на Github.
🔥4
Media is too big
VIEW IN TELEGRAM
🧙‍♂️ Этот ИИ-редактор может сделать с видео вообще всё

Работающая на основе диффузионного метода модель Dreamix создает видео из нескольких статичных изображений, генерирует и редактирует видео через текстовую подсказку, может корректно анимировать предмет на изображении и много чего еще.

🐶 Из презентации видно, что модель пока сыровата, и с одними задачами справляется лучше, чем с другими (взгляните на криповую собачку на 30-й секунде видео), но и в таком виде впечатляет.

😳 Попробовать Dreamix пока не дают, так что можно только восхищаться тем, что сгенерировали разработчики.
👍4
Google так испугался ChatGPT, что Сергей Брин снова начал кодить ⌨️

Ходят новости, что Брин впервые за несколько лет запросил доступ к программному коду в корпоративной системе. Код относится к чат-боту LaMDA, который компания рассматривает в качестве главного конкурента ChatGPT.

🍹 Брин практически не уделял внимания повседневной работе компании с 2019 года.

Помимо LaMDA в Google работают и над другими сервисами на основе ИИ: во всю тестируют чат-бот Apprentice Bard и проект под названием Atlas, который называют «экстренным» ответом ChatGPT. В разработке находится и новый дизайн десктопной версии поисковика Google, который выдает развернутые ответы на запрос, а не просто набор ссылок.

🥊 Некоторые считают, что паника Google вполне оправдана, ведь у компании есть всего пару лет, чтобы перестроить бизнес-модель, пока ChatGPT и похожие сервисы не сломали её об колено.
🔥5
У Baidu будет свой ChatGPT, у Яндекса будет свой ChatGPT, а у ChatGPT будет премиум-версия — и другие важные новости за неделю

Китайский технологический гигант Baidu не хочет отставать от западных коллег и тоже скоро представит свой аналог ChatGPT. Сервис должны запустить уже в марте.

Свой чат-бот будет и у Яндекса. Запуск запланирован до конца 2023 года, постепенно чат-бота будут интегрировать в сервисы компании, включая поиск.

Open AI выпустили инструмент, который помогает определить текст, сгенерированный искусственным интеллектом. Компания предупреждает, что продукт пока далек от совершенства: дает правильный ответ менее чем в 30% случаев и плохо работает с текстами короче тысячи знаков.

Все те же Open AI наконец определились, сколько будет стоить премиум-версия (да-да, снова он) ChatGPT. Тарифы будут начинаться от $20 в месяц, как и обещалось ранее — пользователи получат более быструю и стабильную версию чат-бота, плюс ранний доступ к новым функциям. Кстати, ChatGPT стал сервисом с самой быстрорастущей аудиторией эвер. За один только январь у него было 13 млн уникальных посещений — в два раза больше, чем в декабре.

Тома Хэнкса омолодят с помощью нейросетей для нового фильма Роберта Земекиса (трилогия «Назад в будущее»). Над технологией работают те же люди, которые делали вирусные дипфейки с Томом Крузом.

Рубрика «Лузер недели»: подразделение Meta*, ответственное за метавселенную и VR, за год получило убыток почти на $14 млрд. До этого Марк Цукерберг предупреждал инвесторов, что в ближайшие годы Reality Labs продолжит терять деньги.

*Организация, запрещенная на территории РФ
👍42
This media is not supported in your browser
VIEW IN TELEGRAM
🎶 Новый день — новый музыкальный ИИ от Google

🎙 На этот раз подразделение Google Research показало алгоритм SingSong, который может создать музыкальный трек к пению а капелла.

ИИ тренировали на 46 тысячах часах музыки, в которых алгоритм должен был отделить вокальную часть от инструментальной. В итоге искусственный интеллект научился создавать музыкальное сопровождение даже для вокальных партий, которых не было в учебном датасете.

🎧 Google протестировал на людях результаты работы SingSong. Оказалось, что в 66% случаев участники тестирования предпочитали вариант, созданный ИИ, а не написанный профессиональными музыкантами.

Но есть нюанс: пока SingSong корректно работает только с профессиональными вокалистами 😔.
🔥5
❗️Так вот ты какой, северный олень новый Bing: появились первые скриншоты поисковика Microsoft с ChatGPT

🪄 Их опубликовал дизайнер Оуэн Йин в блоге на Medium. Йин говорит, что использовал Edge как браузер по умолчанию, и в какой-то момент у него загрузилась обновленная версия Bing. Он успел протестировать ее несколько минут (позже скриншоты обновленного поисковика опубликовали еще несколько пользователей).

🤫 С большой долей вероятности скриншоты — не фейк, но Microsoft их официально не комментировал.

🔍 В интерфейсе появилась отдельная кнопка, которая запускает чат-бот. Bing также предлагает варианты дополнительных запросов по теме. К каждому ответу Bing дает несколько источников информации. Обычный поиск при этом остался на месте.

🛠 По слухам, Bing будет работать на новой языковой модели GPT-4. Какую версию тестировал Йин и другие пользователи, пока непонятно. Также есть информация, что Microsoft работает над мобильной версией ChatGPT.
😱3👍1🔥1
Media is too big
VIEW IN TELEGRAM
Сказ о том, как Netflix анимешников разозлил

На стриминг-сервисе вышло короткометражное аниме «Пёс и мальчик», в котором при создании фона были использованы нейросети. Netflix сообщил об этом в Twitter и объяснил решение «дефицитом» художников в индустрии, назвав такой способ работы «экспериментальным».

Фанаты жанра пришли в ярость, увидев в этом банальное желание сэкономить, хотя японские аниматоры в среднем и так зарабатывают меньше $2 за кадр. Многим не понравились финальные титры «Пса и мальчика»: в них не указано имя человека, работавшего над фоном, а написано просто «ИИ (+человек)».

В защиту стриминг-сервиса можно сказать, что короткометражкой занималось подразделение Netflix Anime Creators Base, которое изначально было создано для увеличения производства аниме-контента «с помощью новых инструментов и методов».
😱3🤬3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
‼️ Google анонсировал ответ ChatGPT: пока не продают, только показывают

🪕 Чат-бот называется Bard и работает на языковой модели LaMDA.

Подробностей про него пока не много. Сейчас чат-бот доступен ограниченному числу тестировщиков, в ближайшие недели его собираются сделать публичным. Изначально Bard выпустят в облегченном виде, который не требует серьезных вычислительных мощностей, а значит его смогут попробовать больше пользователей. Больше пользователей = больше фидбека 👥.

Поспешность, с которой Google анонсирует своего чат-бота, легко объяснить: ChatGPT уже несколько месяцев — главная технологическая тема; Microsoft потихоньку начинает показывать обновленный поисковик Bing с интегрированным ChatGPT. Google на этом фоне надо было срочно показать свой продукт, даже если его пока нельзя «потрогать» 👉.

Буквально через несколько минут после анонса Bard, Microsoft вдруг объявил о специальном ивенте, где, вероятно, официально покажут обновленную версию Bing с чат-ботом 🤔.
🔥5
Media is too big
VIEW IN TELEGRAM
🧙‍♀️ Новая нейросеть от волшебников из Runway — на этот раз Video2Video

С помощью Gen-1 можно редактировать исходное видео, используя текстовые подсказки, можно взять визуальную стилистику изображения и перенести её на видео (приблизительно как здесь), а можно отредактировать отдельный объект 🎞.

Вместо тысячи слов лучше потратить 1,5 минуты и посмотреть крутейшее видео 👁.

Как обычно у Runway, нейросеть уже можно попробовать (да, мы смотрим на тебя, Google 🫵).
👍6🔥3😢1
🕺 Microsoft взрывает танцпол с браузером и поисковиком с встроенным ChatGPT

Компания успела быстрее Google и официально представила обновленные версии Bing и Edge, в которые интегрирован чат-бот. Чат-бот работает на следующей версии языковой модели GPT, правда, Microsoft не уточняет — это полноценная GPT-4 или что-то промежуточное. Информацию поисковик выдает актуальную, а не как в случае с ChatGPT, знания которого были ограничены 2021 годом 📅.

🔍 Поисковик Bing в стандартном режиме теперь может выдавать развернутые ответы на пользовательские запросы или работать как чат-бот. Выглядит примерно так же, как показывали пользователи, которым удалось протестировать новый Bing за несколько дней до официального анонса. В качестве примера компания продемонстрировала, как поисковик в режиме чат-бота может составить план пятидневной поездки в Мексику.

🖋 У браузера Edge появился сайдбар, через который ИИ может сгенерировать пересказ ключевых моментов большой статьи, а также создать текст разного формата на основе промпта. Это может быть электронное письмо, публикация для соцсети и так далее.

Обновленные версии сервисов пока доступны ограниченному количеству пользователей, постепенно его будут расширять. Вот тут можно записаться в очередь и посмотреть, как работает поисковик, потыкав в уже готовые запросы. Доступ к новой версии можно получить быстрее, если сделать Edge браузером по умолчанию и скачать приложение Bing на компьютер 🖥.
🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
Бот для Telegram, который научит только хорошему

Дизайнеры из Израиля запустили для мессенджера бот Edward Teach Bot. За несколько минут он создаст обучающий мини-курс на любую тему, да ещё и проиллюстрирует его с помощью нейросетей.

Разработчики использовали языковую модель Davinci 003 от OpenAI и нейросети Dall-E и Midjourney.
🤯6👍1
🔈Ультразвук сделает ваш экран по-настоящему сенсорным

Исследователи из Делфтского технического университета в Нидерландах, воздействуя ультразвуком на тачскрин, воссоздали ощущения прикосновения к физической клавише 🫳.

📱 Под воздействием ультразвука меняется сила трения плоской поверхности экрана о человеческую кожу — звуковые волны замедляют движение пальца, что и создает ощущение прикосновения.

Ученые пока сами не до конца понимают, как именно им удалось добиться такого эффекта и насколько устойчиво его можно воспроизводить. Кроме того, ощущения оказались не настолько яркими для людей с огрубевшей кожей 👷‍♂️.

Исследователи считают, что их находку можно использовать в VR-устройствах и в следующем поколении тачскринов. Например, у пользователя наконец-то отпала бы необходимость постоянно смотреть на экран, чтобы совершить действие 👀
🤔3👍2