D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
👩‍🎨 Я так вижу: художников попросили изобразить искусственный интеллект

Принадлежащая Google компания DeepMind в рамках проекта Visualising AI попросила 13 художников представить, как мог бы выглядеть искусственный интеллект и процесс его работы.

Получилось очень круто и очень абстрактно 😱.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍1
🎼 YouTube научился искать музыку по мычанию

🎤 Такая опция появилась в поисковике видеохостинга. Теперь можно попробовать найти песню, не зная ни исполнителя, ни название трека, ни даже слов — просто напев/намычав мелодию (зависит от ваших способностей).

👂 Можно пойти и более скучным способом — дать приложению YouTube несколько секунд послушать трек, который не удается распознать самому. Как в Shazam, который c 2018 года принадлежит Apple.

🎞 Сервис шел к этому обновлению довольно долго: еще в 2020 году аналогичный функционал добавили в приложение поисковика Google.

Разработчики подтверждают, что технология осталась прежней, но работает теперь гораздо быстрее — песню можно найти, напевая мелодию несколько секунд, а не 10–15 секунд, как было раньше ⚡️.

Пока такой поиск работает для небольшого количества пользователей, которые используют приложение YouTube на Android-устройствах.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔53👍1
McKinsey упростил жизнь сотрудникам с помощью генеративного ИИ

🧠 Сервис Lilli — это платформа с доступом к базе знаний компании. Это не только более 100 тыс. документов, но и сеть экспертов из более чем 70 стран. Разработкой Lilli занималось ИИ-подразделение компании — QantumBlack.

🔎 Инструмент упрощает сотрудникам работу на начальных этапах исследования: поиск релевантной информации и экспертов с глубоким знанием темы. Найденную информацию алгоритм представляет в виде нескольких ключевых тезисов со ссылками и контактами экспертов.

VentureBeat пишет, что интерфейс и принцип работы Lilli будет знаком любому, кто пользовался ChatGPT. Модель использует LLM от OpenAI и Cohere.

В консалтинговой компании утверждают, что раньше подготовительный этап мог занимать несколько часов или даже дней, а сейчас в некоторых случаях сократился до минут. Модель может искать информацию не только во внутренних, но и во внешних источниках.

🤔 Сотрудники очень хвалят Lilli за нестандартное «мышление»: например, один из них рассказал, как искал информацию о способе производства, который обычно используют в фармацевтике, но ИИ нашел релевантный пример в строительной сфере.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥2
Google выпустил ИИ-ассистента, который будет ходить за вас на совещания 🧳

Сегодня уже сложно удивить кого-то возможностями ИИ-ассистента, но Google с его Duet AI это удалось:

📊 Duet может создавать презентации на основе информации из писем в Gmail и документов в Drive. Алгоритм сам прошерстит нужные файлы и сгенерирует слайды;

🫦 Duet может добавить студийный свет и звук для созвона с коллегами. Помощник даже может стать немножко фотошопом и подправить лицо пользователя, если он слишком усердно веселился прошлым вечером;

✍️ Ассистент запишет встречу с коллегами, сделает ее краткий пересказ и выделит ключевые моменты созвона;

💬 Duet может по информации со слайда сгенерировать речь для презентации;

👥 Ну и самое занятное — Duet может за вас поучаствовать в видеовстрече. Через функцию Attend for Me ИИ сгенерирует несколько тем и предложит обсудить их остальным участникам, пока вас нет. После встречи, в которой он поучаствовал за вас, Duet также любезно перескажет ее содержание.

Все эти и другие чудеса будут доступны за $30 в месяц за одного пользователя для крупных компаний- пользователей Google Workplaces. Для малого бизнеса цена может быть меньше, но в Google пока не решили на сколько.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥2😁21🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
📸 ИИ создаст детальную модель человека по одному фото

🧍‍♂️ TeCH генерирует реалистичную 3D-модель одетого человека (разработчики особенно напирают на то, что именно одетого).

🧑 Под реалистичностью понимается то, что TeCH точно передает строение тела, черты лица и складки на одежде спереди и сзади.

🍑 Авторы вообще считают, что их коллеги недостаточно внимания уделяют тому, чтобы 3D-модели, которые генерирует нейросеть, детально выглядели и со спины тоже. И поэтому решили сами это исправить.

💬 TeCH работает с помощью автоматически генерируемых промптов, которые детально описывают внешний вид человека, и донастроенной диффузионной Text-to-Image модели.

В скором времени на GitHub должен появиться код.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🧐 DeepMind придумал утилиту, которая пометит и найдет нейроизображения

🔧 Инструмент SynthID может поставить вотермарку на изображение, сгенерированное нейросетью, а также вычислить по ней — синтетическое перед вами изображение или нет.

👀 Вотермарка «вставляется» прямо в пиксели изображения, что делает ее незаметной для человеческого глаза, но помогает SynthID быстро распознать «синтетику».

Кроме того, такую вотермарку практически невозможно удалить с изображения, в отличие от обычных вариантов, которые уже научились удалять сами нейросети. Метка остается на месте, даже если изображение отредактировали каким-то фильтром 🧽.

⚠️ У SynthID есть три уровня «уверенности»: вотермарка обнаружена, не обнаружена или возможно обнаружена

Тут важно уточнить, что пока SynthID находиться на этапе бета-теста и работает только с нейросетью Imagen от Google. Разработчики уверяют, что к инструменту легко будет прикрутить поддержку и других популярных моделей.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
Coca-Cola начала использовать нейросети для создания красивых QR-кодов

🌞 Помните, в начале лета мы рассказывали, как пользователи Reddit научили Stable Diffusion генерировать эффектные QR-коды?

📆 Что ж, прошло чуть меньше 3-х месяцев и тем же самым занялись транснациональные корпорации, а конкретно — Coca-Cola.

QR-коды появятся в кинотеатрах, на стадионах и парках развлечений по всем США. Ссылки в кодах будут вести на сайт музыкальной платформы Coke Studio, через которую Coca-Cola продвигает молодые таланты.

Разрабатывало кампанию рекламное агентство WPP — настоящие пионеры использования нейросетей в рекламе, о которых можно почитать здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥91
В российском вузе разрешили ChatGPT, популярные сайты борются с ботом OpenAI, пользователи больше не доверяют Zoom — и другие важные новости за неделю

Популярные сайты массово закрывают доступ к себе для GPTBot — бота OpenAI, который индексирует сайты, а полученную им информацию потом собираются использовать для обучения новых LLM. Как минимум 70 из 1 тыс. самых популярных сайтов в интернете (Amazon, Quora, Shutterstock) уже закрыли доступ для бота, их число растет на 5% каждую неделю;

Нейросеть Яндекса Шедеврум научилась генерировать видео по промпту. Генерации получаются длиной не больше 4 секунд, если получилось что-то крутое, то можно сохранить в формате mp4;

Доверие к Zoom рухнуло на 78,1% после того, как сервис решил собирать пользовательскую информацию для тренировки своих ИИ-моделей, без возможности для пользователя от этого отказаться. В итоге все изменения откатили обратно, но осадочек остался;

У VR-аватаров Meta* появились ноги! Весь интернет еще год назад смеялся над их отсутствием и над тем как в целом стремно аватары выглядят. Цукерберг тогда пообещал все исправить, и спустя год конечности наконец появились. Правда, пока не во всех приложениях;

В Китае появились первые сервисы с генеративным ИИ, которые получили по новым правилам лицензию от властей на работу. Среди счастливчиков есть аналог ChatGPT от Baidu под названием Ernie Bot;

Московский вуз разрешил использовать чат-боты при написании дипломных работ. В МГПУ предупредили, что использовать нейросети можно только в том случае, если студент самостоятельно «проанализирует и переработает» информацию, которую для него нашел чат-бот.

*Организация, запрещенная на территории РФ
👍3🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft открыла доступ к своему ИИ для клонирования голоса 🗣

О Vall-E X стало известно еще весной, но только сейчас модель сделали Open Source.

🎙 Благодаря использованию Zero Shot (то есть алгоритм может выполнить задачу без предварительного обучения), ИИ может по 3 секундам аудио детально воспроизвести голос.

Алгоритм может воспроизвести особенности акцента, сохранить эмоциональную окраску фразы и даже передать акустические особенности помещения, где была записана изначальная фраза 🏟.

Пока Vall-E X поддерживает английский, китайский и японский языки 😛.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🤩1
Washington Post поведал о тяжелой жизни фрилансеров, которые модерируют ИИ

🇵🇭 Газета рассказала об условиях работы нескольких тысяч человек на Филиппинах, которые работают с платформой Remotasks.

Remotasks разработала компания Scale AI — крупный подрядчик, с которым работают Meta*, Google, OpenAI и другие;

👩‍💻 Фрилансеры через Remotasks размечают для ИИ датасеты, редактируют тексты, сгенерированные нейросетями, делают описания к видео, которые затем используются для обучения автопилотов на автомобилях и т. д.;

👥 Всего на Филиппинах подобной работой по неофициальной информации могут заниматься более 2 млн человек — из них около 10 тыс. используют Remotasks;

🤷‍♀️Местные власти пока не знают, как законодательно регулировать работу таких сервисов как Remotasks, так как сейчас по факту она работает неофициально

👍 Изначально фрилансерам Remotasks обещали платить до $10 за задание и до $200 в неделю;

👎 Люди рассказывают, что часто им платят за работу меньше дневного прожиточного минимума (на Филиппинах это $6–10), но даже такую сумму могут задержать, заплатить меньше или не заплатить вообще;

🛑 Некоторых без выплат и объяснения причин блокировали на Remotasks и не давали работать дальше;

😌 В самой компании говорят, что подобные случаи происходят все реже, а условия работы фрилансеров улучшают, ориентируясь на их фидбек;

Оценочная стоимость Scale AI — $7 млрд.

*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2