D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
ChatGPT грозит смерть, Apple придется поменять название VR-хедсета, в США запрещают книги с помощью ИИ — и другие важные новости за неделю

Gartner уверены, что генеративный ИИ находится на пике завышенных ожиданий: функции генеративного ИИ пытаются добавить в свой продукт вообще все, а не очень разбирающиеся в вопросе люди путают нейросети с AGI — универсальным ИИ. За пиком, предупреждают Gartner, обязательно наступит следующая стадия — разочарования;

В американском штате Айова руководство одной из школ додумалось использовать ИИ для поиска в школьной библиотеке книг с неприемлемым содержанием. ИИ ищет в произведениях «запрещенные идеи и описания». Если в книге удалось что-то найти, то ее помечают для изъятия из библиотеки. Уже набралось 19 книг;

Нейросеть Яндекса YandexGPT научилась на основе отзывов покупателей выделять плюсы и минусы товаров. Сгенерированный список можно увидеть в карточках товаров в поисковике и на Яндекс Маркете. Почти одновременно с Яндексом похожую функцию добавил Amazon;

Apple, возможно, придется сменить название недавно анонсированного хедсета Vision Pro. Дело в том, что в Китае название Vision Pro использует компания Huawei. В качестве запасного варианта Apple может использовать более ранний вариант названия — Reality Pro;

Netflix в тестовом режиме запустил стриминг видеоигр. Пока он доступен только в Канаде и Великобритании. Стримить можно через сайт Netflix или на телевизоре, подключенном к приставке типа Roku;

Эксперты пугают, что иск газеты New York Times к OpenAI может привести к исчезновению ChatGPT — по-крайней мере на какое-то время. Издание не хочет, чтобы чат-бот учился на его статьях. Иск пока на стадии подготовки, но если его удовлетворят, то OpenAI, вероятно, помимо выплаты штрафов придется еще и с нуля пересобирать датасеты, на которых обучали чат-бот;

В ожидании иска от NYT, OpenAI решила приобрести студию Global Illumination. Global Illumination известны как разработчики клона Minecraft под названием Biomes. Сумма сделки и цель покупки не уточняются. В OpenAI обтекаемо говорят, что новые сотрудники будут заниматься «основными продуктами» компании;

WhatsApp тестирует в мессенджере стикеры, сгенерированные нейросетью. Стикер генерируется по текстовой подсказке, потом его можно использовать в переписке;

Chrome теперь умеет в саммарайзинг. Браузер сможет выделить ключевые моменты из текста, на который вы перешли по ссылке. В Google называют функцию экспериментальной и сначала добавят ее в Chrome на iOS и на Android;

И еще про Google. Осенью компания подробно расскажет про Gemini — свой масштабный ИИ-проект, который будет состоять из нескольких моделей. По слухам, Gemini сможет работать не только с текстом, но и с изображениями;

МТС запустил облачную платформу для обучения нейросетей. Сервис от провайдера CloudMTS позволяет командам совместно работать с ML-моделями «в протестированной и оптимизированной для них облачной среде».
👍6
NeRF-экскурсии с помощью айфона 🛫

Стартап Luma AI выпустил новое приложение Flythroughs. Flythroughs позволяет создавать NeRF-панорамы, используя только камеру смартфона — как при записи обычного видео 📱.

Нечто похожее весной показывали Google.

Снимать видео можно и на улице, но разработчики сразу предупреждают, что качество в этом случае может пострадать. Чтобы NeRF получился качественным, нужно будет хорошее освещение и позаботиться, чтобы в кадр не попали люди и животные 😼.

🕙 Готовьтесь ждать — на создание панорамы у программы уйдет около 45 минут.

🏩 Самое очевидное применение такой технологии — сервисы для продажи и аренды недвижимости.

Приложение пока доступно только на iOS.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Google работает над лайф-коучем с искусственным интеллектом

💪 Специально для этих целей компания объединила свою исследовательскую ИИ-лабораторию DeepMind и подразделение Brain, которое также специализируется на умных алгоритмах.

Вместе Brain и DeepMind работают над генеративной нейросетью, которая решает личные и профессиональные вопросы. В общей сложности модель выполняет более 20 задач: помогает брейнстормить, может дать совет, выступить в роли репетитора, проанализировать текст, объяснить график функции и много чего еще 🙏.

Для тестирования модели DeepMind собрали команду из 100 экспертов с научными степенями в разных областях. В их задачи входит, например, оценка того, насколько корректно модель может ответить на вопросы, связанные с жизненными трудностями ☹️.

👰 В качестве примера приводится гипотетическая ситуация, в которой пользователь очень хочет попасть на свадьбу лучшей подруги, но не может позволить себе перелет на самолете, так как сидит без работы. ИИ должен подсказать, как объяснить ситуацию подруге, чтобы не расстроить ее.

DeepMind в официальных комментариях скорее описывают проект как экспериментальный, который не обязательно будет реализован.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3👍2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Помощник, который следит за всем, что происходит на экране 🔎

Moemate — это контекстно-зависимый ассистент, который интегрируется в Windows и дает советы в зависимости от того, какая программа в данный момент открыта.

☝️ Если открыт текст в браузере, то Moemate может пересказать его содержание; если пользователь пишет программный код, то помощник может дать советы по его улучшению.

🖥 Даже если на экране просто рабочий стол, то можно попросить Moemate составить список быстрых команд и настроек для работы с ОС. Помощник может даже сгенерировать изображение, используя Stable Diffusion.

Удобно, но нечто подобное уже предлагают Google и Microsoft 🫤.

Ключевое отличие Moemate в том, что программа в реальном времени анализирует все, что происходит на экране. Это позволяет ей комментировать трансляции в Twitch или давать советы по прохождению игр — помощник поможет выбрать персонажа в Dota, а затем подскажет для него лучшее оружие 🌡.

Управлять помощником можно промптами или голосом. Moemate использует для работы 2 LLM на выбор — GPT-4 и Claude.

⚠️ Насколько безопасно пользоваться программой, которая постоянно следит за тобой? Разработчики из Webaverse успокаивают, что большая часть информации (но не вся) хранится локально — на устройстве.

Скачать Moemate можно с сайта, но учтите, что это пока бета-версия, которая может работать нестабильно.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🚪 В твиттере построили AR-портал в параллельные миры

Наш старый знакомый Иен Кертис показал свой новый проект — AR-«дверь», которая открывается в виртуальное пространство, созданное нейросетью с помощью промпта 🖼.

☝️ Помимо ИИ Кертис использовал инструменты от Blockade Labs (об одном из них мы тоже рассказывали).

И да, вам не показалось — Кертис вдохновлялся порталом из «Корпорации монстров».
🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Корпорации успешно экономят на рекламе с помощью ИИ

Гиганты Nestle и Unilever уже используют ChatGPT, Dall-E и их аналоги в рекламных кампаниях, чтобы снизить рекламные затраты 🔽.

В крупнейшем в мире рекламном агентстве WPP говорят, что использование нейросетей помогает сократить рекламные затраты в 10–20 раз. Скажем, вместо того чтобы вести съемочную группу в далекие страны, можно обойтись услугами ИИ 🛫.

🏪 Для индийского подразделения компании Mondelez WPP сделали социальную рекламу с дипфейком популярного актера Шахруха Хана, который призывал покупателей поддержать небольшие магазины.

WPP также использовали нейросеть Dall-E 2 в рекламе молочных продуктов бренда La Laitière от Nestle. Стоимость 1 генерации в нейросети стоит около $0,15, а заработать таким способом Neslte смогла почти $800 тыс. в пересчете на эффективность (media value) рекламы 😮.

У Unilever есть свои генеративные инструменты, которые используют бренды, принадлежащие компании.

Единственное, что расстраивает компании при использовании нейросетей — непонятный статус такой рекламы с точки зрения копирайта и возможные проблемы с безопасностью информации, которую они предоставляют ИИ-моделям 🤔.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Half-Life 2 сделают пластическую операцию 🫦

Одна из главных игр современности получит графическое обновление.

🛠 Над Half-Life 2 RTX работает команда моддеров при поддержке Nvidia. Компания предоставила энтузиастам раньше официального запуска свою платформу для создания модов Nvidia RTX Remix.

🔩 Помимо RTX (продвинутая обработка световых лучей в 3D), которая вынесена в название, RTX Remix поддерживает и другие передовые технологии Nvidia вроде DLSS и Reflex.

🎮 С помощью RTX Remix визуальный апгрейд уже получила еще одна игра, связанная с создателями Half-Life — головоломка Portal: Prelude. Ее можно попробовать бесплатно в Steam.

Дату выхода Half-Life 2 RTX пока не называют.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
В популярном датасете нашли десятки тысяч спираченных книг, суд отказал нейросетям в копирайте, Nvidia заработала все деньги мира — и другие важные новости за неделю

Окружной суд США постановил, что контент, созданный нейросетью, не может быть объектом копирайта. Вердикт вынесен по иску Стивена Талера, который через суд хотел добиться того, что автором изображений признали созданную им нейросеть, а владельцем изображений — самого Талера. Суд счел, что для копирайта произведение должно быть создано человеком и никак иначе;

Журналист издания The Atlantic выяснил, что популярный датасет Books3 для обучения языковых моделей в значительной степени состоит из пиратских версий книг. Среди авторов, чьи книги есть в датасете: Стивен Кинг, Джеймс Паттерсон, лауреат Пулитцеровской премии Хунот Диас и многие другие. Всего в Books3 около 170 тыс. художественных и нон-фикшн произведений. На датасете обучены, в том числе модели Llama и Bloomberg GPT;

И в продолжение темы: опубликован самый большой OpenSource-датасет для обучения языковых моделей. Открытый для редактуры набор Dolma создан некоммерческой организацией A12 для своей LLM, но НКО решила поделиться им со всеми желающими;

В Snapchat появится генеративный инструмент Dreams, который позволит добавлять к своим селфи фон, созданный нейросетью по текстовой подсказке. Dreams можно будет использовать с друзьями. По слухам, сгенерированные бэкграунды можно будет еще и продавать;

Meta* выпустила языковую модель с открытым кодом Seamless M4T, которая поддерживает 100 языков. Seamless может не просто переводить текст с одного языка на другой, но также распознавать речь, переводить ее в текст и в речь. Также компания на этой неделе запустила модель для генерации программного кода Code Llama;

The Information пишет, что Microsoft запускает совместный проект со стартапом Databricks, который специализируется на ИИ-продуктах с открытым кодом. Пикантности истории добавляет то, что Microsoft одновременно вкладывает миллиарды долларов в OpenAI, которые не очень любят делиться кодом своих сервисов. То есть Microsoft, по сути, поддерживает 2-х прямых конкурентов и бизнес OpenAI может от этого пострадать;

Meta* разрешит пользователям на территории ЕС отключать умную ленту в Facebook** и Instagram**, которая предлагает публикации на основе интересов. После отключения алгоритмы соцсетей перестанут собирать информацию о пользователе, который будет видеть публикации только тех, на кого он подписан. Такое решение продиктовано необходимостью соблюдать Digital Services Act, который вступит в силу на территории Евросоюза в конце августа;

Чистая прибыль Nvidia за квартал выросла на сумасшедшие 843% год к году — до $6,2 млрд. Все из-за ажиотажного спроса на чипы, которые нужны для работы ИИ-моделей. В следующем квартале компании прогнозируют финансовые результаты еще лучше.

*Организация, запрещенная на территории РФ
**Instagram и Facebook входят в Meta — организацию, запрещенную на территории РФ
👍5🔥21
👩‍🎨 Я так вижу: художников попросили изобразить искусственный интеллект

Принадлежащая Google компания DeepMind в рамках проекта Visualising AI попросила 13 художников представить, как мог бы выглядеть искусственный интеллект и процесс его работы.

Получилось очень круто и очень абстрактно 😱.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍1
🎼 YouTube научился искать музыку по мычанию

🎤 Такая опция появилась в поисковике видеохостинга. Теперь можно попробовать найти песню, не зная ни исполнителя, ни название трека, ни даже слов — просто напев/намычав мелодию (зависит от ваших способностей).

👂 Можно пойти и более скучным способом — дать приложению YouTube несколько секунд послушать трек, который не удается распознать самому. Как в Shazam, который c 2018 года принадлежит Apple.

🎞 Сервис шел к этому обновлению довольно долго: еще в 2020 году аналогичный функционал добавили в приложение поисковика Google.

Разработчики подтверждают, что технология осталась прежней, но работает теперь гораздо быстрее — песню можно найти, напевая мелодию несколько секунд, а не 10–15 секунд, как было раньше ⚡️.

Пока такой поиск работает для небольшого количества пользователей, которые используют приложение YouTube на Android-устройствах.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔53👍1
McKinsey упростил жизнь сотрудникам с помощью генеративного ИИ

🧠 Сервис Lilli — это платформа с доступом к базе знаний компании. Это не только более 100 тыс. документов, но и сеть экспертов из более чем 70 стран. Разработкой Lilli занималось ИИ-подразделение компании — QantumBlack.

🔎 Инструмент упрощает сотрудникам работу на начальных этапах исследования: поиск релевантной информации и экспертов с глубоким знанием темы. Найденную информацию алгоритм представляет в виде нескольких ключевых тезисов со ссылками и контактами экспертов.

VentureBeat пишет, что интерфейс и принцип работы Lilli будет знаком любому, кто пользовался ChatGPT. Модель использует LLM от OpenAI и Cohere.

В консалтинговой компании утверждают, что раньше подготовительный этап мог занимать несколько часов или даже дней, а сейчас в некоторых случаях сократился до минут. Модель может искать информацию не только во внутренних, но и во внешних источниках.

🤔 Сотрудники очень хвалят Lilli за нестандартное «мышление»: например, один из них рассказал, как искал информацию о способе производства, который обычно используют в фармацевтике, но ИИ нашел релевантный пример в строительной сфере.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥2
Google выпустил ИИ-ассистента, который будет ходить за вас на совещания 🧳

Сегодня уже сложно удивить кого-то возможностями ИИ-ассистента, но Google с его Duet AI это удалось:

📊 Duet может создавать презентации на основе информации из писем в Gmail и документов в Drive. Алгоритм сам прошерстит нужные файлы и сгенерирует слайды;

🫦 Duet может добавить студийный свет и звук для созвона с коллегами. Помощник даже может стать немножко фотошопом и подправить лицо пользователя, если он слишком усердно веселился прошлым вечером;

✍️ Ассистент запишет встречу с коллегами, сделает ее краткий пересказ и выделит ключевые моменты созвона;

💬 Duet может по информации со слайда сгенерировать речь для презентации;

👥 Ну и самое занятное — Duet может за вас поучаствовать в видеовстрече. Через функцию Attend for Me ИИ сгенерирует несколько тем и предложит обсудить их остальным участникам, пока вас нет. После встречи, в которой он поучаствовал за вас, Duet также любезно перескажет ее содержание.

Все эти и другие чудеса будут доступны за $30 в месяц за одного пользователя для крупных компаний- пользователей Google Workplaces. Для малого бизнеса цена может быть меньше, но в Google пока не решили на сколько.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥2😁21🤔1