D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
👋 OpenAI хочет заменить модераторов на ИИ

Компания хочет использовать языковую модель GPT-4 для модерации контента. В стартапе считают, что ИИ быстрее и точнее человека справиться с проверкой контента на соответствие правилам платформы.

📞 Кроме того, алгоритм быстро даст фидбек, на основе которого правила можно дополнить или изменить. При этом время обучения модели в десятки раз меньше, чем время, которое уходит на подготовку профессионального модератора.

🛠 Также владельцы сервисов смогут с помощью API создавать собственные автономные системы модерации, уверены создатели ChatGPT.

OpenAI заботятся и о людях-модераторах, которые сегодня должны мониторить контент даже самого экстремального содержания. В компании говорят, что ИИ освободит этих сотрудников от «психологической нагрузки» 🤹.

🤖🧑 Google, Meta*, TikTok уже используют автоматические системы модерации для выявления недопустимого контента на платформе — но всегда в связке с командой людей-модераторов, которые могут перепроверить работу алгоритмов.

💲 Компании тратят на это значительные ресурсы, но даже в этом случае ни одна система не гарантирует 100% эффективности. Основная проблема — огромный поток информации, которую необходимо проверять. Сами OpenAI признают, что совсем от участия человека в процессе пока отказаться не получится.

*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
2🤔2🔥1
Meta* представила новую технологию передачи изображения в MR

🗿 Light-Field Passhrough позволяет пользователю видеть окружающую обстановку без искажений — как будто никакого хедсета у него на голове нет.

Зачем это нужно? В современных шлемах камеры расположены на небольшом удалении перед глазами пользователя. Это приводит к тому, что в MR-режиме пользователь видит мир со «сбитой» перспективой. Чтобы скорректировать ошибку в дело вступают алгоритмы, но их работа часто приводит к серьезному искажению изображения.

😎 Light-Field Passhrough с помощью специальных изогнутых линз, которые частично блокируют лучи света, решает эту проблему. Технология работает в реальном времени, даже если пользователь находится в движении. Хедсету с Light-Field Passhrough нужно меньше вычислительной мощности, так как проблему искажений частично берут на себя сами линзы, а не только ИИ.

🔮 В Meta* уверены, что их разработка в будущем поможет сделать MR «бесшовным» — то есть граница между виртуальным и реальным миром будет практически незаметна.

*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍2
Инфографика: главные достижения генеративных нейросетей с начала года

Блог Everypixel опубликовал занятную статистику по использованию генеративных нейросетей с начала 2023 года.

🔼 Самой быстрорастущей нейросетью по количеству сгенерированных изображений оказался Adobe Firefly. Всего за 3 месяца пользователи создали миллиард изображений

👥 Больше всего пользователей у Midjourney15 млн

📊 80% изображений (почти 12,6 млрд) сгенерированы с помощью моделей, приложений, сервисов и платформ, созданных на основе Stable Diffusion

Всего с начала года пользователи сгенерировали 15,5 млрд изображений. Каждый день генерируется 34 млн изображений

📆 Для сравнения, фотографам понадобилось 150 лет (С 1826 год по 1975 год), чтобы сделать 15 млрд снимков (разницу в трудозатратах авторы исследования решили не упоминать)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍2🔥1😱1
ChatGPT грозит смерть, Apple придется поменять название VR-хедсета, в США запрещают книги с помощью ИИ — и другие важные новости за неделю

Gartner уверены, что генеративный ИИ находится на пике завышенных ожиданий: функции генеративного ИИ пытаются добавить в свой продукт вообще все, а не очень разбирающиеся в вопросе люди путают нейросети с AGI — универсальным ИИ. За пиком, предупреждают Gartner, обязательно наступит следующая стадия — разочарования;

В американском штате Айова руководство одной из школ додумалось использовать ИИ для поиска в школьной библиотеке книг с неприемлемым содержанием. ИИ ищет в произведениях «запрещенные идеи и описания». Если в книге удалось что-то найти, то ее помечают для изъятия из библиотеки. Уже набралось 19 книг;

Нейросеть Яндекса YandexGPT научилась на основе отзывов покупателей выделять плюсы и минусы товаров. Сгенерированный список можно увидеть в карточках товаров в поисковике и на Яндекс Маркете. Почти одновременно с Яндексом похожую функцию добавил Amazon;

Apple, возможно, придется сменить название недавно анонсированного хедсета Vision Pro. Дело в том, что в Китае название Vision Pro использует компания Huawei. В качестве запасного варианта Apple может использовать более ранний вариант названия — Reality Pro;

Netflix в тестовом режиме запустил стриминг видеоигр. Пока он доступен только в Канаде и Великобритании. Стримить можно через сайт Netflix или на телевизоре, подключенном к приставке типа Roku;

Эксперты пугают, что иск газеты New York Times к OpenAI может привести к исчезновению ChatGPT — по-крайней мере на какое-то время. Издание не хочет, чтобы чат-бот учился на его статьях. Иск пока на стадии подготовки, но если его удовлетворят, то OpenAI, вероятно, помимо выплаты штрафов придется еще и с нуля пересобирать датасеты, на которых обучали чат-бот;

В ожидании иска от NYT, OpenAI решила приобрести студию Global Illumination. Global Illumination известны как разработчики клона Minecraft под названием Biomes. Сумма сделки и цель покупки не уточняются. В OpenAI обтекаемо говорят, что новые сотрудники будут заниматься «основными продуктами» компании;

WhatsApp тестирует в мессенджере стикеры, сгенерированные нейросетью. Стикер генерируется по текстовой подсказке, потом его можно использовать в переписке;

Chrome теперь умеет в саммарайзинг. Браузер сможет выделить ключевые моменты из текста, на который вы перешли по ссылке. В Google называют функцию экспериментальной и сначала добавят ее в Chrome на iOS и на Android;

И еще про Google. Осенью компания подробно расскажет про Gemini — свой масштабный ИИ-проект, который будет состоять из нескольких моделей. По слухам, Gemini сможет работать не только с текстом, но и с изображениями;

МТС запустил облачную платформу для обучения нейросетей. Сервис от провайдера CloudMTS позволяет командам совместно работать с ML-моделями «в протестированной и оптимизированной для них облачной среде».
👍6
NeRF-экскурсии с помощью айфона 🛫

Стартап Luma AI выпустил новое приложение Flythroughs. Flythroughs позволяет создавать NeRF-панорамы, используя только камеру смартфона — как при записи обычного видео 📱.

Нечто похожее весной показывали Google.

Снимать видео можно и на улице, но разработчики сразу предупреждают, что качество в этом случае может пострадать. Чтобы NeRF получился качественным, нужно будет хорошее освещение и позаботиться, чтобы в кадр не попали люди и животные 😼.

🕙 Готовьтесь ждать — на создание панорамы у программы уйдет около 45 минут.

🏩 Самое очевидное применение такой технологии — сервисы для продажи и аренды недвижимости.

Приложение пока доступно только на iOS.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Google работает над лайф-коучем с искусственным интеллектом

💪 Специально для этих целей компания объединила свою исследовательскую ИИ-лабораторию DeepMind и подразделение Brain, которое также специализируется на умных алгоритмах.

Вместе Brain и DeepMind работают над генеративной нейросетью, которая решает личные и профессиональные вопросы. В общей сложности модель выполняет более 20 задач: помогает брейнстормить, может дать совет, выступить в роли репетитора, проанализировать текст, объяснить график функции и много чего еще 🙏.

Для тестирования модели DeepMind собрали команду из 100 экспертов с научными степенями в разных областях. В их задачи входит, например, оценка того, насколько корректно модель может ответить на вопросы, связанные с жизненными трудностями ☹️.

👰 В качестве примера приводится гипотетическая ситуация, в которой пользователь очень хочет попасть на свадьбу лучшей подруги, но не может позволить себе перелет на самолете, так как сидит без работы. ИИ должен подсказать, как объяснить ситуацию подруге, чтобы не расстроить ее.

DeepMind в официальных комментариях скорее описывают проект как экспериментальный, который не обязательно будет реализован.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3👍2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Помощник, который следит за всем, что происходит на экране 🔎

Moemate — это контекстно-зависимый ассистент, который интегрируется в Windows и дает советы в зависимости от того, какая программа в данный момент открыта.

☝️ Если открыт текст в браузере, то Moemate может пересказать его содержание; если пользователь пишет программный код, то помощник может дать советы по его улучшению.

🖥 Даже если на экране просто рабочий стол, то можно попросить Moemate составить список быстрых команд и настроек для работы с ОС. Помощник может даже сгенерировать изображение, используя Stable Diffusion.

Удобно, но нечто подобное уже предлагают Google и Microsoft 🫤.

Ключевое отличие Moemate в том, что программа в реальном времени анализирует все, что происходит на экране. Это позволяет ей комментировать трансляции в Twitch или давать советы по прохождению игр — помощник поможет выбрать персонажа в Dota, а затем подскажет для него лучшее оружие 🌡.

Управлять помощником можно промптами или голосом. Moemate использует для работы 2 LLM на выбор — GPT-4 и Claude.

⚠️ Насколько безопасно пользоваться программой, которая постоянно следит за тобой? Разработчики из Webaverse успокаивают, что большая часть информации (но не вся) хранится локально — на устройстве.

Скачать Moemate можно с сайта, но учтите, что это пока бета-версия, которая может работать нестабильно.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🚪 В твиттере построили AR-портал в параллельные миры

Наш старый знакомый Иен Кертис показал свой новый проект — AR-«дверь», которая открывается в виртуальное пространство, созданное нейросетью с помощью промпта 🖼.

☝️ Помимо ИИ Кертис использовал инструменты от Blockade Labs (об одном из них мы тоже рассказывали).

И да, вам не показалось — Кертис вдохновлялся порталом из «Корпорации монстров».
🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Корпорации успешно экономят на рекламе с помощью ИИ

Гиганты Nestle и Unilever уже используют ChatGPT, Dall-E и их аналоги в рекламных кампаниях, чтобы снизить рекламные затраты 🔽.

В крупнейшем в мире рекламном агентстве WPP говорят, что использование нейросетей помогает сократить рекламные затраты в 10–20 раз. Скажем, вместо того чтобы вести съемочную группу в далекие страны, можно обойтись услугами ИИ 🛫.

🏪 Для индийского подразделения компании Mondelez WPP сделали социальную рекламу с дипфейком популярного актера Шахруха Хана, который призывал покупателей поддержать небольшие магазины.

WPP также использовали нейросеть Dall-E 2 в рекламе молочных продуктов бренда La Laitière от Nestle. Стоимость 1 генерации в нейросети стоит около $0,15, а заработать таким способом Neslte смогла почти $800 тыс. в пересчете на эффективность (media value) рекламы 😮.

У Unilever есть свои генеративные инструменты, которые используют бренды, принадлежащие компании.

Единственное, что расстраивает компании при использовании нейросетей — непонятный статус такой рекламы с точки зрения копирайта и возможные проблемы с безопасностью информации, которую они предоставляют ИИ-моделям 🤔.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Half-Life 2 сделают пластическую операцию 🫦

Одна из главных игр современности получит графическое обновление.

🛠 Над Half-Life 2 RTX работает команда моддеров при поддержке Nvidia. Компания предоставила энтузиастам раньше официального запуска свою платформу для создания модов Nvidia RTX Remix.

🔩 Помимо RTX (продвинутая обработка световых лучей в 3D), которая вынесена в название, RTX Remix поддерживает и другие передовые технологии Nvidia вроде DLSS и Reflex.

🎮 С помощью RTX Remix визуальный апгрейд уже получила еще одна игра, связанная с создателями Half-Life — головоломка Portal: Prelude. Ее можно попробовать бесплатно в Steam.

Дату выхода Half-Life 2 RTX пока не называют.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
В популярном датасете нашли десятки тысяч спираченных книг, суд отказал нейросетям в копирайте, Nvidia заработала все деньги мира — и другие важные новости за неделю

Окружной суд США постановил, что контент, созданный нейросетью, не может быть объектом копирайта. Вердикт вынесен по иску Стивена Талера, который через суд хотел добиться того, что автором изображений признали созданную им нейросеть, а владельцем изображений — самого Талера. Суд счел, что для копирайта произведение должно быть создано человеком и никак иначе;

Журналист издания The Atlantic выяснил, что популярный датасет Books3 для обучения языковых моделей в значительной степени состоит из пиратских версий книг. Среди авторов, чьи книги есть в датасете: Стивен Кинг, Джеймс Паттерсон, лауреат Пулитцеровской премии Хунот Диас и многие другие. Всего в Books3 около 170 тыс. художественных и нон-фикшн произведений. На датасете обучены, в том числе модели Llama и Bloomberg GPT;

И в продолжение темы: опубликован самый большой OpenSource-датасет для обучения языковых моделей. Открытый для редактуры набор Dolma создан некоммерческой организацией A12 для своей LLM, но НКО решила поделиться им со всеми желающими;

В Snapchat появится генеративный инструмент Dreams, который позволит добавлять к своим селфи фон, созданный нейросетью по текстовой подсказке. Dreams можно будет использовать с друзьями. По слухам, сгенерированные бэкграунды можно будет еще и продавать;

Meta* выпустила языковую модель с открытым кодом Seamless M4T, которая поддерживает 100 языков. Seamless может не просто переводить текст с одного языка на другой, но также распознавать речь, переводить ее в текст и в речь. Также компания на этой неделе запустила модель для генерации программного кода Code Llama;

The Information пишет, что Microsoft запускает совместный проект со стартапом Databricks, который специализируется на ИИ-продуктах с открытым кодом. Пикантности истории добавляет то, что Microsoft одновременно вкладывает миллиарды долларов в OpenAI, которые не очень любят делиться кодом своих сервисов. То есть Microsoft, по сути, поддерживает 2-х прямых конкурентов и бизнес OpenAI может от этого пострадать;

Meta* разрешит пользователям на территории ЕС отключать умную ленту в Facebook** и Instagram**, которая предлагает публикации на основе интересов. После отключения алгоритмы соцсетей перестанут собирать информацию о пользователе, который будет видеть публикации только тех, на кого он подписан. Такое решение продиктовано необходимостью соблюдать Digital Services Act, который вступит в силу на территории Евросоюза в конце августа;

Чистая прибыль Nvidia за квартал выросла на сумасшедшие 843% год к году — до $6,2 млрд. Все из-за ажиотажного спроса на чипы, которые нужны для работы ИИ-моделей. В следующем квартале компании прогнозируют финансовые результаты еще лучше.

*Организация, запрещенная на территории РФ
**Instagram и Facebook входят в Meta — организацию, запрещенную на территории РФ
👍5🔥21
👩‍🎨 Я так вижу: художников попросили изобразить искусственный интеллект

Принадлежащая Google компания DeepMind в рамках проекта Visualising AI попросила 13 художников представить, как мог бы выглядеть искусственный интеллект и процесс его работы.

Получилось очень круто и очень абстрактно 😱.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍1