D. Lab
1.1K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
👋 Meta* хочет перенести ваши руки в VR

Подразделение Codec Avatars совместно с Наньянским технологическим университетом разработали URHand — модель для фотореалистичной симуляции человеческих рук в виртуальном пространстве.

🔦 Это, например, означает реалистичную мелкую моторику и корректное взаимодействие «кожи» виртуальных рук со светом, в том числе за счет использования нейросетей.

🧍‍♀️ Такая дотошность, считают разработчики, должна в разы повысить эффект присутствия в VR. Логика такая: так как в реальной жизни человек постоянно видит руки перед собой и идентифицирует себя через них, то именно их реалистичная модель (вместе с остальным телом) нужна ему и в виртуальном пространстве.

📱 Чтобы создать полную иммерсию, URHand позволяет перенести в VR точную копию рук пользователя, сделав несколько фотографий на смартфон.

URHand пока находится на стадии эксперимента и в ближайшее время не появится в девайсах Meta 😢.

*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54🤔2
⌨️ Даже небольшое изменение промпта может изменить ответ LLM

Исследование, проведенное Институтом информационных наук Южной Калифорнии, показало, что даже пробел в начале текстовой подсказки может изменить ответ модели.

🛠 Такие особенности LLM не позволяют использовать их как надежный инструмент в работе. Если LLM при малейшем изменении промпта дает новый ответ разной степени точности, то положиться на него сложно. Задача для разработчиков: создать модели, которые будут давать точные ответы вне зависимости от изменений в текстовой подсказке.

🧪 Эксперимент проводили в несколько этапов, используя модель GPT-3.5 Turbo. Авторы просили LLM определить тональность текста, истинно или ложно утверждение, проверить текст на наличие сарказма, юмора и т. д. Текст выглядел так: «Я пошел с Элис, чтобы посмотреть фильм о яблоках. Он был потрясающим».

📋 На первом этапе модель просили сгенерировать информацию в нескольких форматах: CSV, XML, JSON и других. Оказалось, что простое изменение формата может привести к снижению точности генерируемой информации на 3–6% или изменению самого ответа на 10%. Разницу в точности и изменениях в ответах определяли не на глаз, а с помощью бенчмарков.

⁉️ На следующем этапе исследователи перефразировали промпт — например, из вопроса в утверждение. В этом случае ответ мог отличаться по 900 признакам от ответа, выбранного базовым. Пробел в начале промпта давал более 500 изменений.

🔐 Также авторы работы использовали джейлбрейк — метод, который позволяет обходить ограничения, заложенные в модель разработчиками. В этом случае чат-бот берет на себя «роль», которая позволяет давать ему ответы без цензуры. Использование джейлбрейков часто приводило или к очень большому количеству изменений (до 2,5 тыс.), или LLM в принципе не могла дать корректный ответ.

💳 Исследователи попробовали предложить LLM денег, но это практически не повлияло на итоговую генерацию — хотя интернет-эксперты утверждают обратное.

Авторы не приводят варианты ответов LLM в исследовании.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4👍3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
🎮 🧹 В X/Twitter геймифицировали уборку квартиры с помощью AR

Специалист по AR/VR в Shopify Дэниел Бошамп придумал, как сделать уборку квартиры чуть менее скучным занятием 🥳.

В свободное от работы время он сделал приложение для хедсета Oculus Quest, которое наглядно показывает, где в доме пылесосили, а где — нет. Задача — «зачистить» жилище от пыльных зон.

Результатом Бошамп поделился в соцсети.

Называется все это Spatial Vacuuming 😎.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2🤔21
Альтман ищет деньги на заводы, В TikTok появятся видео на полчаса, появились подробности о загрузке приложений в обход App Store — и другие важные новости за неделю

Сэм Альтман ищет инвесторов для своего проекта по созданию сети заводов по производству полупроводников. Альтман не собирается создавать свою компанию-производителя, а хочет пригласить уже существующие компании работать на новых заводах. Удастся ли реализовать проект — большой вопрос. Строительство даже одного завода может обойтись в десятки миллиардов долларов, а строительство целой сети предприятий займет годы;

Nvidia представила свой ответ ChatGPT. Компания представила семейство моделей ChatQA, которые, как обещается, сравнимы по производительности с GPT-4. При этом в их обучении не использована информация, сгенерированная моделью, разработанной OpenAI (это — обычная практика, если что);

Разработчик ИИ-моделей для клонирования голосов ElevenLabs стал единорогом. Стартап получил еще $80 млн от инвесторов. Таким образом, его оценочная стоимость превысила $1 млрд. По такому случаю компания анонсировала выход ИИ-инструмента для озвучивания полнометражных фильмов и запуск маркетплейса, где пользователи смогут продавать клон своего голоса;

Apple рассказал, как именно будет поощрять музыкантов за выпуск треков в формате пространственного аудио через Apple Music. Роялти за каждую песню, выложенную в формате Spatial Audio, будут на 10% выше, чем за обычное аудио;

И еще про Apple. Компания объяснила, как будет работать загрузка приложений со сторонних площадок, которая станет доступна в марте пользователям из ЕС с выходом iOS 17.4. Apple будет утверждать сторонние магазины, из которых можно будет скачивать приложения. Разработчики смогут использовать платежную инфраструктуру Apple (c 3% комиссией) или добавить в приложение стороннюю платежную систему. Сумма комиссии, которую Apple берет за каждую загрузку, в ЕС снизится с 30% до 10%. При этом все без исключения разработчики должны будут платить Apple €0,5 за первую установку приложения, если приложение скачали больше миллиона раз;

Google уже в феврале добавит в браузер Chrome генеративный функционал. Он позволит менять фон браузера по промпту, компоновать открытые вкладки по теме и поможет дописать текст, который пользователь хочет опубликовать в интернете. Первыми обновления смогут потестировать пользователи из США;

Платформа VK Реклама запустила нейросеть, которая автоматически подберет целевую аудиторию для показа рекламного сообщения. Модель ориентируется на успешные рекламные кампании на схожую тематику, которые запущены на платформе;

TikTok тестирует возможность загрузки в соцсеть видео продолжительностью 30 минут. Доступ к загрузке получили некоторые пользователи приложения соцсети на Android и iOS. Изначально на платформе разрешалось публиковать видео не длиннее 15 секунд. Тестируя загрузку длинных видео, считают аналитики, соцсеть пробует себя в качестве прямого конкурента YouTube.
👍43👏2
📸 InstantID — новая модель для создания генераций на основе одного фото

Нейросеть от команды разработчиков из Пекина может создавать генерации в разных стилях и жанрах на основе одного портретного фото и промпта.

🔩 InstantID может не просто создать красиво оформленную аватарку (таким после Lensa уже никого не удивишь): по одному снимку модель может сгенерировать персонажа в разных ракурсах, синтезировать в одной генерации людей с двух фото, объединить в одном персонаже людей с двух фото, по портретному фото создать не портретное изображение и так далее. В фотореалистичные генерации модель тоже умеет.

Все это с высокой детализацией и без необходимости файнтюнить модель.

🫡 Демо доступно здесь.

😈 Эксперты уже пугают, что InstantID станет любимым инструментом для создания дипфейков благодаря гибкости и простоте в использовании.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
▶️ Lumiere — новая модель для генерации видео от Google

Мультимодальная нейросеть может сгенерировать видео по промпту, а на основе загруженного изображения создать стилизованный клип, анимировать отдельную часть изображения, отредактировать видео и т. д.

🕝 Ключевое отличие Lumiere от десятков похожих моделей — лежащая в основе нейросети диффузионная модель Space-Time-U-Net (STUnet).

🎞 STUnet позволяет генерировать клипы не по ключевым кадрам, а сразу все видео полностью (оно ограничено пятью секундами). То есть нейросеть сразу понимает, где в пространстве находится генерируемый объект (или объекты) и как меняется его местоположение на протяжении видео.

👍На выходе это означает более качественную и плавную генерацию с меньшим количеством глюков.

⚖️ Журналист Verge сравнил Lumiere и Gen-2, использовав один и тот же промпт: щенок, сгенерированный Gen-2, выглядит более четким, но при этом практически не двигается; генерация Lumiere, возможно, проигрывает визуально, но при этом гораздо более живая.

🤔 Тут стоит оговориться, что самому попробовать Lumiere нельзя, поэтому сравнивать можно только с теми клипами, которые выбрали и опубликовали разработчики модели.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔1
🧠 ИИ-стартап хочет запускать ИИ на любых мобильных девайсах с помощью инновационных чипов

Чипы, которые разрабатывает немецкая компания Semron, позволяют, как утверждается, запускать локально ИИ-модели на любых мобильных устройствах — даже на наушниках.

⚡️ Такая производительность достигается за счет принципиально новой архитектуры: чипы Semron производят вычисления, используя электрическое поле, а не электрический ток, как это происходит обычно.

Кроме того, инновационный чип использует не транзисторы, а так называемые мемконденсаторы — конденсаторы с памятью (с мемами, к сожалению, название никак не связано) 😂.

🌡 Эти конденсаторы, работая в связке с электрическим полем, помогают «управлять» работой ИИ-модели, позволяя сократить энергозатраты и снизить тепловыделение.

⬆️ Со слов разработчиков, такое решение позволяет повысить вычислительную мощность до 20 раз, а также снизить стоимость производства.

👊 Понятно, что на фоне перманентного дефицита чипов в мире такие стартапы, как Semron быстро привлекают внимание инвесторов. Semron не одни играют на этом поле, а некоторые их конкуренты-стартапы даже используют похожие технологии.

💵 Тем не менее компания недавно получила почти $8 млн на дальнейшее развитие проекта, который сегодня находится на раннем, предпродуктовом этапе.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31
This media is not supported in your browser
VIEW IN TELEGRAM
🍏 Технологический прорыв, которым неудобно пользоваться: главное из обзоров на Vision Pro

В профильных СМИ появились обзоры AR-хедсета Vision Pro от Apple — первого нового продукта компании почти за 10 лет. Собрали главные плюсы и минусы устройства.

Плюсы:

Vision Pro — это технологический прорыв. Дисплей устройства — лучшее, что есть на рынке для таких девайсов. Passthrough (возможность видеть окружающее пространство через камеру хедсета) реализован лучше, чем у конкурентов

Просмотр фильмов на хедсете — отдельное удовольствие: картинка четкая, возможность выбрать виртуальную обстановку для киносеанса впечатляет, звук хорош. 3D реализовано отлично, но с непривычки может укачать

Vision Pro отлично интегрирован в экосистему Apple, взаимодействие с другими устройствами компании практически идеально

Навигация по интерфейсу взглядом поначалу впечатляет, возможность открыть несколько окон с приложениями и разместить их по всей квартире — тоже

Потенциал устройства для реализации в следующих версиях Vision Pro — огромен

Минусы:

Устройство по-настоящему тяжелое — носить его дольше часа проблематично. Vision Pro мало приспособлен для использования в движении или на улице

Дорого

От одного заряда аккумулятора устройство проработает не больше двух с половиной часов. Аккумулятор не встроен в устройство, а всегда болтается на проводе, подключенном к хедсету

Взаимодействие с интерфейсом с помощью взгляда очень удобно. Но не всегда. Чтобы система работала, пользователю нужно все время держать взгляд на предмете, который он хочет использовать. Представьте, если вам нужно было бы все время смотреть на мышку или клавиатуру, чтобы управлять компьютером

Виртуальный аватар пользователя (Persona), который создает устройство, будет сниться вам в кошмарах

Если вы носите очки, то придется дополнительно заказывать линзы за $99 (или использовать одноразовые)

Учитывая все эти недостатки и высокую стоимость, не до конца ясно, для чего собственно нужен Vision Pro. Пока это скорее нишевый продукт
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🤔3
🤑 Крошечный остров зарабатывает миллионы долларов в месяц на популярности ИИ

🌐 Ангилья, где проживает чуть больше 15 тыс. человек, неожиданно для себя столкнулся с наплывом компаний, которые хотят зарегистрировать свой сайт в доменной зоне островного государства.

🧠 Все потому, что домен Ангильи, который остров получил еще в 1980-х годах, — .ai.

По словам Винса Кейта, который помогает правительству Ангильи в регистрации доменных имен, благодаря буму генеративного ИИ остров зарабатывает около $3 млн в месяц. На данный момент это приблизительно треть бюджета Ангильи 👛.

📈 Спрос на .ai вырос через пять месяцев после запуска ChatGPT в ноябре 2022 года. Тогда продажи доменных имен подскочили в 4 раза, рассказывает Кейт, и с тех пор только росли.

🇦🇮 Остров Ангилья находится в Карибском море и является автономной британской заморской территорией.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5😁3🤯32
💤 ИИ лучше запоминает информацию, имитируя сон

💾 Исследователи из Катанийского университета в Италии придумали новый метод обучения ИИ-моделей, аналогичный тому, как мозг человека запоминает новую информацию.

🎒 Человек "переносит" информацию из кратковременной памяти (где хранится информация, полученная в течение дня) в долговременную (где хранится информация, накопленная за долгий период) во время сна.

👩‍🎓 По задумке итальянских исследователей ИИ-модели обучаются на датасетах в фазе бодрствования, а во время запрограммированной фазы сна модель анализирует информацию, усвоенную за день.

🧠 В качестве примера авторы метода приводят обучение модели на датасете с морскими обитателями. ИИ изучает такой датасет, когда бодрствует, а в момент сна ему вновь показывают эти изображения, но уже вперемешку с другими животными. Это сделано для того, чтобы модель, выучив новую информацию, не забыла старую.

😌 Метод итальянцев также включает в себя не только фазу сна, но и сновидений, когда ИИ может генерировать новую информацию на основе полученной ранее. Утверждается, что это поможет ИИ лучше усваивать информацию в будущем. В итоге, получая все новую и новую информацию, модель сможет генерировать более сложные решения для задач пользователя.

📈 Проанализировав работу ИИ после использования нового метода, исследователи пришли к выводу, что он стал на 2%-12% точнее определять содержание изображения и лучше запоминать информацию.

✖️ Критики метода считают, что не стоит при работе с ИИ во всем пытаться имитировать работу человеческого мозга, а лучше сосредоточиться на поиске новых решений.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4
📷 Нейросеть для восстановления неудачных фото по промпту

InstructIR загрузить неудавшееся фото и естественным языком объяснить нейросети, что нужно исправить.

🌃 Например, модели можно сообщить, что фото слишком темное и на нем невозможно ничего разобрать, и InstructIR поймет, что от него требуется.

🖍 Также промптом можно убрать с фотографии шум, размытие, засвеченные участки и т.д.

🫡 Все это не на словах — потестировать нейросеть можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔2
Из TikTok уходит музыка, за ИИ-стендап умершего комика подали в суд, чип Neuralink вживили в мозг — и другие важные новости за неделю

На производителя подкастов Dudesy подали в суд за публикацию сгенерированного ИИ стендап-выступления комика Джорджа Карлина, умершего в 2008 году. Наследники Карлина недовольны, что его голос использовали для создания часового аудио. После иска авторы признали, что текст для выступления был написан людьми, а ИИ только синтезировал голос. Наследники отказываться от судебного преследования пока не собираются

В начале недели X/Twitter полностью отключал возможность поиска информации о Тейлор Свифт в соцсети. Всё из-за появления ИИ-порно с использованием дипфейков певицы, которое собрало миллионы просмотров (изначально фейки появились в Telegram). Скандал оказался настолько громким, что его пришлось комментировать даже Белому дому. Вполне возможно кейс Свифт станет поводом, чтобы распространение подобного, кхм, контента, стало уголовно наказуемым;

На этой неделе Universal Music объявил, что уберет каталог своей музыки из TikTok, так как не смог договориться с ее владельцами об условиях дальнейшего использования контента. Это значит, что миллионы видео в соцсети, в которых раньше звучали треки Тейлор Свифт или Билли Айлиш, остались без саундтрека. Мейджор утверждает, что представители TikTok фактические вынуждали заключить невыгодный договор и отказывались обсуждать правила использования ИИ-музыки на платформе;

Нейрочип Neuralink впервые вживили в мозг человеку, сообщил гендиректор стартапа Илон Маск. По словам Маска, операция прошла успешно, пациент восстанавливается, а сам чип работает корректно. Других подробностей пока нет;

Китай разрешил работу на территории страны 40 ИИ-моделям, из которых 14 — это LLM. В августе прошлого года власти страны обязали компании получать специальное разрешение на запуск ИИ-моделей для широкой публики;

Власти США обсуждают возможность запретить иностранным компаниями использовать облачную инфраструктуру Штатов для обучения ИИ. В первую очередь речь, конечно, о Китае, куда США уже запретили экспорт передовых чипов;

И еще про TikTok. Соцсеть тестирует функцию автоматического распознавания товаров в видео. Если распознавание прошло успешно, то соцсеть подкинет пользователю ссылку, по которой такой товар или похожий на него можно будет приобрести через маркетплейс TikTok Shop;

На новых смартфонах Galaxy S24, которые поступят в продажу в Китае, будет установлена ИИ-модель Ernie от Baidu, а не гугловская Gemini как на тех, что будут продаваться в Европе и США. Вероятно, это сделано, чтобы избежать проблем с китайскими властями, которые в индивидуальном порядке выдают разрешение на использование ИИ-моделей (см. новость выше).
👍72
Люди предпочли нейросетевой копирайтинг человеческому

📝 Сервис Semrush опросил 700 потребителей из США в возрасте 25–55+ (50,2% — мужчины, 49,5% — женщины), предложив им в нескольких тестах выбрать вариант копирайта, который им нравится больше.

В каждом тесте (всего их было шесть) было два рекламных текста, один из которых написал человек, а другой — ИИ. Естественно, респонденты не знали, кто какой текст написал.

✔️ Тексты были в форматах поста в соцсеть, текста для блога, рекламы для соцсети, описания продукта и т. д.

📊 По итогу во всех тестах от 54% до 70% респондентов предпочли вариант, сгенерированный ИИ.

💬 Опрошенные предпочли вариант ИИ, так как он понятнее доносил информацию.

❗️ Авторы исследования предупреждают, что результаты теста не означают, что в «полевых» условиях текст ИИ сработал бы эффективнее, чем текст, написанный человеком.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🕘 Google показал нейросеть с возможностью изменения генерации в реальном времени

🏃‍♀️ MobileDiffusion вносит изменения в генерацию практически синхронно с изменением промпта. Для ускоренной генерации авторы использовали модель DiffusionGAN, которая позволяет создавать изображение в один шаг.

📱 Mobile в названии появилось не случайно: нейросеть специально заточена под работу на мобильных устройствах.

⚡️ На генерацию в разрешении 512*512 у модели на топовых iOS- и Android-девайсах уходит полсекунды.

💀 Компромиссом в погоне за скоростью стало качество генераций: модель на небольшие по сегодняшним меркам 520 млн параметров, так что ждать от нее картинок уровня Midjourney не стоит.

🔮 Разработчики не выпустили ни демо, ни код модели, чтобы ее можно было потестировать самому. Можно предположить, что в том или ином виде наработки MobileDiffusion будут использованы в грядущих мобильных устройствах компании.

Нейросети Google уже работают (локально и через облако) на последних смартфонах компании, а также в новых моделях телефонов Samsung.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤔1
🛑 Компаниям больше не нужны специалисты по метаверсу

🔄 Как пишет Bloomberg, компании, которые еще год–два назад массово нанимали людей на должности вроде генеральный директор по метавселенным, теперь меняют их на экспертов по генеративному ИИ.

За последнее время люди, которые возглавляли метаверс-направления, ушли из Walt Disney и Procter & Gamble.

💵 Сильно переживать за них не стоит — выплаты по сокращению у таких специалистов могут достигать миллиона долларов.

🥤 Если повезет, то отвечавшего за метавселенные не уволят, а назначат главой направления генеративного ИИ. Так произошло, например, с Пратиком Тхакаром из Coca-Cola, который остался в компании, но теперь отвечает за нейросети.

💬 Тому, что метавселенные — это уже «не круто», есть и другие косвенные подтверждения. Например, в последнем квартале 2023 года на созвонах с инвесторами компаний, которые входят в список S&P 500, слово «метавселенные» произносилось лишь дважды.

Для сравнения, в I квартале 2022 года метавселенные упоминали на звонках 63 раза.
Please open Telegram to view this post
VIEW IN TELEGRAM
6🤔4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🏉 Coca-Cola использовала нейросеть в рекламе для Супербоула

Рекламу напитка BodyArmor покажут 11 февраля во время главного матча в американском футболе, но клип можно посмотреть уже сейчас.

🥒 Основной посыл ролика Field of Fake: натуральное всегда лучше ненатурального, поэтому в BodyArmor используются только натуральные ингредиенты.

⚙️ Все искусственное в ролике символизирует часть, созданная нейросетью. Генерация выполнена в лучших традициях адских видео ModelScope, о которых все позабыли после выхода «реалистичной» Gen-2. Закадровый голос в синтетической части рекламы, кстати, тоже создан нейросетью.

🤫 Агентство Full Contact Advertising, которое работало над клипом вместе с BodyArmor, не раскрывает, какую нейросеть использовало.

💵 Coca-Cola купила бренд BodyArmor в 2021 году за $5,6 млрд.

Компания уже использовала нейросети в рекламе, в частности, для создания «художественных» QR-кодов.

О том, как корпорации с помощью ИИ экономят на рекламе сотни тысяч долларов — мы рассказывали тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
🍏 Независимые лейблы обвинили Apple в попытке обворовать их за счет пространственного аудио

Мы уже писали о том, как Apple хочет, чтобы как можно больше музыки в Apple Music было доступно в формате пространственного аудио.

💵 Компания даже готова платить больше денег за то, чтобы треки выходили в этом формате — даже если их никто не будет слушать. При этом компания не собирается выделять на инициативу дополнительные средства. Бонусы за пространственное аудио будут выплачиваться из того же пула денег, что и обычно.

🤔 Независимые лейблы, разобравшись в ситуации, остались недовольны инициативой Apple. Оказывается, запись трека в формате Dolby Atmos (это и есть пространственное аудио) стоит в среднем на $1 тыс. дороже, чем запись в обычном формате.

🎙 Среднестатистический альбом состоит из 10–15 треков, а значит, его выпуск в новом формате будет стоить независимому лейблу на $10–15 тыс. дороже. Запись старого альбома в новом формате может стоить еще дороже. Скажем, лейблу с бэк-каталогом в три тыс. альбомов их перезапись может обойти в $30 млн.

То есть инди-лейблу, вероятно, даже нет смысла пытаться получить от Apple повышенные роялти, так как они не отобьют стоимость записи.

😈 Зато на Dolby Atmos, считают независимые лейблы, может хорошо заработать мейджор, у которого в каталоге есть, допустим, Тейлор Свифт. Потратив $10 тыс. на альбом, который в пространственном аудио могут послушать миллионы фанатов певицы, и без того богатый лейбл станет еще богаче. При этом богаче он станет за счет денег, которые не получат те, кто не смог позволить себе запись в Dolby Atmos.

❗️ Инди-лейблы хотят договориться с Apple, но если переговоры провалятся, то они готовы идти в суд.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4😁2
🕵️‍♀️ OpenAI разрабатывает ИИ-агентов

🕹 Такие агенты смогут выполнять сложные задания без участия пользователя — по сути, брать на себя управление устройством после получения задачи.

OpenAI уже больше года разрабатывает два типа агентов.

1️⃣ В качестве примера задач, которые будут решать агенты первого типа, The Information приводит перенос данных из документа в таблицу для анализа и автоматическое заполнение отчета о расходах с последующим переносом в бухгалтерское ПО.

2️⃣ Агенты второго типа будут выполнять менее узкие задачи вроде бронирования авиабилетов, отелей, планирования бюджета поездки и т. д.

🧠 Внутри OpenAI ИИ-агентов называют «суперумными персональными помощниками».

💵 Крупные игроки (над своими агентами также работают Meta* и Google) постепенно заходят в нишу, которую раньше обозначили сервисы вроде AutoGPT (мы подробно рассказывали о них).

💪 Создатели AutoGPT ставили перед собой амбициозную цель превратить помощника в AGI — сильный искусственный интеллект. В OpenAI тоже в последнее время часто говорят про AGI.

❗️ Ключевое опасение в связи с ИИ-агентами — безопасность: программа получает доступ к устройству пользователя и существует опасность, что таким же образом к девайсу могут подключиться и мошенники. Сейчас у OpenAI нет конкретного решения этой проблемы.

*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤔2
OpenAI отказали в названии GPT, Huawei выпустит меньше смартфонов из-за ИИ, Midjourney схантили инженера Apple — и другие важные новости за неделю

OpenAI выпустил приложение ChatGPT для хедсета Vision Pro. Внутри приложения — передовая модель GPT-4 Turbo и возможность не только общаться с чат-ботом, но и генерировать изображения. То есть, каких-то принципиальных отличий от обычных версий пока нет;

На этой неделе также стало известно, что OpenAI отказали в регистрации торговой марки GPT. Ведомство по патентам и товарным знакам США (USPTO) пришло к выводу, что GPT — это общее название инструментов, подобных языковой модели, которое не может быть закреплено за одной компанией. OpenAI может подать апелляцию на решение USPTO;

Спрос на ИИ-чипы заставил Huawei направить все мощности на их изготовление в ущерб своим же топовым смартфонам: ИИ-чипы и чипы для телефонов Mate 60 производятся на одних и тех же предприятиях. После запрета со стороны США на экспорт передовых чиповы в КНР, в стране резко вырос спрос на местную продукцию. В то же время китайским компаниям тяжело этот спрос обеспечить;

Microsoft заплатит изданию Semafor за использование своего ИИ в работе редакции. Semafor будет использовать ИИ Microsoft для написания новостей. На сайте издания появится отдельный фид Signals, куда будут публиковаться тексты, написанные с помощью ИИ. Речь не идет о текстах, полностью созданных нейросетью — редакторы сайта будут использовать модели, например, для быстрого перевода новости с неанглоязычного источника. Сколько именно Microsoft заплатит за тест, не уточняется;

В Roblox появится перевод в реальном времени на 16 языков. Функция будет реализована в пользовательских чатах на платформе с помощью кастомной LLM. Это значит, что пользователь, скажем, из Кореи в переписке с пользователем из Германии будет получать сообщения сразу на родном языке — и наоборот;

В Midjourney позвали инженера, который работал над Vision Pro, а также в Neuralink Илона Маска. Ахмад Аббас присоединился к стартапу в роли главы Hardware-подразделения. Вероятно, Аббас будет работать в компании над проектом под кодовым названием Orb. Что такое Orb — отдельное устройство или новая стратегия развития компании — пока неясно;

Meta* всерьез взялась за маркировку генеративного контента в принадлежащих компании соцсетях. Если раньше вотермарки ставили только на контент, произведенный нейросетями Meta, то вскоре это коснется генераций и других моделей. Компания также обещает наказывать пользователей, которые будут пытаться скрыть нейроконтент, выдавая его за настоящий;

В продолжение темы маркировки генеративного контента: вотермарки стандарта C2PA появятся в Dall-E 3. Маркировать контент будут через метаданные и с помощью символа, который будет видно на сгенерированном изображении. Разработчики из OpenAI признают, что такая маркировка — не идеальный вариант (ее достаточно легко удалить), но считают ее важным шагом в регулировании генеративного контента;

Disney станет миноритарным акционером Epic Games, инвестировав в компанию $1,5 млрд. Disney и Epic работают над общей «развлекательной вселенной», которая объединит IP обеих компаний. Как именно будет выглядеть вселенная, пока не уточняется. Некоторые уже назвали проект Disney и Epic — корпоративной метавселенной.

*Организация, запрещенная на территории РФ
👍2🤔1
📈 Популярность «замены лиц» у хакеров подскочила на 700%

📆 Следует из отчета британской биометрической компании iProov. Рост составил 704% во второй половине 2023 года по сравнению с первой половиной года.

Выросло и количество хакерских групп, которые занимаются атаками с помощью дипфейков — их стало больше на 47%.

👥 Аналитики компании ожидаемо связывают рост популярности фейссвапов с все большей доступностью самых разных ИИ-инструментов.

🏪 При этом распознать подобные дипфейки, если они качественно выполнены, все еще довольно сложно. В iProov отмечают, что мошенники чаще всего пользуются сервисами SwapFace и DeepFaceLive.

💵 Отчет iProov появился в одно время с историей о сотруднике финансовой фирмы в Гонконге, который перевел $25,6 млн мошенникам, поговорив с их дипфейками. Мошенники выдали себя за коллег служащего.

📹 Жертву насторожил имейл о необходимости крупной транзакции, но видеосозвон развеял все сомнения.

🚨 Полиция Гонконга задержала 6 человек в связи с преступлением.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2😁2🤯2
🙂 Disney будет продавать контекстную рекламу с учетом настроения зрителя

#️⃣ Сервис Disney’s Magic Words с помощью ИИ анализирует каталог компании, чтобы расставить контекстные теги для каждой сцены в мультике/фильме/передаче.

🚰 На основе этих тегов бренды смогут покупать рекламное время именно в том моменте, который наиболее подходит их продукту. К примеру, персонажу очень хочется пить и в этот момент зритель увидит контекстную рекламу минералки.

💊 При этом теги проставлены не только для вещей и брендов, которые появляются в кадре, но и для общего настроения конкретной сцены или даже эмоции. Условно говоря, на сцене, когда у Бемби убивают маму, вам могут предложить антидепрессанты.

🔩 Продвинутую рекламу увидят пользователи стриминг-сервисов Disney+ и Hulu. Сейчас Disney’s Magic Words находится на этапе тестирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3👍2👎1