This media is not supported in your browser
VIEW IN TELEGRAM
▶️ Lumiere — новая модель для генерации видео от Google
Мультимодальная нейросеть может сгенерировать видео по промпту, а на основе загруженного изображения создать стилизованный клип, анимировать отдельную часть изображения, отредактировать видео и т. д.
🕝 Ключевое отличие Lumiere от десятков похожих моделей — лежащая в основе нейросети диффузионная модель Space-Time-U-Net (STUnet).
🎞 STUnet позволяет генерировать клипы не по ключевым кадрам, а сразу все видео полностью (оно ограничено пятью секундами). То есть нейросеть сразу понимает, где в пространстве находится генерируемый объект (или объекты) и как меняется его местоположение на протяжении видео.
👍 На выходе это означает более качественную и плавную генерацию с меньшим количеством глюков.
⚖️ Журналист Verge сравнил Lumiere и Gen-2, использовав один и тот же промпт: щенок, сгенерированный Gen-2, выглядит более четким, но при этом практически не двигается; генерация Lumiere, возможно, проигрывает визуально, но при этом гораздо более живая.
🤔 Тут стоит оговориться, что самому попробовать Lumiere нельзя, поэтому сравнивать можно только с теми клипами, которые выбрали и опубликовали разработчики модели.
Мультимодальная нейросеть может сгенерировать видео по промпту, а на основе загруженного изображения создать стилизованный клип, анимировать отдельную часть изображения, отредактировать видео и т. д.
🕝 Ключевое отличие Lumiere от десятков похожих моделей — лежащая в основе нейросети диффузионная модель Space-Time-U-Net (STUnet).
🎞 STUnet позволяет генерировать клипы не по ключевым кадрам, а сразу все видео полностью (оно ограничено пятью секундами). То есть нейросеть сразу понимает, где в пространстве находится генерируемый объект (или объекты) и как меняется его местоположение на протяжении видео.
⚖️ Журналист Verge сравнил Lumiere и Gen-2, использовав один и тот же промпт: щенок, сгенерированный Gen-2, выглядит более четким, но при этом практически не двигается; генерация Lumiere, возможно, проигрывает визуально, но при этом гораздо более живая.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔1
Чипы, которые разрабатывает немецкая компания Semron, позволяют, как утверждается, запускать локально ИИ-модели на любых мобильных устройствах — даже на наушниках.
Кроме того, инновационный чип использует не транзисторы, а так называемые мемконденсаторы — конденсаторы с памятью (с мемами, к сожалению, название никак не связано)
🌡 Эти конденсаторы, работая в связке с электрическим полем, помогают «управлять» работой ИИ-модели, позволяя сократить энергозатраты и снизить тепловыделение.
👊 Понятно, что на фоне перманентного дефицита чипов в мире такие стартапы, как Semron быстро привлекают внимание инвесторов. Semron не одни играют на этом поле, а некоторые их конкуренты-стартапы даже используют похожие технологии.
💵 Тем не менее компания недавно получила почти $8 млн на дальнейшее развитие проекта, который сегодня находится на раннем, предпродуктовом этапе.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
В профильных СМИ появились обзоры AR-хедсета Vision Pro от Apple — первого нового продукта компании почти за 10 лет. Собрали главные плюсы и минусы устройства.
Плюсы:
➕ Vision Pro — это технологический прорыв. Дисплей устройства — лучшее, что есть на рынке для таких девайсов. Passthrough (возможность видеть окружающее пространство через камеру хедсета) реализован лучше, чем у конкурентов
➕ Просмотр фильмов на хедсете — отдельное удовольствие: картинка четкая, возможность выбрать виртуальную обстановку для киносеанса впечатляет, звук хорош. 3D реализовано отлично, но с непривычки может укачать
➕ Vision Pro отлично интегрирован в экосистему Apple, взаимодействие с другими устройствами компании практически идеально
➕ Навигация по интерфейсу взглядом поначалу впечатляет, возможность открыть несколько окон с приложениями и разместить их по всей квартире — тоже
➕ Потенциал устройства для реализации в следующих версиях Vision Pro — огромен
Минусы:
➖ Устройство по-настоящему тяжелое — носить его дольше часа проблематично. Vision Pro мало приспособлен для использования в движении или на улице
➖ Дорого
➖ От одного заряда аккумулятора устройство проработает не больше двух с половиной часов. Аккумулятор не встроен в устройство, а всегда болтается на проводе, подключенном к хедсету
➖ Взаимодействие с интерфейсом с помощью взгляда очень удобно. Но не всегда. Чтобы система работала, пользователю нужно все время держать взгляд на предмете, который он хочет использовать. Представьте, если вам нужно было бы все время смотреть на мышку или клавиатуру, чтобы управлять компьютером
➖ Виртуальный аватар пользователя (Persona), который создает устройство, будет сниться вам в кошмарах
➖ Если вы носите очки, то придется дополнительно заказывать линзы за $99 (или использовать одноразовые)
➖ Учитывая все эти недостатки и высокую стоимость, не до конца ясно, для чего собственно нужен Vision Pro. Пока это скорее нишевый продукт
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🤔3
По словам Винса Кейта, который помогает правительству Ангильи в регистрации доменных имен, благодаря буму генеративного ИИ остров зарабатывает около $3 млн в месяц. На данный момент это приблизительно треть бюджета Ангильи 👛.
🇦🇮 Остров Ангилья находится в Карибском море и является автономной британской заморской территорией.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5😁3🤯3❤2
💾 Исследователи из Катанийского университета в Италии придумали новый метод обучения ИИ-моделей, аналогичный тому, как мозг человека запоминает новую информацию.
🎒 Человек "переносит" информацию из кратковременной памяти (где хранится информация, полученная в течение дня) в долговременную (где хранится информация, накопленная за долгий период) во время сна.
👩🎓 По задумке итальянских исследователей ИИ-модели обучаются на датасетах в фазе бодрствования, а во время запрограммированной фазы сна модель анализирует информацию, усвоенную за день.
🧠 В качестве примера авторы метода приводят обучение модели на датасете с морскими обитателями. ИИ изучает такой датасет, когда бодрствует, а в момент сна ему вновь показывают эти изображения, но уже вперемешку с другими животными. Это сделано для того, чтобы модель, выучив новую информацию, не забыла старую.
😌 Метод итальянцев также включает в себя не только фазу сна, но и сновидений, когда ИИ может генерировать новую информацию на основе полученной ранее. Утверждается, что это поможет ИИ лучше усваивать информацию в будущем. В итоге, получая все новую и новую информацию, модель сможет генерировать более сложные решения для задач пользователя.
📈 Проанализировав работу ИИ после использования нового метода, исследователи пришли к выводу, что он стал на 2%-12% точнее определять содержание изображения и лучше запоминать информацию.
✖️ Критики метода считают, что не стоит при работе с ИИ во всем пытаться имитировать работу человеческого мозга, а лучше сосредоточиться на поиске новых решений.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4
InstructIR загрузить неудавшееся фото и естественным языком объяснить нейросети, что нужно исправить.
🌃 Например, модели можно сообщить, что фото слишком темное и на нем невозможно ничего разобрать, и InstructIR поймет, что от него требуется.
🖍 Также промптом можно убрать с фотографии шум, размытие, засвеченные участки и т.д.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔2
Из TikTok уходит музыка, за ИИ-стендап умершего комика подали в суд, чип Neuralink вживили в мозг — и другие важные новости за неделю
✅ На производителя подкастов Dudesy подали в суд за публикацию сгенерированного ИИ стендап-выступления комика Джорджа Карлина, умершего в 2008 году. Наследники Карлина недовольны, что его голос использовали для создания часового аудио. После иска авторы признали, что текст для выступления был написан людьми, а ИИ только синтезировал голос. Наследники отказываться от судебного преследования пока не собираются
✅ В начале недели X/Twitter полностью отключал возможность поиска информации о Тейлор Свифт в соцсети. Всё из-за появления ИИ-порно с использованием дипфейков певицы, которое собрало миллионы просмотров (изначально фейки появились в Telegram). Скандал оказался настолько громким, что его пришлось комментировать даже Белому дому. Вполне возможно кейс Свифт станет поводом, чтобы распространение подобного, кхм, контента, стало уголовно наказуемым;
✅ На этой неделе Universal Music объявил, что уберет каталог своей музыки из TikTok, так как не смог договориться с ее владельцами об условиях дальнейшего использования контента. Это значит, что миллионы видео в соцсети, в которых раньше звучали треки Тейлор Свифт или Билли Айлиш, остались без саундтрека. Мейджор утверждает, что представители TikTok фактические вынуждали заключить невыгодный договор и отказывались обсуждать правила использования ИИ-музыки на платформе;
✅ Нейрочип Neuralink впервые вживили в мозг человеку, сообщил гендиректор стартапа Илон Маск. По словам Маска, операция прошла успешно, пациент восстанавливается, а сам чип работает корректно. Других подробностей пока нет;
✅ Китай разрешил работу на территории страны 40 ИИ-моделям, из которых 14 — это LLM. В августе прошлого года власти страны обязали компании получать специальное разрешение на запуск ИИ-моделей для широкой публики;
✅ Власти США обсуждают возможность запретить иностранным компаниями использовать облачную инфраструктуру Штатов для обучения ИИ. В первую очередь речь, конечно, о Китае, куда США уже запретили экспорт передовых чипов;
✅И еще про TikTok. Соцсеть тестирует функцию автоматического распознавания товаров в видео. Если распознавание прошло успешно, то соцсеть подкинет пользователю ссылку, по которой такой товар или похожий на него можно будет приобрести через маркетплейс TikTok Shop;
✅ На новых смартфонах Galaxy S24, которые поступят в продажу в Китае, будет установлена ИИ-модель Ernie от Baidu, а не гугловская Gemini как на тех, что будут продаваться в Европе и США. Вероятно, это сделано, чтобы избежать проблем с китайскими властями, которые в индивидуальном порядке выдают разрешение на использование ИИ-моделей (см. новость выше).
✅ На производителя подкастов Dudesy подали в суд за публикацию сгенерированного ИИ стендап-выступления комика Джорджа Карлина, умершего в 2008 году. Наследники Карлина недовольны, что его голос использовали для создания часового аудио. После иска авторы признали, что текст для выступления был написан людьми, а ИИ только синтезировал голос. Наследники отказываться от судебного преследования пока не собираются
✅ В начале недели X/Twitter полностью отключал возможность поиска информации о Тейлор Свифт в соцсети. Всё из-за появления ИИ-порно с использованием дипфейков певицы, которое собрало миллионы просмотров (изначально фейки появились в Telegram). Скандал оказался настолько громким, что его пришлось комментировать даже Белому дому. Вполне возможно кейс Свифт станет поводом, чтобы распространение подобного, кхм, контента, стало уголовно наказуемым;
✅ На этой неделе Universal Music объявил, что уберет каталог своей музыки из TikTok, так как не смог договориться с ее владельцами об условиях дальнейшего использования контента. Это значит, что миллионы видео в соцсети, в которых раньше звучали треки Тейлор Свифт или Билли Айлиш, остались без саундтрека. Мейджор утверждает, что представители TikTok фактические вынуждали заключить невыгодный договор и отказывались обсуждать правила использования ИИ-музыки на платформе;
✅ Нейрочип Neuralink впервые вживили в мозг человеку, сообщил гендиректор стартапа Илон Маск. По словам Маска, операция прошла успешно, пациент восстанавливается, а сам чип работает корректно. Других подробностей пока нет;
✅ Китай разрешил работу на территории страны 40 ИИ-моделям, из которых 14 — это LLM. В августе прошлого года власти страны обязали компании получать специальное разрешение на запуск ИИ-моделей для широкой публики;
✅ Власти США обсуждают возможность запретить иностранным компаниями использовать облачную инфраструктуру Штатов для обучения ИИ. В первую очередь речь, конечно, о Китае, куда США уже запретили экспорт передовых чипов;
✅И еще про TikTok. Соцсеть тестирует функцию автоматического распознавания товаров в видео. Если распознавание прошло успешно, то соцсеть подкинет пользователю ссылку, по которой такой товар или похожий на него можно будет приобрести через маркетплейс TikTok Shop;
✅ На новых смартфонах Galaxy S24, которые поступят в продажу в Китае, будет установлена ИИ-модель Ernie от Baidu, а не гугловская Gemini как на тех, что будут продаваться в Европе и США. Вероятно, это сделано, чтобы избежать проблем с китайскими властями, которые в индивидуальном порядке выдают разрешение на использование ИИ-моделей (см. новость выше).
👍7❤2
Люди предпочли нейросетевой копирайтинг человеческому
📝 Сервис Semrush опросил 700 потребителей из США в возрасте 25–55+ (50,2% — мужчины, 49,5% — женщины), предложив им в нескольких тестах выбрать вариант копирайта, который им нравится больше.
❓ В каждом тесте (всего их было шесть) было два рекламных текста, один из которых написал человек, а другой — ИИ. Естественно, респонденты не знали, кто какой текст написал.
✔️ Тексты были в форматах поста в соцсеть, текста для блога, рекламы для соцсети, описания продукта и т. д.
📊 По итогу во всех тестах от 54% до 70% респондентов предпочли вариант, сгенерированный ИИ.
💬 Опрошенные предпочли вариант ИИ, так как он понятнее доносил информацию.
❗️ Авторы исследования предупреждают, что результаты теста не означают, что в «полевых» условиях текст ИИ сработал бы эффективнее, чем текст, написанный человеком.
❗️ Авторы исследования предупреждают, что результаты теста не означают, что в «полевых» условиях текст ИИ сработал бы эффективнее, чем текст, написанный человеком.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🕘 Google показал нейросеть с возможностью изменения генерации в реальном времени
🏃♀️ MobileDiffusion вносит изменения в генерацию практически синхронно с изменением промпта. Для ускоренной генерации авторы использовали модель DiffusionGAN, которая позволяет создавать изображение в один шаг.
📱 Mobile в названии появилось не случайно: нейросеть специально заточена под работу на мобильных устройствах.
⚡️ На генерацию в разрешении 512*512 у модели на топовых iOS- и Android-девайсах уходит полсекунды.
💀 Компромиссом в погоне за скоростью стало качество генераций: модель на небольшие по сегодняшним меркам 520 млн параметров, так что ждать от нее картинок уровня Midjourney не стоит.
🔮 Разработчики не выпустили ни демо, ни код модели, чтобы ее можно было потестировать самому. Можно предположить, что в том или ином виде наработки MobileDiffusion будут использованы в грядущих мобильных устройствах компании.
Нейросети Google уже работают (локально и через облако) на последних смартфонах компании, а также в новых моделях телефонов Samsung.
🏃♀️ MobileDiffusion вносит изменения в генерацию практически синхронно с изменением промпта. Для ускоренной генерации авторы использовали модель DiffusionGAN, которая позволяет создавать изображение в один шаг.
📱 Mobile в названии появилось не случайно: нейросеть специально заточена под работу на мобильных устройствах.
🔮 Разработчики не выпустили ни демо, ни код модели, чтобы ее можно было потестировать самому. Можно предположить, что в том или ином виде наработки MobileDiffusion будут использованы в грядущих мобильных устройствах компании.
Нейросети Google уже работают (локально и через облако) на последних смартфонах компании, а также в новых моделях телефонов Samsung.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤔1
🛑 Компаниям больше не нужны специалисты по метаверсу
🔄 Как пишет Bloomberg, компании, которые еще год–два назад массово нанимали людей на должности вроде генеральный директор по метавселенным, теперь меняют их на экспертов по генеративному ИИ.
За последнее время люди, которые возглавляли метаверс-направления, ушли из Walt Disney и Procter & Gamble.
💵 Сильно переживать за них не стоит — выплаты по сокращению у таких специалистов могут достигать миллиона долларов.
🥤 Если повезет, то отвечавшего за метавселенные не уволят, а назначат главой направления генеративного ИИ. Так произошло, например, с Пратиком Тхакаром из Coca-Cola, который остался в компании, но теперь отвечает за нейросети.
💬 Тому, что метавселенные — это уже «не круто», есть и другие косвенные подтверждения. Например, в последнем квартале 2023 года на созвонах с инвесторами компаний, которые входят в список S&P 500, слово «метавселенные» произносилось лишь дважды.
Для сравнения, в I квартале 2022 года метавселенные упоминали на звонках 63 раза.
🔄 Как пишет Bloomberg, компании, которые еще год–два назад массово нанимали людей на должности вроде генеральный директор по метавселенным, теперь меняют их на экспертов по генеративному ИИ.
За последнее время люди, которые возглавляли метаверс-направления, ушли из Walt Disney и Procter & Gamble.
🥤 Если повезет, то отвечавшего за метавселенные не уволят, а назначат главой направления генеративного ИИ. Так произошло, например, с Пратиком Тхакаром из Coca-Cola, который остался в компании, но теперь отвечает за нейросети.
Для сравнения, в I квартале 2022 года метавселенные упоминали на звонках 63 раза.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🤔4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🏉 Coca-Cola использовала нейросеть в рекламе для Супербоула
Рекламу напитка BodyArmor покажут 11 февраля во время главного матча в американском футболе, но клип можно посмотреть уже сейчас.
🥒 Основной посыл ролика Field of Fake: натуральное всегда лучше ненатурального, поэтому в BodyArmor используются только натуральные ингредиенты.
⚙️ Все искусственное в ролике символизирует часть, созданная нейросетью. Генерация выполнена в лучших традициях адских видео ModelScope, о которых все позабыли после выхода «реалистичной» Gen-2. Закадровый голос в синтетической части рекламы, кстати, тоже создан нейросетью.
🤫 Агентство Full Contact Advertising, которое работало над клипом вместе с BodyArmor, не раскрывает, какую нейросеть использовало.
💵 Coca-Cola купила бренд BodyArmor в 2021 году за $5,6 млрд.
Компания уже использовала нейросети в рекламе, в частности, для создания «художественных» QR-кодов.
О том, как корпорации с помощью ИИ экономят на рекламе сотни тысяч долларов — мы рассказывали тут.
Рекламу напитка BodyArmor покажут 11 февраля во время главного матча в американском футболе, но клип можно посмотреть уже сейчас.
🥒 Основной посыл ролика Field of Fake: натуральное всегда лучше ненатурального, поэтому в BodyArmor используются только натуральные ингредиенты.
Компания уже использовала нейросети в рекламе, в частности, для создания «художественных» QR-кодов.
О том, как корпорации с помощью ИИ экономят на рекламе сотни тысяч долларов — мы рассказывали тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Мы уже писали о том, как Apple хочет, чтобы как можно больше музыки в Apple Music было доступно в формате пространственного аудио.
🤔 Независимые лейблы, разобравшись в ситуации, остались недовольны инициативой Apple. Оказывается, запись трека в формате Dolby Atmos (это и есть пространственное аудио) стоит в среднем на $1 тыс. дороже, чем запись в обычном формате.
🎙 Среднестатистический альбом состоит из 10–15 треков, а значит, его выпуск в новом формате будет стоить независимому лейблу на $10–15 тыс. дороже. Запись старого альбома в новом формате может стоить еще дороже. Скажем, лейблу с бэк-каталогом в три тыс. альбомов их перезапись может обойти в $30 млн.
То есть инди-лейблу, вероятно, даже нет смысла пытаться получить от Apple повышенные роялти, так как они не отобьют стоимость записи.
❗️ Инди-лейблы хотят договориться с Apple, но если переговоры провалятся, то они готовы идти в суд.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4😁2
🕵️♀️ OpenAI разрабатывает ИИ-агентов
🕹 Такие агенты смогут выполнять сложные задания без участия пользователя — по сути, брать на себя управление устройством после получения задачи.
OpenAI уже больше года разрабатывает два типа агентов.
1️⃣ В качестве примера задач, которые будут решать агенты первого типа, The Information приводит перенос данных из документа в таблицу для анализа и автоматическое заполнение отчета о расходах с последующим переносом в бухгалтерское ПО.
2️⃣ Агенты второго типа будут выполнять менее узкие задачи вроде бронирования авиабилетов, отелей, планирования бюджета поездки и т. д.
🧠 Внутри OpenAI ИИ-агентов называют «суперумными персональными помощниками».
💵 Крупные игроки (над своими агентами также работают Meta* и Google) постепенно заходят в нишу, которую раньше обозначили сервисы вроде AutoGPT (мы подробно рассказывали о них).
💪 Создатели AutoGPT ставили перед собой амбициозную цель превратить помощника в AGI — сильный искусственный интеллект. В OpenAI тоже в последнее время часто говорят про AGI.
❗️ Ключевое опасение в связи с ИИ-агентами — безопасность: программа получает доступ к устройству пользователя и существует опасность, что таким же образом к девайсу могут подключиться и мошенники. Сейчас у OpenAI нет конкретного решения этой проблемы.
*Организация, запрещенная на территории РФ
🕹 Такие агенты смогут выполнять сложные задания без участия пользователя — по сути, брать на себя управление устройством после получения задачи.
OpenAI уже больше года разрабатывает два типа агентов.
1️⃣ В качестве примера задач, которые будут решать агенты первого типа, The Information приводит перенос данных из документа в таблицу для анализа и автоматическое заполнение отчета о расходах с последующим переносом в бухгалтерское ПО.
2️⃣ Агенты второго типа будут выполнять менее узкие задачи вроде бронирования авиабилетов, отелей, планирования бюджета поездки и т. д.
🧠 Внутри OpenAI ИИ-агентов называют «суперумными персональными помощниками».
💪 Создатели AutoGPT ставили перед собой амбициозную цель превратить помощника в AGI — сильный искусственный интеллект. В OpenAI тоже в последнее время часто говорят про AGI.
❗️ Ключевое опасение в связи с ИИ-агентами — безопасность: программа получает доступ к устройству пользователя и существует опасность, что таким же образом к девайсу могут подключиться и мошенники. Сейчас у OpenAI нет конкретного решения этой проблемы.
*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2🤔2
OpenAI отказали в названии GPT, Huawei выпустит меньше смартфонов из-за ИИ, Midjourney схантили инженера Apple — и другие важные новости за неделю
✅ OpenAI выпустил приложение ChatGPT для хедсета Vision Pro. Внутри приложения — передовая модель GPT-4 Turbo и возможность не только общаться с чат-ботом, но и генерировать изображения. То есть, каких-то принципиальных отличий от обычных версий пока нет;
✅ На этой неделе также стало известно, что OpenAI отказали в регистрации торговой марки GPT. Ведомство по патентам и товарным знакам США (USPTO) пришло к выводу, что GPT — это общее название инструментов, подобных языковой модели, которое не может быть закреплено за одной компанией. OpenAI может подать апелляцию на решение USPTO;
✅ Спрос на ИИ-чипы заставил Huawei направить все мощности на их изготовление в ущерб своим же топовым смартфонам: ИИ-чипы и чипы для телефонов Mate 60 производятся на одних и тех же предприятиях. После запрета со стороны США на экспорт передовых чиповы в КНР, в стране резко вырос спрос на местную продукцию. В то же время китайским компаниям тяжело этот спрос обеспечить;
✅ Microsoft заплатит изданию Semafor за использование своего ИИ в работе редакции. Semafor будет использовать ИИ Microsoft для написания новостей. На сайте издания появится отдельный фид Signals, куда будут публиковаться тексты, написанные с помощью ИИ. Речь не идет о текстах, полностью созданных нейросетью — редакторы сайта будут использовать модели, например, для быстрого перевода новости с неанглоязычного источника. Сколько именно Microsoft заплатит за тест, не уточняется;
✅ В Roblox появится перевод в реальном времени на 16 языков. Функция будет реализована в пользовательских чатах на платформе с помощью кастомной LLM. Это значит, что пользователь, скажем, из Кореи в переписке с пользователем из Германии будет получать сообщения сразу на родном языке — и наоборот;
✅ В Midjourney позвали инженера, который работал над Vision Pro, а также в Neuralink Илона Маска. Ахмад Аббас присоединился к стартапу в роли главы Hardware-подразделения. Вероятно, Аббас будет работать в компании над проектом под кодовым названием Orb. Что такое Orb — отдельное устройство или новая стратегия развития компании — пока неясно;
✅ Meta* всерьез взялась за маркировку генеративного контента в принадлежащих компании соцсетях. Если раньше вотермарки ставили только на контент, произведенный нейросетями Meta, то вскоре это коснется генераций и других моделей. Компания также обещает наказывать пользователей, которые будут пытаться скрыть нейроконтент, выдавая его за настоящий;
✅ В продолжение темы маркировки генеративного контента: вотермарки стандарта C2PA появятся в Dall-E 3. Маркировать контент будут через метаданные и с помощью символа, который будет видно на сгенерированном изображении. Разработчики из OpenAI признают, что такая маркировка — не идеальный вариант (ее достаточно легко удалить), но считают ее важным шагом в регулировании генеративного контента;
✅ Disney станет миноритарным акционером Epic Games, инвестировав в компанию $1,5 млрд. Disney и Epic работают над общей «развлекательной вселенной», которая объединит IP обеих компаний. Как именно будет выглядеть вселенная, пока не уточняется. Некоторые уже назвали проект Disney и Epic — корпоративной метавселенной.
*Организация, запрещенная на территории РФ
✅ OpenAI выпустил приложение ChatGPT для хедсета Vision Pro. Внутри приложения — передовая модель GPT-4 Turbo и возможность не только общаться с чат-ботом, но и генерировать изображения. То есть, каких-то принципиальных отличий от обычных версий пока нет;
✅ На этой неделе также стало известно, что OpenAI отказали в регистрации торговой марки GPT. Ведомство по патентам и товарным знакам США (USPTO) пришло к выводу, что GPT — это общее название инструментов, подобных языковой модели, которое не может быть закреплено за одной компанией. OpenAI может подать апелляцию на решение USPTO;
✅ Спрос на ИИ-чипы заставил Huawei направить все мощности на их изготовление в ущерб своим же топовым смартфонам: ИИ-чипы и чипы для телефонов Mate 60 производятся на одних и тех же предприятиях. После запрета со стороны США на экспорт передовых чиповы в КНР, в стране резко вырос спрос на местную продукцию. В то же время китайским компаниям тяжело этот спрос обеспечить;
✅ Microsoft заплатит изданию Semafor за использование своего ИИ в работе редакции. Semafor будет использовать ИИ Microsoft для написания новостей. На сайте издания появится отдельный фид Signals, куда будут публиковаться тексты, написанные с помощью ИИ. Речь не идет о текстах, полностью созданных нейросетью — редакторы сайта будут использовать модели, например, для быстрого перевода новости с неанглоязычного источника. Сколько именно Microsoft заплатит за тест, не уточняется;
✅ В Roblox появится перевод в реальном времени на 16 языков. Функция будет реализована в пользовательских чатах на платформе с помощью кастомной LLM. Это значит, что пользователь, скажем, из Кореи в переписке с пользователем из Германии будет получать сообщения сразу на родном языке — и наоборот;
✅ В Midjourney позвали инженера, который работал над Vision Pro, а также в Neuralink Илона Маска. Ахмад Аббас присоединился к стартапу в роли главы Hardware-подразделения. Вероятно, Аббас будет работать в компании над проектом под кодовым названием Orb. Что такое Orb — отдельное устройство или новая стратегия развития компании — пока неясно;
✅ Meta* всерьез взялась за маркировку генеративного контента в принадлежащих компании соцсетях. Если раньше вотермарки ставили только на контент, произведенный нейросетями Meta, то вскоре это коснется генераций и других моделей. Компания также обещает наказывать пользователей, которые будут пытаться скрыть нейроконтент, выдавая его за настоящий;
✅ В продолжение темы маркировки генеративного контента: вотермарки стандарта C2PA появятся в Dall-E 3. Маркировать контент будут через метаданные и с помощью символа, который будет видно на сгенерированном изображении. Разработчики из OpenAI признают, что такая маркировка — не идеальный вариант (ее достаточно легко удалить), но считают ее важным шагом в регулировании генеративного контента;
✅ Disney станет миноритарным акционером Epic Games, инвестировав в компанию $1,5 млрд. Disney и Epic работают над общей «развлекательной вселенной», которая объединит IP обеих компаний. Как именно будет выглядеть вселенная, пока не уточняется. Некоторые уже назвали проект Disney и Epic — корпоративной метавселенной.
*Организация, запрещенная на территории РФ
👍2🤔1
📆 Следует из отчета британской биометрической компании iProov. Рост составил 704% во второй половине 2023 года по сравнению с первой половиной года.
Выросло и количество хакерских групп, которые занимаются атаками с помощью дипфейков — их стало больше на 47%.
👥 Аналитики компании ожидаемо связывают рост популярности фейссвапов с все большей доступностью самых разных ИИ-инструментов.
🏪 При этом распознать подобные дипфейки, если они качественно выполнены, все еще довольно сложно. В iProov отмечают, что мошенники чаще всего пользуются сервисами SwapFace и DeepFaceLive.
📹 Жертву насторожил имейл о необходимости крупной транзакции, но видеосозвон развеял все сомнения.
🚨 Полиция Гонконга задержала 6 человек в связи с преступлением.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2😁2🤯2
#️⃣ Сервис Disney’s Magic Words с помощью ИИ анализирует каталог компании, чтобы расставить контекстные теги для каждой сцены в мультике/фильме/передаче.
🚰 На основе этих тегов бренды смогут покупать рекламное время именно в том моменте, который наиболее подходит их продукту. К примеру, персонажу очень хочется пить и в этот момент зритель увидит контекстную рекламу минералки.
💊 При этом теги проставлены не только для вещей и брендов, которые появляются в кадре, но и для общего настроения конкретной сцены или даже эмоции. Условно говоря, на сцене, когда у Бемби убивают маму, вам могут предложить антидепрессанты.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔3👍2👎1
Media is too big
VIEW IN TELEGRAM
Цукербергу не понравился Vision Pro 👎
Глава Meta* опубликовал у себя в Instagram** видео, в котором рассказал о своих впечатлениях от нового устройства Apple.
По словам Цукерберга, с удивлением для себя он обнаружил, что хедсет Quest, который разрабатывает его компания, лучше того, что выпустила компания Тима Кука😱 .
😌 Цукерберг скромно говорит, что до тестирования думал, что Quest обойдет Vision Pro только в категории «цена-качество» (Quest 3 стоит $500, Vision Pro — от $3 500).
📊 Но по результатам теста стало очевидно, что Quest лучше Vision Pro во всем, для чего люди в принципе используют такие устройства, говорит Цукерберг в видео.
☝️ Quest удобнее — не такой тяжелый, из него не торчат провода, у него ярче экран и больше обзор, перечисляет Цукерберг. Управление взглядом? Прикольно, но не всегда удобно, кроме того, и в Quest он вернется в следующих версиях (Eyetracking был в про-версии хедсета)!
Ради дисплея Vision Pro, который все так хвалят, Apple пришлось пойти на слишком много компромиссов, уверен он.
💪 В конце Цук обещает, что будущее за открытыми системами, как Quest, а не закрытыми — как Apple.
🤔 От себя добавим: выглядит немного странно, что Цукербергу самому приходится так хвалить свой продукт и критиковать чужой.
*Организация, запрещенная на территории РФ
**Instagram входит в Meta — организацию, запрещенную на территории РФ
Глава Meta* опубликовал у себя в Instagram** видео, в котором рассказал о своих впечатлениях от нового устройства Apple.
По словам Цукерберга, с удивлением для себя он обнаружил, что хедсет Quest, который разрабатывает его компания, лучше того, что выпустила компания Тима Кука
😌 Цукерберг скромно говорит, что до тестирования думал, что Quest обойдет Vision Pro только в категории «цена-качество» (Quest 3 стоит $500, Vision Pro — от $3 500).
Ради дисплея Vision Pro, который все так хвалят, Apple пришлось пойти на слишком много компромиссов, уверен он.
💪 В конце Цук обещает, что будущее за открытыми системами, как Quest, а не закрытыми — как Apple.
🤔 От себя добавим: выглядит немного странно, что Цукербергу самому приходится так хвалить свой продукт и критиковать чужой.
*Организация, запрещенная на территории РФ
**Instagram входит в Meta — организацию, запрещенную на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5❤2
🌭 Stable Cascade использует принципиально новую архитектуру Würstchen. Würstchen (то есть «сосиска» в переводе с немецкого) отличается высокой скоростью генераций при меньшей требовательности к ресурсам.
Модель доступна на GitHub, но с запретом на коммерческое использование.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥3🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
Ключевое отличие Aya от конкурентов — поддержка 101 языка, что в два раза больше, чем у конкурирующих языковых моделей с открытым кодом. Десятки языков и диалектов доступны только в модели Cohere.
📝 Стартап выложил в открытый доступ не только саму модель, но и датасет, на котором ее обучали. Вместе с датасетом идут полезные комментарии от носителей языков, которые участвовали в создании модели.
Летом прошлого года Cohere привлек $270 млн от инвесторов, включая Nvidia. Оценочная стоимость компании достигла $1,2 млрд.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🥰4🔥1
☁️ OpenAI говорят, что Sora («небо» в переводе с японского) не просто следует промпту, но и понимает, какое место генерируемые объекты занимают в «физическом» мире. Что-то подобное мы слышали в недавнем анонсе Runway.
🧨 Те примеры генераций, которыми поделились разработчики, действительно выглядят потрясающе — тот же Gen-2 ничем подобным похвастаться не может. Длятся они, правда, не по минуте, а около 10–15 секунд.
🛑 Другое дело, что обычным пользователям модель недоступна и оценить ее реальные возможности не получится. OpenAI открыл Sora только для избранных разработчиков, художников, дизайнеров и киноделов. Все остальные в ближайшее время доступа к модели не получат. Все из-за опасений, что модель может быть использована для распространения фотореалистичных фейков.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3