This media is not supported in your browser
VIEW IN TELEGRAM
🐴 TRIPS — новая альтернатива нерфам и Gaussian Splatting
Мы еще не успели наиграться с гауссианами, которые должны были стать заменой NeRF, как исследователи из немецкого Университета Эрлангена-Нюрнберга придумали еще более эффективный способ рендеринга. По крайней мере, они так говорят.
✋ Знакомьтесь, Trilinear Point Splatting (TRIPS) — способ рендеринга в реальном времени, который обходит Gaussian Splatting по качеству картинки. Другой популярный способ рендеринга ADOP (Approximate Differentiable One-Pixel Point Rendering), который похож на TRIPS, уступает ему по скорости работы и стабильности результата, в том числе из-за использования «громоздкой» нейросети.
☁️ В основе TRIPS лежит так называемый Point-Based рендеринг, при котором 3D-сцена предстает не в виде геометрических фигур, а в виде облака точек. Это облако TRIPS представляет в виде многослойной пирамиды, где каждый слой — это точки в разном разрешении (а не в одном, как у конкурентов).
👈 В зависимости от текущей необходимости TRIPS выбирает нужный для рендера слой пирамиды, обеспечивая скорость и детализацию. Для этого используется тот самый Trilinear Splatting, который вынесен в название.
🧑🎨 На финальном этапе рендера подключается оптимизированная под задачу нейросеть, которая дорисовывает сцену без артефактов и пробелов.
Мы еще не успели наиграться с гауссианами, которые должны были стать заменой NeRF, как исследователи из немецкого Университета Эрлангена-Нюрнберга придумали еще более эффективный способ рендеринга. По крайней мере, они так говорят.
☁️ В основе TRIPS лежит так называемый Point-Based рендеринг, при котором 3D-сцена предстает не в виде геометрических фигур, а в виде облака точек. Это облако TRIPS представляет в виде многослойной пирамиды, где каждый слой — это точки в разном разрешении (а не в одном, как у конкурентов).
🧑🎨 На финальном этапе рендера подключается оптимизированная под задачу нейросеть, которая дорисовывает сцену без артефактов и пробелов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
К такому выводу пришли аналитики компании StarCounter, посчитав, как изменилась доля поисковика Microsoft с момента, когда в него добавили языковую модель GPT
💪 Если Google и стоит опасаться конкурентов, то в очень далеком будущем — сейчас поисковик компании занимает 91,6% рынка.
🤏 Нельзя сказать, что интеграция ИИ не дала совсем никакого результата. Например, в США количество активных пользователей Bing в месяц к концу 2023 года выросло до 4,4 млн против 3,1 млн во II квартале. Кроме того, время использования поисковика выросло на 84%.
Тем не менее апокалиптические прогнозы, что ИИ сразу же убьет весь поисковый бизнес Google, пока не подтверждаются.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2👎1
OpenAI начал сотрудничать с военными, индийские власти пригрозили закрывать бизнес за дипфейки, Цукерберг разрабатывает AGI для всех — и другие важные новости за неделю
✅ OpenAI снял запрет на использование своих разработок военными — соответствующий пункт пропал с сайта компании. Речи о разработки оружия с интегрированным ChatGPT не идет — компания сотрудничает с Пентагоном только по разработке решений для обеспечения кибербезопасности;
✅ После запуска GPT Store магазин наводнили ИИ-подружки на любой вкус. Разработчики этих чат-ботов прямо нарушают правила использования GPT, которые запрещают создание кастомных чат-ботов, симулирующих романтические отношения;
✅ Microsoft запустил платную подписку на ИИ-помощника Copilot. За интеграцию Copilot в сервисы, входящие в пакет Microsoft 365, придется заплатить $20 в месяц. При этом подписку на 365 тоже никто отменял, так что заплатить придется за оба продукта;
✅ Марк Цукерберг анонсировал разработку сильного искусственного интеллекта (AGI) с открытым кодом. Для создания ИИ, который сможет решать все задачи, которые может решить человеческий мозг, но при этом будет доступен всем, Meta* объединила два подразделения внутри компании, которые занимаются ИИ;
✅ Apple может разделить App Store на два магазина: один будет работать в Европе, другой — в остальном мире. На такой шаг компании приходится идти из-за новых требований ЕС, которые обяжут магазины приложений разрешить загрузку приложений со сторонних ресурсов. Сегментирование App Store должно произойти до 6 марта;
✅ Google пытается удержать сотрудников от перехода в OpenAI, предлагая им специальные акции. В зависимости от важности сотрудника сумма пакета акций может достигать миллионов долларов. В качестве дополнительного бонуса Google разрешает продать такие акции уже через год, а не через три–пять лет, как это бывает с обычными опционами. С октября 2023 года в OpenAI ушли как минимум шесть сотрудников Google, которые работали над моделью Gemini;
✅ Индийские власти пригрозили технологическим компаниям жесткими мерами вплоть до запрета на работу, если они не научатся эффективно бороться с дипфейками. Власти уже несколько месяцев говорят об опасности синтетических видео на фоне появления рекламы, где дипфейки индийских селебрити продвигают различные товары. Чиновников расстраивает, что компании недостаточно активно удаляют такие видео со своих платформ, несмотря на их требования;
✅ TikTok тестирует генерацию песен по промпту с помощью функции AI Song. Сгенерировать можно не только музыку, но и тексты — для этого используется языковая модель Bloom. AI Song доступен небольшому числу пользователей соцсети;
✅ Adobe прокачал Premier Pro с помощью генеративного ИИ. В бета-версии стали доступны инструменты для редактирования аудио: удаление фонового шума, авторазметка аудио по жанрам, автоматическое улучшение качества записи и т. д.;
✅ Stability AI выпустил свою первую нейросеть в новом году. Stable Code 3B, как можно догадаться из названия, работает с программным кодом. Но главная фишка модели в ее компактности. Благодаря относительно небольшому количеству параметров Stable Code можно запустить локально даже не на очень мощном ноутбуке.
*Организация, запрещенная на территории РФ
✅ OpenAI снял запрет на использование своих разработок военными — соответствующий пункт пропал с сайта компании. Речи о разработки оружия с интегрированным ChatGPT не идет — компания сотрудничает с Пентагоном только по разработке решений для обеспечения кибербезопасности;
✅ После запуска GPT Store магазин наводнили ИИ-подружки на любой вкус. Разработчики этих чат-ботов прямо нарушают правила использования GPT, которые запрещают создание кастомных чат-ботов, симулирующих романтические отношения;
✅ Microsoft запустил платную подписку на ИИ-помощника Copilot. За интеграцию Copilot в сервисы, входящие в пакет Microsoft 365, придется заплатить $20 в месяц. При этом подписку на 365 тоже никто отменял, так что заплатить придется за оба продукта;
✅ Марк Цукерберг анонсировал разработку сильного искусственного интеллекта (AGI) с открытым кодом. Для создания ИИ, который сможет решать все задачи, которые может решить человеческий мозг, но при этом будет доступен всем, Meta* объединила два подразделения внутри компании, которые занимаются ИИ;
✅ Apple может разделить App Store на два магазина: один будет работать в Европе, другой — в остальном мире. На такой шаг компании приходится идти из-за новых требований ЕС, которые обяжут магазины приложений разрешить загрузку приложений со сторонних ресурсов. Сегментирование App Store должно произойти до 6 марта;
✅ Google пытается удержать сотрудников от перехода в OpenAI, предлагая им специальные акции. В зависимости от важности сотрудника сумма пакета акций может достигать миллионов долларов. В качестве дополнительного бонуса Google разрешает продать такие акции уже через год, а не через три–пять лет, как это бывает с обычными опционами. С октября 2023 года в OpenAI ушли как минимум шесть сотрудников Google, которые работали над моделью Gemini;
✅ Индийские власти пригрозили технологическим компаниям жесткими мерами вплоть до запрета на работу, если они не научатся эффективно бороться с дипфейками. Власти уже несколько месяцев говорят об опасности синтетических видео на фоне появления рекламы, где дипфейки индийских селебрити продвигают различные товары. Чиновников расстраивает, что компании недостаточно активно удаляют такие видео со своих платформ, несмотря на их требования;
✅ TikTok тестирует генерацию песен по промпту с помощью функции AI Song. Сгенерировать можно не только музыку, но и тексты — для этого используется языковая модель Bloom. AI Song доступен небольшому числу пользователей соцсети;
✅ Adobe прокачал Premier Pro с помощью генеративного ИИ. В бета-версии стали доступны инструменты для редактирования аудио: удаление фонового шума, авторазметка аудио по жанрам, автоматическое улучшение качества записи и т. д.;
✅ Stability AI выпустил свою первую нейросеть в новом году. Stable Code 3B, как можно догадаться из названия, работает с программным кодом. Но главная фишка модели в ее компактности. Благодаря относительно небольшому количеству параметров Stable Code можно запустить локально даже не на очень мощном ноутбуке.
*Организация, запрещенная на территории РФ
👍10
This media is not supported in your browser
VIEW IN TELEGRAM
🧩 Модульный HoloTile состоит из множества «плиток», которые позволяют перемещаться в VR в любом направлении, причем сразу нескольким пользователям. В компании позиционируют устройство не только для (и даже не столько) домашнего использования, но и для парков развлечений Disney. В теории возможно использование HoloTile и в кинопроизводстве.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
Это следует из исследования, проведенного MIT. Авторы оценили рентабельность ИИ-моделей в некоторых профессиях, сфокусировавшись на тех задачах, которые требуют использования компьютерного зрения.
Всего в выборку попало 800 профессий и более одной тыс. задач.
🥖 В качестве примера авторы приводят гипотетическую пекарню, которая хочет использовать ИИ для оценки качества ингредиентов. Проверка качества составляет лишь 6% от объема задач, входящих в обязанности пекарей, получающих $48 тыс. в год каждый.
📆 В MIT подсчитали, что на сегодня в изученных ими профессиях автоматизация лишь 23% задач будет эффективна с точки зрения стоимости. Авторы признают, что по мере усовершенствования ИИ-моделей показатель может вырасти до 40% к 2030 году.
🤖 В целом, исследователи делают вывод, что замена людей на ИИ для выполнения отдельных задач будет скорее постепенной, чем быстрой. Авторы отмечают, что удешевление использования ИИ-моделей с компьютерным зрением даже на 20% ежегодно будет означать, что пройдут «десятилетия», прежде чем они станут по-настоящему выгодными.
Исследование MIT на какое-то время может успокоить людей, напуганных недавним прогнозом МВФ, из которого следует, что влиянию ИИ может подвергнуться до 60% всех профессий в мире.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Подразделение Codec Avatars совместно с Наньянским технологическим университетом разработали URHand — модель для фотореалистичной симуляции человеческих рук в виртуальном пространстве.
🧍♀️ Такая дотошность, считают разработчики, должна в разы повысить эффект присутствия в VR. Логика такая: так как в реальной жизни человек постоянно видит руки перед собой и идентифицирует себя через них, то именно их реалистичная модель (вместе с остальным телом) нужна ему и в виртуальном пространстве.
📱 Чтобы создать полную иммерсию, URHand позволяет перенести в VR точную копию рук пользователя, сделав несколько фотографий на смартфон.
URHand пока находится на стадии эксперимента и в ближайшее время не появится в девайсах Meta
*Организация, запрещенная на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤4🤔2
⌨️ Даже небольшое изменение промпта может изменить ответ LLM
Исследование, проведенное Институтом информационных наук Южной Калифорнии, показало, что даже пробел в начале текстовой подсказки может изменить ответ модели.
🛠 Такие особенности LLM не позволяют использовать их как надежный инструмент в работе. Если LLM при малейшем изменении промпта дает новый ответ разной степени точности, то положиться на него сложно. Задача для разработчиков: создать модели, которые будут давать точные ответы вне зависимости от изменений в текстовой подсказке.
🧪 Эксперимент проводили в несколько этапов, используя модель GPT-3.5 Turbo. Авторы просили LLM определить тональность текста, истинно или ложно утверждение, проверить текст на наличие сарказма, юмора и т. д. Текст выглядел так: «Я пошел с Элис, чтобы посмотреть фильм о яблоках. Он был потрясающим».
📋 На первом этапе модель просили сгенерировать информацию в нескольких форматах: CSV, XML, JSON и других. Оказалось, что простое изменение формата может привести к снижению точности генерируемой информации на 3–6% или изменению самого ответа на 10%. Разницу в точности и изменениях в ответах определяли не на глаз, а с помощью бенчмарков.
⁉️ На следующем этапе исследователи перефразировали промпт — например, из вопроса в утверждение. В этом случае ответ мог отличаться по 900 признакам от ответа, выбранного базовым. Пробел в начале промпта давал более 500 изменений.
🔐 Также авторы работы использовали джейлбрейк — метод, который позволяет обходить ограничения, заложенные в модель разработчиками. В этом случае чат-бот берет на себя «роль», которая позволяет давать ему ответы без цензуры. Использование джейлбрейков часто приводило или к очень большому количеству изменений (до 2,5 тыс.), или LLM в принципе не могла дать корректный ответ.
💳 Исследователи попробовали предложить LLM денег, но это практически не повлияло на итоговую генерацию — хотя интернет-эксперты утверждают обратное.
Авторы не приводят варианты ответов LLM в исследовании.
Исследование, проведенное Институтом информационных наук Южной Калифорнии, показало, что даже пробел в начале текстовой подсказки может изменить ответ модели.
🛠 Такие особенности LLM не позволяют использовать их как надежный инструмент в работе. Если LLM при малейшем изменении промпта дает новый ответ разной степени точности, то положиться на него сложно. Задача для разработчиков: создать модели, которые будут давать точные ответы вне зависимости от изменений в текстовой подсказке.
🧪 Эксперимент проводили в несколько этапов, используя модель GPT-3.5 Turbo. Авторы просили LLM определить тональность текста, истинно или ложно утверждение, проверить текст на наличие сарказма, юмора и т. д. Текст выглядел так: «Я пошел с Элис, чтобы посмотреть фильм о яблоках. Он был потрясающим».
📋 На первом этапе модель просили сгенерировать информацию в нескольких форматах: CSV, XML, JSON и других. Оказалось, что простое изменение формата может привести к снижению точности генерируемой информации на 3–6% или изменению самого ответа на 10%. Разницу в точности и изменениях в ответах определяли не на глаз, а с помощью бенчмарков.
⁉️ На следующем этапе исследователи перефразировали промпт — например, из вопроса в утверждение. В этом случае ответ мог отличаться по 900 признакам от ответа, выбранного базовым. Пробел в начале промпта давал более 500 изменений.
🔐 Также авторы работы использовали джейлбрейк — метод, который позволяет обходить ограничения, заложенные в модель разработчиками. В этом случае чат-бот берет на себя «роль», которая позволяет давать ему ответы без цензуры. Использование джейлбрейков часто приводило или к очень большому количеству изменений (до 2,5 тыс.), или LLM в принципе не могла дать корректный ответ.
Авторы не приводят варианты ответов LLM в исследовании.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4👍3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
🎮 🧹 В X/Twitter геймифицировали уборку квартиры с помощью AR
Специалист по AR/VR в Shopify Дэниел Бошамп придумал, как сделать уборку квартиры чуть менее скучным занятием🥳 .
⏳ В свободное от работы время он сделал приложение для хедсета Oculus Quest, которое наглядно показывает, где в доме пылесосили, а где — нет. Задача — «зачистить» жилище от пыльных зон.
Результатом Бошамп поделился в соцсети.
Называется все это Spatial Vacuuming😎 .
Специалист по AR/VR в Shopify Дэниел Бошамп придумал, как сделать уборку квартиры чуть менее скучным занятием
Результатом Бошамп поделился в соцсети.
Называется все это Spatial Vacuuming
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2🤔2❤1
Альтман ищет деньги на заводы, В TikTok появятся видео на полчаса, появились подробности о загрузке приложений в обход App Store — и другие важные новости за неделю
✅ Сэм Альтман ищет инвесторов для своего проекта по созданию сети заводов по производству полупроводников. Альтман не собирается создавать свою компанию-производителя, а хочет пригласить уже существующие компании работать на новых заводах. Удастся ли реализовать проект — большой вопрос. Строительство даже одного завода может обойтись в десятки миллиардов долларов, а строительство целой сети предприятий займет годы;
✅ Nvidia представила свой ответ ChatGPT. Компания представила семейство моделей ChatQA, которые, как обещается, сравнимы по производительности с GPT-4. При этом в их обучении не использована информация, сгенерированная моделью, разработанной OpenAI (это — обычная практика, если что);
✅ Разработчик ИИ-моделей для клонирования голосов ElevenLabs стал единорогом. Стартап получил еще $80 млн от инвесторов. Таким образом, его оценочная стоимость превысила $1 млрд. По такому случаю компания анонсировала выход ИИ-инструмента для озвучивания полнометражных фильмов и запуск маркетплейса, где пользователи смогут продавать клон своего голоса;
✅ Apple рассказал, как именно будет поощрять музыкантов за выпуск треков в формате пространственного аудио через Apple Music. Роялти за каждую песню, выложенную в формате Spatial Audio, будут на 10% выше, чем за обычное аудио;
✅ И еще про Apple. Компания объяснила, как будет работать загрузка приложений со сторонних площадок, которая станет доступна в марте пользователям из ЕС с выходом iOS 17.4. Apple будет утверждать сторонние магазины, из которых можно будет скачивать приложения. Разработчики смогут использовать платежную инфраструктуру Apple (c 3% комиссией) или добавить в приложение стороннюю платежную систему. Сумма комиссии, которую Apple берет за каждую загрузку, в ЕС снизится с 30% до 10%. При этом все без исключения разработчики должны будут платить Apple €0,5 за первую установку приложения, если приложение скачали больше миллиона раз;
✅ Google уже в феврале добавит в браузер Chrome генеративный функционал. Он позволит менять фон браузера по промпту, компоновать открытые вкладки по теме и поможет дописать текст, который пользователь хочет опубликовать в интернете. Первыми обновления смогут потестировать пользователи из США;
✅ Платформа VK Реклама запустила нейросеть, которая автоматически подберет целевую аудиторию для показа рекламного сообщения. Модель ориентируется на успешные рекламные кампании на схожую тематику, которые запущены на платформе;
✅ TikTok тестирует возможность загрузки в соцсеть видео продолжительностью 30 минут. Доступ к загрузке получили некоторые пользователи приложения соцсети на Android и iOS. Изначально на платформе разрешалось публиковать видео не длиннее 15 секунд. Тестируя загрузку длинных видео, считают аналитики, соцсеть пробует себя в качестве прямого конкурента YouTube.
✅ Сэм Альтман ищет инвесторов для своего проекта по созданию сети заводов по производству полупроводников. Альтман не собирается создавать свою компанию-производителя, а хочет пригласить уже существующие компании работать на новых заводах. Удастся ли реализовать проект — большой вопрос. Строительство даже одного завода может обойтись в десятки миллиардов долларов, а строительство целой сети предприятий займет годы;
✅ Nvidia представила свой ответ ChatGPT. Компания представила семейство моделей ChatQA, которые, как обещается, сравнимы по производительности с GPT-4. При этом в их обучении не использована информация, сгенерированная моделью, разработанной OpenAI (это — обычная практика, если что);
✅ Разработчик ИИ-моделей для клонирования голосов ElevenLabs стал единорогом. Стартап получил еще $80 млн от инвесторов. Таким образом, его оценочная стоимость превысила $1 млрд. По такому случаю компания анонсировала выход ИИ-инструмента для озвучивания полнометражных фильмов и запуск маркетплейса, где пользователи смогут продавать клон своего голоса;
✅ Apple рассказал, как именно будет поощрять музыкантов за выпуск треков в формате пространственного аудио через Apple Music. Роялти за каждую песню, выложенную в формате Spatial Audio, будут на 10% выше, чем за обычное аудио;
✅ И еще про Apple. Компания объяснила, как будет работать загрузка приложений со сторонних площадок, которая станет доступна в марте пользователям из ЕС с выходом iOS 17.4. Apple будет утверждать сторонние магазины, из которых можно будет скачивать приложения. Разработчики смогут использовать платежную инфраструктуру Apple (c 3% комиссией) или добавить в приложение стороннюю платежную систему. Сумма комиссии, которую Apple берет за каждую загрузку, в ЕС снизится с 30% до 10%. При этом все без исключения разработчики должны будут платить Apple €0,5 за первую установку приложения, если приложение скачали больше миллиона раз;
✅ Google уже в феврале добавит в браузер Chrome генеративный функционал. Он позволит менять фон браузера по промпту, компоновать открытые вкладки по теме и поможет дописать текст, который пользователь хочет опубликовать в интернете. Первыми обновления смогут потестировать пользователи из США;
✅ Платформа VK Реклама запустила нейросеть, которая автоматически подберет целевую аудиторию для показа рекламного сообщения. Модель ориентируется на успешные рекламные кампании на схожую тематику, которые запущены на платформе;
✅ TikTok тестирует возможность загрузки в соцсеть видео продолжительностью 30 минут. Доступ к загрузке получили некоторые пользователи приложения соцсети на Android и iOS. Изначально на платформе разрешалось публиковать видео не длиннее 15 секунд. Тестируя загрузку длинных видео, считают аналитики, соцсеть пробует себя в качестве прямого конкурента YouTube.
👍4❤3👏2
📸 InstantID — новая модель для создания генераций на основе одного фото
Нейросеть от команды разработчиков из Пекина может создавать генерации в разных стилях и жанрах на основе одного портретного фото и промпта.
🔩 InstantID может не просто создать красиво оформленную аватарку (таким после Lensa уже никого не удивишь): по одному снимку модель может сгенерировать персонажа в разных ракурсах, синтезировать в одной генерации людей с двух фото, объединить в одном персонаже людей с двух фото, по портретному фото создать не портретное изображение и так далее. В фотореалистичные генерации модель тоже умеет.
Все это с высокой детализацией и без необходимости файнтюнить модель.
🫡 Демо доступно здесь.
😈 Эксперты уже пугают, что InstantID станет любимым инструментом для создания дипфейков благодаря гибкости и простоте в использовании.
Нейросеть от команды разработчиков из Пекина может создавать генерации в разных стилях и жанрах на основе одного портретного фото и промпта.
Все это с высокой детализацией и без необходимости файнтюнить модель.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
▶️ Lumiere — новая модель для генерации видео от Google
Мультимодальная нейросеть может сгенерировать видео по промпту, а на основе загруженного изображения создать стилизованный клип, анимировать отдельную часть изображения, отредактировать видео и т. д.
🕝 Ключевое отличие Lumiere от десятков похожих моделей — лежащая в основе нейросети диффузионная модель Space-Time-U-Net (STUnet).
🎞 STUnet позволяет генерировать клипы не по ключевым кадрам, а сразу все видео полностью (оно ограничено пятью секундами). То есть нейросеть сразу понимает, где в пространстве находится генерируемый объект (или объекты) и как меняется его местоположение на протяжении видео.
👍 На выходе это означает более качественную и плавную генерацию с меньшим количеством глюков.
⚖️ Журналист Verge сравнил Lumiere и Gen-2, использовав один и тот же промпт: щенок, сгенерированный Gen-2, выглядит более четким, но при этом практически не двигается; генерация Lumiere, возможно, проигрывает визуально, но при этом гораздо более живая.
🤔 Тут стоит оговориться, что самому попробовать Lumiere нельзя, поэтому сравнивать можно только с теми клипами, которые выбрали и опубликовали разработчики модели.
Мультимодальная нейросеть может сгенерировать видео по промпту, а на основе загруженного изображения создать стилизованный клип, анимировать отдельную часть изображения, отредактировать видео и т. д.
🕝 Ключевое отличие Lumiere от десятков похожих моделей — лежащая в основе нейросети диффузионная модель Space-Time-U-Net (STUnet).
🎞 STUnet позволяет генерировать клипы не по ключевым кадрам, а сразу все видео полностью (оно ограничено пятью секундами). То есть нейросеть сразу понимает, где в пространстве находится генерируемый объект (или объекты) и как меняется его местоположение на протяжении видео.
⚖️ Журналист Verge сравнил Lumiere и Gen-2, использовав один и тот же промпт: щенок, сгенерированный Gen-2, выглядит более четким, но при этом практически не двигается; генерация Lumiere, возможно, проигрывает визуально, но при этом гораздо более живая.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔1
Чипы, которые разрабатывает немецкая компания Semron, позволяют, как утверждается, запускать локально ИИ-модели на любых мобильных устройствах — даже на наушниках.
Кроме того, инновационный чип использует не транзисторы, а так называемые мемконденсаторы — конденсаторы с памятью (с мемами, к сожалению, название никак не связано)
🌡 Эти конденсаторы, работая в связке с электрическим полем, помогают «управлять» работой ИИ-модели, позволяя сократить энергозатраты и снизить тепловыделение.
👊 Понятно, что на фоне перманентного дефицита чипов в мире такие стартапы, как Semron быстро привлекают внимание инвесторов. Semron не одни играют на этом поле, а некоторые их конкуренты-стартапы даже используют похожие технологии.
💵 Тем не менее компания недавно получила почти $8 млн на дальнейшее развитие проекта, который сегодня находится на раннем, предпродуктовом этапе.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
В профильных СМИ появились обзоры AR-хедсета Vision Pro от Apple — первого нового продукта компании почти за 10 лет. Собрали главные плюсы и минусы устройства.
Плюсы:
➕ Vision Pro — это технологический прорыв. Дисплей устройства — лучшее, что есть на рынке для таких девайсов. Passthrough (возможность видеть окружающее пространство через камеру хедсета) реализован лучше, чем у конкурентов
➕ Просмотр фильмов на хедсете — отдельное удовольствие: картинка четкая, возможность выбрать виртуальную обстановку для киносеанса впечатляет, звук хорош. 3D реализовано отлично, но с непривычки может укачать
➕ Vision Pro отлично интегрирован в экосистему Apple, взаимодействие с другими устройствами компании практически идеально
➕ Навигация по интерфейсу взглядом поначалу впечатляет, возможность открыть несколько окон с приложениями и разместить их по всей квартире — тоже
➕ Потенциал устройства для реализации в следующих версиях Vision Pro — огромен
Минусы:
➖ Устройство по-настоящему тяжелое — носить его дольше часа проблематично. Vision Pro мало приспособлен для использования в движении или на улице
➖ Дорого
➖ От одного заряда аккумулятора устройство проработает не больше двух с половиной часов. Аккумулятор не встроен в устройство, а всегда болтается на проводе, подключенном к хедсету
➖ Взаимодействие с интерфейсом с помощью взгляда очень удобно. Но не всегда. Чтобы система работала, пользователю нужно все время держать взгляд на предмете, который он хочет использовать. Представьте, если вам нужно было бы все время смотреть на мышку или клавиатуру, чтобы управлять компьютером
➖ Виртуальный аватар пользователя (Persona), который создает устройство, будет сниться вам в кошмарах
➖ Если вы носите очки, то придется дополнительно заказывать линзы за $99 (или использовать одноразовые)
➖ Учитывая все эти недостатки и высокую стоимость, не до конца ясно, для чего собственно нужен Vision Pro. Пока это скорее нишевый продукт
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🤔3
По словам Винса Кейта, который помогает правительству Ангильи в регистрации доменных имен, благодаря буму генеративного ИИ остров зарабатывает около $3 млн в месяц. На данный момент это приблизительно треть бюджета Ангильи 👛.
🇦🇮 Остров Ангилья находится в Карибском море и является автономной британской заморской территорией.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5😁3🤯3❤2
💾 Исследователи из Катанийского университета в Италии придумали новый метод обучения ИИ-моделей, аналогичный тому, как мозг человека запоминает новую информацию.
🎒 Человек "переносит" информацию из кратковременной памяти (где хранится информация, полученная в течение дня) в долговременную (где хранится информация, накопленная за долгий период) во время сна.
👩🎓 По задумке итальянских исследователей ИИ-модели обучаются на датасетах в фазе бодрствования, а во время запрограммированной фазы сна модель анализирует информацию, усвоенную за день.
🧠 В качестве примера авторы метода приводят обучение модели на датасете с морскими обитателями. ИИ изучает такой датасет, когда бодрствует, а в момент сна ему вновь показывают эти изображения, но уже вперемешку с другими животными. Это сделано для того, чтобы модель, выучив новую информацию, не забыла старую.
😌 Метод итальянцев также включает в себя не только фазу сна, но и сновидений, когда ИИ может генерировать новую информацию на основе полученной ранее. Утверждается, что это поможет ИИ лучше усваивать информацию в будущем. В итоге, получая все новую и новую информацию, модель сможет генерировать более сложные решения для задач пользователя.
📈 Проанализировав работу ИИ после использования нового метода, исследователи пришли к выводу, что он стал на 2%-12% точнее определять содержание изображения и лучше запоминать информацию.
✖️ Критики метода считают, что не стоит при работе с ИИ во всем пытаться имитировать работу человеческого мозга, а лучше сосредоточиться на поиске новых решений.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4
InstructIR загрузить неудавшееся фото и естественным языком объяснить нейросети, что нужно исправить.
🌃 Например, модели можно сообщить, что фото слишком темное и на нем невозможно ничего разобрать, и InstructIR поймет, что от него требуется.
🖍 Также промптом можно убрать с фотографии шум, размытие, засвеченные участки и т.д.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤔2
Из TikTok уходит музыка, за ИИ-стендап умершего комика подали в суд, чип Neuralink вживили в мозг — и другие важные новости за неделю
✅ На производителя подкастов Dudesy подали в суд за публикацию сгенерированного ИИ стендап-выступления комика Джорджа Карлина, умершего в 2008 году. Наследники Карлина недовольны, что его голос использовали для создания часового аудио. После иска авторы признали, что текст для выступления был написан людьми, а ИИ только синтезировал голос. Наследники отказываться от судебного преследования пока не собираются
✅ В начале недели X/Twitter полностью отключал возможность поиска информации о Тейлор Свифт в соцсети. Всё из-за появления ИИ-порно с использованием дипфейков певицы, которое собрало миллионы просмотров (изначально фейки появились в Telegram). Скандал оказался настолько громким, что его пришлось комментировать даже Белому дому. Вполне возможно кейс Свифт станет поводом, чтобы распространение подобного, кхм, контента, стало уголовно наказуемым;
✅ На этой неделе Universal Music объявил, что уберет каталог своей музыки из TikTok, так как не смог договориться с ее владельцами об условиях дальнейшего использования контента. Это значит, что миллионы видео в соцсети, в которых раньше звучали треки Тейлор Свифт или Билли Айлиш, остались без саундтрека. Мейджор утверждает, что представители TikTok фактические вынуждали заключить невыгодный договор и отказывались обсуждать правила использования ИИ-музыки на платформе;
✅ Нейрочип Neuralink впервые вживили в мозг человеку, сообщил гендиректор стартапа Илон Маск. По словам Маска, операция прошла успешно, пациент восстанавливается, а сам чип работает корректно. Других подробностей пока нет;
✅ Китай разрешил работу на территории страны 40 ИИ-моделям, из которых 14 — это LLM. В августе прошлого года власти страны обязали компании получать специальное разрешение на запуск ИИ-моделей для широкой публики;
✅ Власти США обсуждают возможность запретить иностранным компаниями использовать облачную инфраструктуру Штатов для обучения ИИ. В первую очередь речь, конечно, о Китае, куда США уже запретили экспорт передовых чипов;
✅И еще про TikTok. Соцсеть тестирует функцию автоматического распознавания товаров в видео. Если распознавание прошло успешно, то соцсеть подкинет пользователю ссылку, по которой такой товар или похожий на него можно будет приобрести через маркетплейс TikTok Shop;
✅ На новых смартфонах Galaxy S24, которые поступят в продажу в Китае, будет установлена ИИ-модель Ernie от Baidu, а не гугловская Gemini как на тех, что будут продаваться в Европе и США. Вероятно, это сделано, чтобы избежать проблем с китайскими властями, которые в индивидуальном порядке выдают разрешение на использование ИИ-моделей (см. новость выше).
✅ На производителя подкастов Dudesy подали в суд за публикацию сгенерированного ИИ стендап-выступления комика Джорджа Карлина, умершего в 2008 году. Наследники Карлина недовольны, что его голос использовали для создания часового аудио. После иска авторы признали, что текст для выступления был написан людьми, а ИИ только синтезировал голос. Наследники отказываться от судебного преследования пока не собираются
✅ В начале недели X/Twitter полностью отключал возможность поиска информации о Тейлор Свифт в соцсети. Всё из-за появления ИИ-порно с использованием дипфейков певицы, которое собрало миллионы просмотров (изначально фейки появились в Telegram). Скандал оказался настолько громким, что его пришлось комментировать даже Белому дому. Вполне возможно кейс Свифт станет поводом, чтобы распространение подобного, кхм, контента, стало уголовно наказуемым;
✅ На этой неделе Universal Music объявил, что уберет каталог своей музыки из TikTok, так как не смог договориться с ее владельцами об условиях дальнейшего использования контента. Это значит, что миллионы видео в соцсети, в которых раньше звучали треки Тейлор Свифт или Билли Айлиш, остались без саундтрека. Мейджор утверждает, что представители TikTok фактические вынуждали заключить невыгодный договор и отказывались обсуждать правила использования ИИ-музыки на платформе;
✅ Нейрочип Neuralink впервые вживили в мозг человеку, сообщил гендиректор стартапа Илон Маск. По словам Маска, операция прошла успешно, пациент восстанавливается, а сам чип работает корректно. Других подробностей пока нет;
✅ Китай разрешил работу на территории страны 40 ИИ-моделям, из которых 14 — это LLM. В августе прошлого года власти страны обязали компании получать специальное разрешение на запуск ИИ-моделей для широкой публики;
✅ Власти США обсуждают возможность запретить иностранным компаниями использовать облачную инфраструктуру Штатов для обучения ИИ. В первую очередь речь, конечно, о Китае, куда США уже запретили экспорт передовых чипов;
✅И еще про TikTok. Соцсеть тестирует функцию автоматического распознавания товаров в видео. Если распознавание прошло успешно, то соцсеть подкинет пользователю ссылку, по которой такой товар или похожий на него можно будет приобрести через маркетплейс TikTok Shop;
✅ На новых смартфонах Galaxy S24, которые поступят в продажу в Китае, будет установлена ИИ-модель Ernie от Baidu, а не гугловская Gemini как на тех, что будут продаваться в Европе и США. Вероятно, это сделано, чтобы избежать проблем с китайскими властями, которые в индивидуальном порядке выдают разрешение на использование ИИ-моделей (см. новость выше).
👍7❤2
Люди предпочли нейросетевой копирайтинг человеческому
📝 Сервис Semrush опросил 700 потребителей из США в возрасте 25–55+ (50,2% — мужчины, 49,5% — женщины), предложив им в нескольких тестах выбрать вариант копирайта, который им нравится больше.
❓ В каждом тесте (всего их было шесть) было два рекламных текста, один из которых написал человек, а другой — ИИ. Естественно, респонденты не знали, кто какой текст написал.
✔️ Тексты были в форматах поста в соцсеть, текста для блога, рекламы для соцсети, описания продукта и т. д.
📊 По итогу во всех тестах от 54% до 70% респондентов предпочли вариант, сгенерированный ИИ.
💬 Опрошенные предпочли вариант ИИ, так как он понятнее доносил информацию.
❗️ Авторы исследования предупреждают, что результаты теста не означают, что в «полевых» условиях текст ИИ сработал бы эффективнее, чем текст, написанный человеком.
❗️ Авторы исследования предупреждают, что результаты теста не означают, что в «полевых» условиях текст ИИ сработал бы эффективнее, чем текст, написанный человеком.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🕘 Google показал нейросеть с возможностью изменения генерации в реальном времени
🏃♀️ MobileDiffusion вносит изменения в генерацию практически синхронно с изменением промпта. Для ускоренной генерации авторы использовали модель DiffusionGAN, которая позволяет создавать изображение в один шаг.
📱 Mobile в названии появилось не случайно: нейросеть специально заточена под работу на мобильных устройствах.
⚡️ На генерацию в разрешении 512*512 у модели на топовых iOS- и Android-девайсах уходит полсекунды.
💀 Компромиссом в погоне за скоростью стало качество генераций: модель на небольшие по сегодняшним меркам 520 млн параметров, так что ждать от нее картинок уровня Midjourney не стоит.
🔮 Разработчики не выпустили ни демо, ни код модели, чтобы ее можно было потестировать самому. Можно предположить, что в том или ином виде наработки MobileDiffusion будут использованы в грядущих мобильных устройствах компании.
Нейросети Google уже работают (локально и через облако) на последних смартфонах компании, а также в новых моделях телефонов Samsung.
🏃♀️ MobileDiffusion вносит изменения в генерацию практически синхронно с изменением промпта. Для ускоренной генерации авторы использовали модель DiffusionGAN, которая позволяет создавать изображение в один шаг.
📱 Mobile в названии появилось не случайно: нейросеть специально заточена под работу на мобильных устройствах.
🔮 Разработчики не выпустили ни демо, ни код модели, чтобы ее можно было потестировать самому. Можно предположить, что в том или ином виде наработки MobileDiffusion будут использованы в грядущих мобильных устройствах компании.
Нейросети Google уже работают (локально и через облако) на последних смартфонах компании, а также в новых моделях телефонов Samsung.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤔1
🛑 Компаниям больше не нужны специалисты по метаверсу
🔄 Как пишет Bloomberg, компании, которые еще год–два назад массово нанимали людей на должности вроде генеральный директор по метавселенным, теперь меняют их на экспертов по генеративному ИИ.
За последнее время люди, которые возглавляли метаверс-направления, ушли из Walt Disney и Procter & Gamble.
💵 Сильно переживать за них не стоит — выплаты по сокращению у таких специалистов могут достигать миллиона долларов.
🥤 Если повезет, то отвечавшего за метавселенные не уволят, а назначат главой направления генеративного ИИ. Так произошло, например, с Пратиком Тхакаром из Coca-Cola, который остался в компании, но теперь отвечает за нейросети.
💬 Тому, что метавселенные — это уже «не круто», есть и другие косвенные подтверждения. Например, в последнем квартале 2023 года на созвонах с инвесторами компаний, которые входят в список S&P 500, слово «метавселенные» произносилось лишь дважды.
Для сравнения, в I квартале 2022 года метавселенные упоминали на звонках 63 раза.
🔄 Как пишет Bloomberg, компании, которые еще год–два назад массово нанимали людей на должности вроде генеральный директор по метавселенным, теперь меняют их на экспертов по генеративному ИИ.
За последнее время люди, которые возглавляли метаверс-направления, ушли из Walt Disney и Procter & Gamble.
🥤 Если повезет, то отвечавшего за метавселенные не уволят, а назначат главой направления генеративного ИИ. Так произошло, например, с Пратиком Тхакаром из Coca-Cola, который остался в компании, но теперь отвечает за нейросети.
Для сравнения, в I квартале 2022 года метавселенные упоминали на звонках 63 раза.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🤔4👍2