D. Lab – Telegram

D. Lab

1.1K subscribers

503 photos

499 videos

1 file

900 links

Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.

Download Telegram

About

Blog

Apps

Platform

1.1K subscribers

This media is not supported in your browser

VIEW IN TELEGRAM

▶️ Lumiere — новая модель для генерации видео от Google

Мультимодальная нейросеть может сгенерировать видео по промпту, а на основе загруженного изображения создать стилизованный клип, анимировать отдельную часть изображения, отредактировать видео и т. д.

🕝 Ключевое отличие Lumiere от десятков похожих моделей — лежащая в основе нейросети диффузионная модель Space-Time-U-Net (STUnet).

🎞 STUnet позволяет генерировать клипы не по ключевым кадрам, а сразу все видео полностью (оно ограничено пятью секундами). То есть нейросеть сразу понимает, где в пространстве находится генерируемый объект (или объекты) и как меняется его местоположение на протяжении видео.

👍На выходе это означает более качественную и плавную генерацию с меньшим количеством глюков.

⚖️ Журналист Verge сравнил Lumiere и Gen-2, использовав один и тот же промпт: щенок, сгенерированный Gen-2, выглядит более четким, но при этом практически не двигается; генерация Lumiere, возможно, проигрывает визуально, но при этом гораздо более живая.

🤔 Тут стоит оговориться, что самому попробовать Lumiere нельзя, поэтому сравнивать можно только с теми клипами, которые выбрали и опубликовали разработчики модели.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🤔1

579 views15:10

🧠

ИИ-стартап хочет запускать ИИ на любых мобильных девайсах с помощью инновационных чипов

Чипы, которые разрабатывает немецкая компания Semron, позволяют, как утверждается, запускать локально ИИ-модели на любых мобильных устройствах — даже на наушниках.

⚡️ Такая производительность достигается за счет принципиально новой архитектуры: чипы Semron производят вычисления, используя электрическое поле, а не электрический ток, как это происходит обычно.

Кроме того, инновационный чип использует не транзисторы, а так называемые мемконденсаторы — конденсаторы с памятью (с мемами, к сожалению, название никак не связано) 😂.

🌡 Эти конденсаторы, работая в связке с электрическим полем, помогают «управлять» работой ИИ-модели, позволяя сократить энергозатраты и снизить тепловыделение.

⬆️ Со слов разработчиков, такое решение позволяет повысить вычислительную мощность до 20 раз, а также снизить стоимость производства.

👊 Понятно, что на фоне перманентного дефицита чипов в мире такие стартапы, как Semron быстро привлекают внимание инвесторов. Semron не одни играют на этом поле, а некоторые их конкуренты-стартапы даже используют похожие технологии.

💵 Тем не менее компания недавно получила почти $8 млн на дальнейшее развитие проекта, который сегодня находится на раннем, предпродуктовом этапе.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤1

590 views15:50

This media is not supported in your browser

VIEW IN TELEGRAM

🍏

Технологический прорыв, которым неудобно пользоваться: главное из обзоров на Vision Pro

В профильных СМИ появились обзоры AR-хедсета Vision Pro от Apple — первого нового продукта компании почти за 10 лет. Собрали главные плюсы и минусы устройства.

Плюсы:

➕ Vision Pro — это технологический прорыв. Дисплей устройства — лучшее, что есть на рынке для таких девайсов. Passthrough (возможность видеть окружающее пространство через камеру хедсета) реализован лучше, чем у конкурентов

➕ Просмотр фильмов на хедсете — отдельное удовольствие: картинка четкая, возможность выбрать виртуальную обстановку для киносеанса впечатляет, звук хорош. 3D реализовано отлично, но с непривычки может укачать

➕ Vision Pro отлично интегрирован в экосистему Apple, взаимодействие с другими устройствами компании практически идеально

➕ Навигация по интерфейсу взглядом поначалу впечатляет, возможность открыть несколько окон с приложениями и разместить их по всей квартире — тоже

➕ Потенциал устройства для реализации в следующих версиях Vision Pro — огромен

Минусы:

➖ Устройство по-настоящему тяжелое — носить его дольше часа проблематично. Vision Pro мало приспособлен для использования в движении или на улице

➖ Дорого

➖ От одного заряда аккумулятора устройство проработает не больше двух с половиной часов. Аккумулятор не встроен в устройство, а всегда болтается на проводе, подключенном к хедсету

➖ Взаимодействие с интерфейсом с помощью взгляда очень удобно. Но не всегда. Чтобы система работала, пользователю нужно все время держать взгляд на предмете, который он хочет использовать. Представьте, если вам нужно было бы все время смотреть на мышку или клавиатуру, чтобы управлять компьютером

➖ Виртуальный аватар пользователя (Persona), который создает устройство, будет сниться вам в кошмарах

➖ Если вы носите очки, то придется дополнительно заказывать линзы за $99 (или использовать одноразовые)

➖ Учитывая все эти недостатки и высокую стоимость, не до конца ясно, для чего собственно нужен Vision Pro. Пока это скорее нишевый продукт

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🤔3

538 views07:55

🤑

Крошечный остров зарабатывает миллионы долларов в месяц на популярности ИИ

🌐 Ангилья, где проживает чуть больше 15 тыс. человек, неожиданно для себя столкнулся с наплывом компаний, которые хотят зарегистрировать свой сайт в доменной зоне островного государства.

🧠 Все потому, что домен Ангильи, который остров получил еще в 1980-х годах, — .ai.

По словам Винса Кейта, который помогает правительству Ангильи в регистрации доменных имен, благодаря буму генеративного ИИ остров зарабатывает около $3 млн в месяц. На данный момент это приблизительно треть бюджета Ангильи 👛.

📈 Спрос на .ai вырос через пять месяцев после запуска ChatGPT в ноябре 2022 года. Тогда продажи доменных имен подскочили в 4 раза, рассказывает Кейт, и с тех пор только росли.

🇦🇮 Остров Ангилья находится в Карибском море и является автономной британской заморской территорией.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5😁3🤯3❤2

572 viewsedited 15:10

💤

ИИ лучше запоминает информацию, имитируя сон

💾 Исследователи из Катанийского университета в Италии придумали новый метод обучения ИИ-моделей, аналогичный тому, как мозг человека запоминает новую информацию.

🎒 Человек "переносит" информацию из кратковременной памяти (где хранится информация, полученная в течение дня) в долговременную (где хранится информация, накопленная за долгий период) во время сна.

👩‍🎓 По задумке итальянских исследователей ИИ-модели обучаются на датасетах в фазе бодрствования, а во время запрограммированной фазы сна модель анализирует информацию, усвоенную за день.

🧠 В качестве примера авторы метода приводят обучение модели на датасете с морскими обитателями. ИИ изучает такой датасет, когда бодрствует, а в момент сна ему вновь показывают эти изображения, но уже вперемешку с другими животными. Это сделано для того, чтобы модель, выучив новую информацию, не забыла старую.

😌 Метод итальянцев также включает в себя не только фазу сна, но и сновидений, когда ИИ может генерировать новую информацию на основе полученной ранее. Утверждается, что это поможет ИИ лучше усваивать информацию в будущем. В итоге, получая все новую и новую информацию, модель сможет генерировать более сложные решения для задач пользователя.

📈 Проанализировав работу ИИ после использования нового метода, исследователи пришли к выводу, что он стал на 2%-12% точнее определять содержание изображения и лучше запоминать информацию.

✖️ Критики метода считают, что не стоит при работе с ИИ во всем пытаться имитировать работу человеческого мозга, а лучше сосредоточиться на поиске новых решений.

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔4

583 views13:45

📷

Нейросеть для восстановления неудачных фото по промпту

InstructIR загрузить неудавшееся фото и естественным языком объяснить нейросети, что нужно исправить.

🌃 Например, модели можно сообщить, что фото слишком темное и на нем невозможно ничего разобрать, и InstructIR поймет, что от него требуется.

🖍 Также промптом можно убрать с фотографии шум, размытие, засвеченные участки и т.д.

🫡 Все это не на словах — потестировать нейросеть можно здесь.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3🤔2

621 views15:05

Из TikTok уходит музыка, за ИИ-стендап умершего комика подали в суд, чип Neuralink вживили в мозг — и другие важные новости за неделю

✅ На производителя подкастов Dudesy подали в суд за публикацию сгенерированного ИИ стендап-выступления комика Джорджа Карлина, умершего в 2008 году. Наследники Карлина недовольны, что его голос использовали для создания часового аудио. После иска авторы признали, что текст для выступления был написан людьми, а ИИ только синтезировал голос. Наследники отказываться от судебного преследования пока не собираются

✅ В начале недели X/Twitter полностью отключал возможность поиска информации о Тейлор Свифт в соцсети. Всё из-за появления ИИ-порно с использованием дипфейков певицы, которое собрало миллионы просмотров (изначально фейки появились в Telegram). Скандал оказался настолько громким, что его пришлось комментировать даже Белому дому. Вполне возможно кейс Свифт станет поводом, чтобы распространение подобного, кхм, контента, стало уголовно наказуемым;

✅ На этой неделе Universal Music объявил, что уберет каталог своей музыки из TikTok, так как не смог договориться с ее владельцами об условиях дальнейшего использования контента. Это значит, что миллионы видео в соцсети, в которых раньше звучали треки Тейлор Свифт или Билли Айлиш, остались без саундтрека. Мейджор утверждает, что представители TikTok фактические вынуждали заключить невыгодный договор и отказывались обсуждать правила использования ИИ-музыки на платформе;

✅ Нейрочип Neuralink впервые вживили в мозг человеку, сообщил гендиректор стартапа Илон Маск. По словам Маска, операция прошла успешно, пациент восстанавливается, а сам чип работает корректно. Других подробностей пока нет;

✅ Китай разрешил работу на территории страны 40 ИИ-моделям, из которых 14 — это LLM. В августе прошлого года власти страны обязали компании получать специальное разрешение на запуск ИИ-моделей для широкой публики;

✅ Власти США обсуждают возможность запретить иностранным компаниями использовать облачную инфраструктуру Штатов для обучения ИИ. В первую очередь речь, конечно, о Китае, куда США уже запретили экспорт передовых чипов;

✅И еще про TikTok. Соцсеть тестирует функцию автоматического распознавания товаров в видео. Если распознавание прошло успешно, то соцсеть подкинет пользователю ссылку, по которой такой товар или похожий на него можно будет приобрести через маркетплейс TikTok Shop;

✅ На новых смартфонах Galaxy S24, которые поступят в продажу в Китае, будет установлена ИИ-модель Ernie от Baidu, а не гугловская Gemini как на тех, что будут продаваться в Европе и США. Вероятно, это сделано, чтобы избежать проблем с китайскими властями, которые в индивидуальном порядке выдают разрешение на использование ИИ-моделей (см. новость выше).

👍7❤2

603 views09:01

Люди предпочли нейросетевой копирайтинг человеческому

📝 Сервис Semrush опросил 700 потребителей из США в возрасте 25–55+ (50,2% — мужчины, 49,5% — женщины), предложив им в нескольких тестах выбрать вариант копирайта, который им нравится больше.

❓ В каждом тесте (всего их было шесть) было два рекламных текста, один из которых написал человек, а другой — ИИ. Естественно, респонденты не знали, кто какой текст написал.

✔️ Тексты были в форматах поста в соцсеть, текста для блога, рекламы для соцсети, описания продукта и т. д.

📊 По итогу во всех тестах от 54% до 70% респондентов предпочли вариант, сгенерированный ИИ.

💬 Опрошенные предпочли вариант ИИ, так как он понятнее доносил информацию.

❗️ Авторы исследования предупреждают, что результаты теста не означают, что в «полевых» условиях текст ИИ сработал бы эффективнее, чем текст, написанный человеком.

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔2

708 views13:45

This media is not supported in your browser

VIEW IN TELEGRAM

🕘 Google показал нейросеть с возможностью изменения генерации в реальном времени

🏃‍♀️ MobileDiffusion вносит изменения в генерацию практически синхронно с изменением промпта. Для ускоренной генерации авторы использовали модель DiffusionGAN, которая позволяет создавать изображение в один шаг.

📱 Mobile в названии появилось не случайно: нейросеть специально заточена под работу на мобильных устройствах.

⚡️ На генерацию в разрешении 512*512 у модели на топовых iOS- и Android-девайсах уходит полсекунды.

💀 Компромиссом в погоне за скоростью стало качество генераций: модель на небольшие по сегодняшним меркам 520 млн параметров, так что ждать от нее картинок уровня Midjourney не стоит.

🔮 Разработчики не выпустили ни демо, ни код модели, чтобы ее можно было потестировать самому. Можно предположить, что в том или ином виде наработки MobileDiffusion будут использованы в грядущих мобильных устройствах компании.

Нейросети Google уже работают (локально и через облако) на последних смартфонах компании, а также в новых моделях телефонов Samsung.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2🤔1

559 views11:20

🛑 Компаниям больше не нужны специалисты по метаверсу

🔄 Как пишет Bloomberg, компании, которые еще год–два назад массово нанимали людей на должности вроде генеральный директор по метавселенным, теперь меняют их на экспертов по генеративному ИИ.

За последнее время люди, которые возглавляли метаверс-направления, ушли из Walt Disney и Procter & Gamble.

💵 Сильно переживать за них не стоит — выплаты по сокращению у таких специалистов могут достигать миллиона долларов.

🥤 Если повезет, то отвечавшего за метавселенные не уволят, а назначат главой направления генеративного ИИ. Так произошло, например, с Пратиком Тхакаром из Coca-Cola, который остался в компании, но теперь отвечает за нейросети.

💬 Тому, что метавселенные — это уже «не круто», есть и другие косвенные подтверждения. Например, в последнем квартале 2023 года на созвонах с инвесторами компаний, которые входят в список S&P 500, слово «метавселенные» произносилось лишь дважды.

Для сравнения, в I квартале 2022 года метавселенные упоминали на звонках 63 раза.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6🤔4👍2

558 views07:45

This media is not supported in your browser

VIEW IN TELEGRAM

🏉 Coca-Cola использовала нейросеть в рекламе для Супербоула

Рекламу напитка BodyArmor покажут 11 февраля во время главного матча в американском футболе, но клип можно посмотреть уже сейчас.

🥒 Основной посыл ролика Field of Fake: натуральное всегда лучше ненатурального, поэтому в BodyArmor используются только натуральные ингредиенты.

⚙️ Все искусственное в ролике символизирует часть, созданная нейросетью. Генерация выполнена в лучших традициях адских видео ModelScope, о которых все позабыли после выхода «реалистичной» Gen-2. Закадровый голос в синтетической части рекламы, кстати, тоже создан нейросетью.

🤫 Агентство Full Contact Advertising, которое работало над клипом вместе с BodyArmor, не раскрывает, какую нейросеть использовало.

💵 Coca-Cola купила бренд BodyArmor в 2021 году за $5,6 млрд.

Компания уже использовала нейросети в рекламе, в частности, для создания «художественных» QR-кодов.

О том, как корпорации с помощью ИИ экономят на рекламе сотни тысяч долларов — мы рассказывали тут.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

622 views14:55

🍏

Независимые лейблы обвинили Apple в попытке обворовать их за счет пространственного аудио

Мы уже писали о том, как Apple хочет, чтобы как можно больше музыки в Apple Music было доступно в формате пространственного аудио.

💵 Компания даже готова платить больше денег за то, чтобы треки выходили в этом формате — даже если их никто не будет слушать. При этом компания не собирается выделять на инициативу дополнительные средства. Бонусы за пространственное аудио будут выплачиваться из того же пула денег, что и обычно.

🤔 Независимые лейблы, разобравшись в ситуации, остались недовольны инициативой Apple. Оказывается, запись трека в формате Dolby Atmos (это и есть пространственное аудио) стоит в среднем на $1 тыс. дороже, чем запись в обычном формате.

🎙 Среднестатистический альбом состоит из 10–15 треков, а значит, его выпуск в новом формате будет стоить независимому лейблу на $10–15 тыс. дороже. Запись старого альбома в новом формате может стоить еще дороже. Скажем, лейблу с бэк-каталогом в три тыс. альбомов их перезапись может обойти в $30 млн.

То есть инди-лейблу, вероятно, даже нет смысла пытаться получить от Apple повышенные роялти, так как они не отобьют стоимость записи.

😈 Зато на Dolby Atmos, считают независимые лейблы, может хорошо заработать мейджор, у которого в каталоге есть, допустим, Тейлор Свифт. Потратив $10 тыс. на альбом, который в пространственном аудио могут послушать миллионы фанатов певицы, и без того богатый лейбл станет еще богаче. При этом богаче он станет за счет денег, которые не получат те, кто не смог позволить себе запись в Dolby Atmos.

❗️ Инди-лейблы хотят договориться с Apple, но если переговоры провалятся, то они готовы идти в суд.

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔4😁2

571 views15:05

🕵️‍♀️ OpenAI разрабатывает ИИ-агентов

🕹 Такие агенты смогут выполнять сложные задания без участия пользователя — по сути, брать на себя управление устройством после получения задачи.

OpenAI уже больше года разрабатывает два типа агентов.

1️⃣ В качестве примера задач, которые будут решать агенты первого типа, The Information приводит перенос данных из документа в таблицу для анализа и автоматическое заполнение отчета о расходах с последующим переносом в бухгалтерское ПО.

2️⃣ Агенты второго типа будут выполнять менее узкие задачи вроде бронирования авиабилетов, отелей, планирования бюджета поездки и т. д.

🧠 Внутри OpenAI ИИ-агентов называют «суперумными персональными помощниками».

💵 Крупные игроки (над своими агентами также работают Meta* и Google) постепенно заходят в нишу, которую раньше обозначили сервисы вроде AutoGPT (мы подробно рассказывали о них).

💪 Создатели AutoGPT ставили перед собой амбициозную цель превратить помощника в AGI — сильный искусственный интеллект. В OpenAI тоже в последнее время часто говорят про AGI.

❗️ Ключевое опасение в связи с ИИ-агентами — безопасность: программа получает доступ к устройству пользователя и существует опасность, что таким же образом к девайсу могут подключиться и мошенники. Сейчас у OpenAI нет конкретного решения этой проблемы.

*Организация, запрещенная на территории РФ

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2🤔2

745 views14:15

OpenAI отказали в названии GPT, Huawei выпустит меньше смартфонов из-за ИИ, Midjourney схантили инженера Apple — и другие важные новости за неделю

✅ OpenAI выпустил приложение ChatGPT для хедсета Vision Pro. Внутри приложения — передовая модель GPT-4 Turbo и возможность не только общаться с чат-ботом, но и генерировать изображения. То есть, каких-то принципиальных отличий от обычных версий пока нет;

✅ На этой неделе также стало известно, что OpenAI отказали в регистрации торговой марки GPT. Ведомство по патентам и товарным знакам США (USPTO) пришло к выводу, что GPT — это общее название инструментов, подобных языковой модели, которое не может быть закреплено за одной компанией. OpenAI может подать апелляцию на решение USPTO;

✅ Спрос на ИИ-чипы заставил Huawei направить все мощности на их изготовление в ущерб своим же топовым смартфонам: ИИ-чипы и чипы для телефонов Mate 60 производятся на одних и тех же предприятиях. После запрета со стороны США на экспорт передовых чиповы в КНР, в стране резко вырос спрос на местную продукцию. В то же время китайским компаниям тяжело этот спрос обеспечить;

✅ Microsoft заплатит изданию Semafor за использование своего ИИ в работе редакции. Semafor будет использовать ИИ Microsoft для написания новостей. На сайте издания появится отдельный фид Signals, куда будут публиковаться тексты, написанные с помощью ИИ. Речь не идет о текстах, полностью созданных нейросетью — редакторы сайта будут использовать модели, например, для быстрого перевода новости с неанглоязычного источника. Сколько именно Microsoft заплатит за тест, не уточняется;

✅ В Roblox появится перевод в реальном времени на 16 языков. Функция будет реализована в пользовательских чатах на платформе с помощью кастомной LLM. Это значит, что пользователь, скажем, из Кореи в переписке с пользователем из Германии будет получать сообщения сразу на родном языке — и наоборот;

✅ В Midjourney позвали инженера, который работал над Vision Pro, а также в Neuralink Илона Маска. Ахмад Аббас присоединился к стартапу в роли главы Hardware-подразделения. Вероятно, Аббас будет работать в компании над проектом под кодовым названием Orb. Что такое Orb — отдельное устройство или новая стратегия развития компании — пока неясно;

✅ Meta* всерьез взялась за маркировку генеративного контента в принадлежащих компании соцсетях. Если раньше вотермарки ставили только на контент, произведенный нейросетями Meta, то вскоре это коснется генераций и других моделей. Компания также обещает наказывать пользователей, которые будут пытаться скрыть нейроконтент, выдавая его за настоящий;

✅ В продолжение темы маркировки генеративного контента: вотермарки стандарта C2PA появятся в Dall-E 3. Маркировать контент будут через метаданные и с помощью символа, который будет видно на сгенерированном изображении. Разработчики из OpenAI признают, что такая маркировка — не идеальный вариант (ее достаточно легко удалить), но считают ее важным шагом в регулировании генеративного контента;

✅ Disney станет миноритарным акционером Epic Games, инвестировав в компанию $1,5 млрд. Disney и Epic работают над общей «развлекательной вселенной», которая объединит IP обеих компаний. Как именно будет выглядеть вселенная, пока не уточняется. Некоторые уже назвали проект Disney и Epic — корпоративной метавселенной.

*Организация, запрещенная на территории РФ

👍2🤔1

575 views09:00

📈

Популярность «замены лиц» у хакеров подскочила на 700%

📆 Следует из отчета британской биометрической компании iProov. Рост составил 704% во второй половине 2023 года по сравнению с первой половиной года.

Выросло и количество хакерских групп, которые занимаются атаками с помощью дипфейков — их стало больше на 47%.

👥 Аналитики компании ожидаемо связывают рост популярности фейссвапов с все большей доступностью самых разных ИИ-инструментов.

🏪 При этом распознать подобные дипфейки, если они качественно выполнены, все еще довольно сложно. В iProov отмечают, что мошенники чаще всего пользуются сервисами SwapFace и DeepFaceLive.

💵 Отчет iProov появился в одно время с историей о сотруднике финансовой фирмы в Гонконге, который перевел $25,6 млн мошенникам, поговорив с их дипфейками. Мошенники выдали себя за коллег служащего.

📹 Жертву насторожил имейл о необходимости крупной транзакции, но видеосозвон развеял все сомнения.

🚨 Полиция Гонконга задержала 6 человек в связи с преступлением.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2😁2🤯2

537 views14:45

🙂

Disney будет продавать контекстную рекламу с учетом настроения зрителя

#️⃣ Сервис Disney’s Magic Words с помощью ИИ анализирует каталог компании, чтобы расставить контекстные теги для каждой сцены в мультике/фильме/передаче.

🚰 На основе этих тегов бренды смогут покупать рекламное время именно в том моменте, который наиболее подходит их продукту. К примеру, персонажу очень хочется пить и в этот момент зритель увидит контекстную рекламу минералки.

💊 При этом теги проставлены не только для вещей и брендов, которые появляются в кадре, но и для общего настроения конкретной сцены или даже эмоции. Условно говоря, на сцене, когда у Бемби убивают маму, вам могут предложить антидепрессанты.

🔩 Продвинутую рекламу увидят пользователи стриминг-сервисов Disney+ и Hulu. Сейчас Disney’s Magic Words находится на этапе тестирования.

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔3👍2👎1

540 views13:45

Media is too big

VIEW IN TELEGRAM

Цукербергу не понравился Vision Pro

👎

Глава Meta* опубликовал у себя в Instagram** видео, в котором рассказал о своих впечатлениях от нового устройства Apple.

По словам Цукерберга, с удивлением для себя он обнаружил, что хедсет Quest, который разрабатывает его компания, лучше того, что выпустила компания Тима Кука 😱.

😌 Цукерберг скромно говорит, что до тестирования думал, что Quest обойдет Vision Pro только в категории «цена-качество» (Quest 3 стоит $500, Vision Pro — от $3 500).

📊 Но по результатам теста стало очевидно, что Quest лучше Vision Pro во всем, для чего люди в принципе используют такие устройства, говорит Цукерберг в видео.

☝️ Quest удобнее — не такой тяжелый, из него не торчат провода, у него ярче экран и больше обзор, перечисляет Цукерберг. Управление взглядом? Прикольно, но не всегда удобно, кроме того, и в Quest он вернется в следующих версиях (Eyetracking был в про-версии хедсета)!

Ради дисплея Vision Pro, который все так хвалят, Apple пришлось пойти на слишком много компромиссов, уверен он.

💪 В конце Цук обещает, что будущее за открытыми системами, как Quest, а не закрытыми — как Apple.

🤔 От себя добавим: выглядит немного странно, что Цукербергу самому приходится так хвалить свой продукт и критиковать чужой.

*Организация, запрещенная на территории РФ
**Instagram входит в Meta — организацию, запрещенную на территории РФ

Please open Telegram to view this post

VIEW IN TELEGRAM

😁5❤2

619 viewsedited 15:25

🆕

Stability AI представил новый тип нейросети

🌭 Stable Cascade использует принципиально новую архитектуру Würstchen. Würstchen (то есть «сосиска» в переводе с немецкого) отличается высокой скоростью генераций при меньшей требовательности к ресурсам.

☝️ Ключевое отличие Cascade от Diffusion в том, что новая нейросеть использует не одну большую модель, а три небольших (каждая из которых построена на Würstchen).

⏳ За счет распределения задач между несколькими моделями и достигается увеличение скорости работы без потери качества генерации.

📝 Cascade, как утверждают разработчики, также более точно следует пользовательским промптам и (наконец-то!) может генерировать текст внутри изображений. С последним, правда, модель справляется не идеально.

Модель доступна на GitHub, но с запретом на коммерческое использование.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥3🤔2

548 views13:55

This media is not supported in your browser

VIEW IN TELEGRAM

😛

Опенсорсная LLM с поддержкой рекордного количества языков

🌐 Модель Aya — это результат работы стартапа Cohere (подробнее о нем здесь) и трех тыс. независимых исследователей из 119 стран.

Ключевое отличие Aya от конкурентов — поддержка 101 языка, что в два раза больше, чем у конкурирующих языковых моделей с открытым кодом. Десятки языков и диалектов доступны только в модели Cohere.

💬 Для сравнения, всего в мире на данный момент используется семь тыс. языков, при этом больше половины населения Земли использует всего 23 языка.

📝 Стартап выложил в открытый доступ не только саму модель, но и датасет, на котором ее обучали. Вместе с датасетом идут полезные комментарии от носителей языков, которые участвовали в создании модели.

📊 Разработчики говорят, что в бенчмарках Aya обходит всех ключевых конкурентов, в том числе Bloom.

Летом прошлого года Cohere привлек $270 млн от инвесторов, включая Nvidia. Оценочная стоимость компании достигла $1,2 млрд.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🥰4🔥1

591 views15:55

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

😱

OpenAI показал Sora — модель для генерации фотореалистичных видео

🔩

Sora способна генерировать видео длиной до минуты, следуя сложным пользовательским промптам на всем протяжении клипа. Модель также может анимировать статичный кадр и «расширить» исходное видео.

☝️ Диффузионная модель создает сцены с несколькими персонажами, сложными паттернами движений; может сгенерировать несколько кадров в одном видео, которые будут выдержаны в едином стиле; передать эмоции персонажей, прописанные в промпте.

☁️ OpenAI говорят, что Sora («небо» в переводе с японского) не просто следует промпту, но и понимает, какое место генерируемые объекты занимают в «физическом» мире. Что-то подобное мы слышали в недавнем анонсе Runway.

🧨 Те примеры генераций, которыми поделились разработчики, действительно выглядят потрясающе — тот же Gen-2 ничем подобным похвастаться не может. Длятся они, правда, не по минуте, а около 10–15 секунд.

🛑 Другое дело, что обычным пользователям модель недоступна и оценить ее реальные возможности не получится. OpenAI открыл Sora только для избранных разработчиков, художников, дизайнеров и киноделов. Все остальные в ближайшее время доступа к модели не получат. Все из-за опасений, что модель может быть использована для распространения фотореалистичных фейков.

😐 Среди слабых мест текущей версии модели разработчики называют передачу физических свойств объектов и причинно-следственные связи внутри сцены (например: откушенное человеком печенье останется целым). Также Sora может перепутать левую сторону с правой и допустить ошибки при генерации событий, которые происходят в течение какого-то отрезка времени (скажем, поведение камеры на протяжении видео).

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4👍3

741 views07:35