D. Lab – Telegram

D. Lab

1.1K subscribers

503 photos

499 videos

1 file

900 links

Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.

Download Telegram

About

Blog

Apps

Platform

1.1K subscribers

😱 ChatGPT для работы скоро понадобится больше 30 тыс. GPU

К такому выводу пришла исследовательская компания TrendForce. Это на 10 тыс. чипов больше, чем требуется сейчас. Причиной эксперты называют не столько требовательность чат-бота и языковой модели GPT (на ней построен ChatGPT) к ресурсам, сколько их растущую коммерциализацию 💵. Все больше сторонних компаний будут использовать чат-бот, а значит, все больше графических чипов понадобится для обработки данных.

Больше всего от такого положения дел, вероятно, выиграет Nvidia, чей процессор A100 широко используется для подобных целей 🎉. Компания может получить около $300 млн прибыли благодаря сервису OpenAI. Стоимость одного A100 варьируется от $10 тыс. до $15 тыс. При этом система DGX A100, которая состоит из нескольких GPU, продается почти за $200 тыс. 😵‍💫

Nvidia уже второй раз за последние несколько лет оказывается в нужное время в нужном месте. До этого компания хорошо заработала на майнинге криптовалют. Только за 2021 год Nvidia продала систем, заточенных под добычу, на $550 млн. 🕺

🔥9👍2

1.07K viewsedited 14:34

Stable Diffusion научили визуализировать мысли 👨‍🎨 🧠

Ученые из университета в японском городе Осака использовали нейросеть, чтобы восстановить изображение по снимкам, сделанным с помощью функциональной магнитно-резонансной томографии (фМРТ) 🧲. Нечто похожее мы уже видели у Meta*.

🤖Кроме SD исследователи использовали еще 2 обученные ими ИИ-модели. Одна из них отвечала за сопоставление с изображением информации с фМРТ-снимка, полученной из части мозга, которая отвечает за распознавание визуальной информации 🖼. Другая модель получала информацию со снимка той части мозга, которая отвечает за «расшифровку» визуальной информации в смысловую. Эту информацию ИИ затем сопоставлял с текстовыми описаниями изображений 🤯.

Потом информацию, полученную двумя ИИ-моделями, переносили в SD, которая генерировала изображения. По оценке исследователей, точность визуализации составляет около 80% 🎯. Ее можно оценить по скриншоту выше, где крайнее изображение слева — это картинка, которую видел человек во время томографии, а крайнее справа — результат работы алгоритмов.

Практического смысла в эксперименте пока нет: исследователи использовали снимки, полученные всего от четырех человек, и в каждом случае ИИ приходилось настраивать по-разному. Можно представить сколько времени уйдет на такой эксперимент с сотнями или тысячами участников 📆.

* — запрещенная на территории РФ организация

🔥10❤1

969 viewsedited 12:35

❗️ GPT-4 — уже на следующей неделе!

Об этом проговорился технический директор немецкого офиса Microsoft Андреас Браун, выступая на мероприятии, посвященном искусственному интеллекту. Судя по всему, пока речь идет об официальном анонсе, а не о полноценном релизе языковой модели 👅.

📹 Браун рассказал, что GPT-4 будет мультимодальной и, в частности, будет поддерживать видео. Другими подробностями он не поделился, но пообещал, что выход модели можно будет сравнить с появлением первого айфона.

🗓 Возможно, анонс состоится в ходе конференции The Future Of Work With AI, которая состоится 16 марта. В ней примет участие глава Microsoft Сатья Наделла.

Уже сейчас мы точно знаем, чего в GPT-4 не будет — 100 трлн настраиваемых параметров. Про другие слухи о том, какой будет языковая модель, можете в ожидании анонса почитать вот здесь.

😱6🤩2

887 viewsedited 14:55

Рабочая неделя была короткой, но важные новости все равно есть

✅ Сова Duolingo объединится с OpenAI для создания чат-ботов, которые помогут выучить новые языки;

✅ Slack анонсировал чат-бота, который будет общаться с вашими коллегами по работе за вас;

✅ Поисковик Bing от Microsoft впервые за почти 14 лет существования может похвастаться 100 млн активных пользователей за день. Причина, конечно же, в интеграции искусственного интеллекта;

✅ Один из главных конкурентов OpenAI, стартап Anthropic (подробнее о нем здесь), привлек $300 млн инвестиций при оценке больше $4 млрд. Ранее $400 млн в компанию вложил Google.

👍13🔥1

694 views09:01

Дейтинг-приложение, где у вашего аватара жизнь будет интереснее, чем у вас 🥂

В Snack можно создать версию себя, которая будет ходить на свидания с другими аватарами в местной метавселенной. Чтобы аватар был похож на свою физическую версию, пользователю придется ответить ИИ на несколько личных вопросов ❓.

🚨 Программа сообщит пользователю, если аватар найдет ему пару, а пользователь сможет решить, стоит ли встречаться IRL. Но если аватару очень понравится свидание, то вам он ничего о нем не расскажет (шутка!).

Авторы Snack обещают в будущем дать возможность сходить сначала на виртуальное свидание, а уже потом встречаться по-настоящему 🤝.

📹 Snack существует уже 2 года. Изначально идея приложения была в том, чтобы объединить Tinder и TikTok — вместо анкет пользователи приложения выкладывали короткие видео.

🤖 Стартап получил в 2021 году $3,5 млн инвестиций, но пока так и не добился серьезной популярности. Возможно, все потому, что у сервиса не было аватаров, обученных искусственным интеллектом!

🔥7

734 viewsedited 14:49

This media is not supported in your browser

VIEW IN TELEGRAM

🗣 ИИ научили синтезировать реалистичную речь с помощью YouTube и подкастов

В большинстве случаев ИИ, который генерирует речь, обучают на датасетах, где записана речь профессиональных актеров. Из-за этого человеческому уху синтетический голос кажется безэмоциональным и монотонным 😑.

Чтобы исправить ситуацию, исследователи из университета Карнеги-Меллона в США решили тренировать искусственный интеллект на видео с YouTube и подкастах. Прослушав почти 900 часов такого контента, модель научилась реалистично делать паузу, использовать междометия и слова-паразиты 🤬. Работу ИИ можно оценить на записи выше.

👍 👎 Людей, которых просили оценить реалистичность голоса, поставили ему 3,89 по пятибалльной шкале. Это выше, чем в среднем получают подобные ИИ-модели (настоящий человеческий голос получил оценку 4,01).

🔥13

854 views08:31

Media is too big

VIEW IN TELEGRAM

Чудо-сервис для работы с CGI от Циклопа из «Людей Икс» 🪄

🧙‍♀️ Wonder Studio не требует дорогостоящего оборудования для mocap-а, а работа со спецэффектами становится не сложнее, чем использование фильтров в Photoshop, утверждают создатели. Сервис с помощью ИИ «распознает актера с одной камеры, отвечает за операторскую работу, свет и цветокоррекцию, заменяет человека на CG-модель». Журналистам удалось посмотреть на Wonder Studio в работе, и они говорят, что результаты действительно впечатляют 😧.

🎬 Оба основателя компании Wonder Dynamics, которая разрабатывает Wonder Studio, не понаслышке знают, что такое производство фильмов — и Никола Тодорович и Тай Шеридан профессиональные актеры. Шеридан, например, снимался в главной роли у Стивена Спилберга в «Первому игроку приготовиться» и нескольких частях «Людей Икс». На разработку Wonder Studio у них ушло 3 года. Тодорович и Шеридан настаивают, что их сервис создан, чтобы помочь профессионалам, а не заменить их с помощью алгоритмов 🤝.

🦸‍♂️ Wonder Studio находится на стадии бета-тестирования, но его уже используют в своем следующем проекте режиссеры Джо и Энтони Руссо («Мстители», «Серый человек», «Первый мститель»).

Спецэффекты становятся одной из главных областей применения искусственного интеллекта. За последнее время мы уже рассказывали о двух похожих продуктах: Move AI и MARZ.

😱10🔥6

830 views14:00

OpenAI выпустил GPT-4. Что в ней нового?

Как и обещал Microsoft — 14 марта OpenAI официально презентовал следующую версию языковой модели GPT — GPT-4.

Основные изменения в новой версии:

🖼 GPT-4 понимает не только текст, но и визуальную информацию (пока без видео). Мультимодальная модель может рассказать, что именно изображено на иллюстрации, и даже объяснить ее смысл. В демо GPT-4 объяснил визуальную шутку, где к айфону подключен древний VGA-кабель, а также рассказал, что можно приготовить из ингредиентов, изображенных на картинке;

🧠 GPT-4 отличается хорошей памятью. Если предыдущая версия могла запомнить 8 тыс. слов, то GPT-4 легко запомнит 25 тыс. OpenAI анонсировал суперверсию ИИ, которая запоминает около 64 тыс. слов (т. е. около 50 страниц текста). Это позволит модели вести длинные диалоги и генерировать более объемные тексты;

💬 GPT-4 готова отвечать на вопросы на 26 языках, включая русский;

😌 GPT-4 будет не так просто вывести из себя, чтобы модель начала угрожать, оскорблять или просто нести чушь. Для этого ее тренировали на огромном количестве «вредоносных» текстовых подсказок;

👩‍🎓 GPT-4 прошла более 20 самых распространенных тестов на знание, в том числе математики, письма, чтения, физики, химии. В отдельных случаях модель показала результаты лучше, чем 88% проходивших тесты;

GPT-4 уже тестируют несколько крупных компаний, включая платежный сервис Stripe. В OpenAI также признались, что обновленный поисковик Bing от Microsoft, анонсированный несколькими неделями ранее, уже работал на новой версии GPT. Также в компании отказались подробно рассказывать о технических характеристиках GPT-4 — чтобы не выдать лишнюю информацию конкурентам 🤐.

GPT-4 все еще не идеальна: знания модели ограничены сентябрем 2021 года, а в отдельных случаях ИИ «галлюцинирует» — выдает некорректную или попросту выдуманную информацию 😵‍💫.

💵 Сейчас модель доступна только подписчикам платного сервиса ChatGPT Plus, разработчики могут записать в лист ожидания API. Бесплатная версия пока не анонсирована.

❤5🔥3👍2

728 views10:32

Media is too big

VIEW IN TELEGRAM

Google спешит напомнить, что у него тоже есть ИИ 👋

🏃‍♂️ Google очень не хочет прийти последним в ИИ-гонке, и поэтому в один день с анонсом GPT-4 объявил об интеграции искусственного интеллекта в свои офисные инструменты, объединенные общим названием Workspace: Gmail, Документы, Таблицы, Meet, Календарь и другие.

📩 📄 На первом этапе алгоритмы добавят в почтовый сервис и текстовый редактор. В Документах теперь, например, можно задать искусственному интеллекту тему для текста и приложение сгенерирует черновик. Gmail благодаря ИИ теперь может написать за вас ответ и подготовить пересказ слишком длинного письма.

🤖 ИИ обещают интегрировать в остальные сервисы каждые пару недель, так что скоро ждите, в том числе, генеративную нейросеть в Презентациях, которая создаст по текстовой подсказке иллюстрации для слайдов.

🙁 Но не спешите радоваться — пока прокачанные Gmail и Документы будут доступны только «проверенным» пользователям в США. Кажется, это еще один признак того, что Google очень торопится со своими ИИ-анонсами.

🤔6😱1

758 views08:30

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

BMW показал дисплей, который займет всё лобовое стекло автомобиля 😱

Panoramic Vision представляет собой проекционный дисплей, который выводит важную информацию по всей площади лобового стекла автомобиля — не только для водителя, но и для пассажира ℹ️.

В немецкой компании говорят, что Panoramic Vision позволит водителю в принципе не отводить взгляд от дороги, что естественно повышает безопасность поездки 👷‍♂️.

Дисплей начнут устанавливать в электромобилях концерна уже в 2025 году.

🛸 Нечто похожее на Panoramic Vision, но еще более футуристичное, BMW показывал в январе на презентации концепт-кара Vision Dee (см. видео с девушкой). Там на лобовое стекло проецировалась не только важная информация, а целые 3D-сцены.

🔥11👍1

702 views16:06

Сооснователь OpenAI запустил цифровой паспорт для децентрализованного интернета будущего 🛃

Стартап Worldcoin представил технологию World ID — децентрализованный цифровой паспорт, который должен упростить для пользователей процесс подтверждения личности в интернете, при этом не требуя раскрывать персональные данные 🤫.

Один из основателей Worldcoin — это Сэм Альтман, глава и сооснователь компании OpenAI.

🔐 World ID хранится локально на смартфоне пользователя и использует криптографический протокол доказательства с нулевым разглашением (Zero-Knowledge Proof) для подтверждения личности. Решение в перспективе закрывает важный вопрос, о том, кому должны принадлежать ваши персональные данные — вам или бигтехам, которые сегодня зарабатывают на них миллиарды долларов.

Как объясняют создатели, цифровой паспорт не привязан к биометрии пользователя, его телефону или любой другой личной информации. World ID можно сравнить с печатью в документе, которая подтверждает его подлинность, а в данном случае — подтверждает, что пользователь не бот 🤖. При этом, где именно вы использовали World ID не знают даже разработчики приложения (так они утверждают, по крайней мере) 🙈.

✖️ 🇷🇺✖️ Если вы живете не в России, то можете уже завести себе модную штуку, скачав соответствующее приложение. Правда, толку от него сейчас мало, так как крупных сервисов, которые поддерживали бы продвинутую аутентификацию, сейчас попросту нет. Первым девайсом, который полноценно поддерживает World ID, стал The Orb — сканер сетчатки глаза, разработанный Worldcoin, и позволяющий получить виртуальное удостоверение личности.

🔥8❤1

808 viewsedited 15:35

Midjourney научился корректно генерировать пальцы и зубы, на ИИ-адвоката подали в суд, Siri мешает Apple в разработке чат-бота — и другие важные новости за неделю

✅ Вышла пятая версия Midjourney: генерации стали еще реалистичнее, а главное, у людей на сгенерированных картинках теперь правильное количество пальцев и зубов!;

✅ В истории про ИИ-адвоката случился новый сюжетный поворот — на создателей алгоритма подали в суд за оказание юридических услуг ненадлежащего качества (по факту услуги оказать так и не удалось);

✅ Meta* сворачивает NFT-активность в Facebook* и Instagram* — токены, которые еще недавно представляли, как будущее монетизации для авторов контента, больше нельзя будет использовать на платформах;

✅Вдогонку к предыдущей новости: Марк Цукерберг, вероятно, поддался на давление со стороны инвесторов, которые немножко поседели, когда увидели миллиардные убытки metaverse-подразделения Meta*. Теперь компания намерена сосредоточиться на инвестициях в ИИ;

✅Цукербрега можно понять, ведь инвестиции в метавселенные за первые 3 месяца текущего года обвалились почти в 4 раза по сравнению с аналогичным периодом 2022 года — с $2 млрд до $587 млн. Инвестиции в ИИ при этом выросли с $613 млн за первые 3 месяца 2022 года до $2,3 млрд за аналогичный период в 2023-м ;

✅ Новости из мира чат-ботов: стартап Anthropic, который получил $400 млн от Google, запустил чат-бота по имени Claude; Apple тоже работает над ответом ChatGPT на основе Siri, но процесс тормозит низкое качество программного кода, на котором работает голосовой помощник; китайцы Baidu представили свой чат-бот Ernie, но он настолько всех не впечатлил, что акции компании в моменте подешевели на 10%;

✅ МТС разрабатывает конкурента YouTube и TikTok на базе своего не слишком популярного сервиса WASD.

*Организации, запрещенные на территории РФ

👍6❤2

695 views09:00

Media is too big

VIEW IN TELEGRAM

Microsoft показал умного ассистента Copilot — помощника-скрепку на анаболиках 📎

👨‍✈️ Microsoft анонсировал ИИ-ассистента Copilot, интегрированного во все офисные приложения компаний. «Второй пилот» — это чат-бот внутри приложения, который в зависимости от контекста может предложить варианты написания текста на заданную тему, создать с нуля слайды для презентации, сгенерировать график функции или подготовить длинную и короткую версии электронного письма. Работает Copilot на нескольких языковых моделях, включая свежую GPT-4.

📹 В будущем Microsoft хочет интегрировать в Copilot сервис Designer, добавить генерацию видео и возможность использовать ассистента совместно с коллегами.

😵‍💫 Copilot пока работает в тестовом режиме, но Microsoft заранее предупреждает, что ИИ несовершенен, галлюцинирует, ошибается и вообще лучше всегда перепроверить, что там Copilot вам насоветовал.

🥊 Кажется, как и в случае с умным поисковиком, Microsoft опять удалось обыграть Google и показать сервис, который хочется начать использовать прямо сейчас. Google за пару дней до Copilot тоже объявил об интеграции ИИ в свои офисные приложения, но анонс получился невнятным, как это бывает у компании в последнее время. С другой стороны, Microsoft провел шикарную презентацию обновленного Bing, а через пару дней выяснилось, что компания просто умело спрятала многочисленные ошибки поисковика.

🔥7👍1

1.19K views11:40

🦙 В Стэнфорде конкурента GPT обучили за $600, сэкономив миллионы долларов

Университет представил языковую модель Alpaca, созданную на основе модели LLaMA от Meta*. Главное отличие Alpaca от разработки OpenAI в ее дешевизне — мы не знаем, сколько точно стоит обучение такой модели как GPT, но, скорее всего, сумма составляет несколько миллионов долларов. Для Alpaca, которая еще и не требовательна к ресурсам, эта сумма составила всего несколько сотен долларов 😱.

✍️ Чтобы сэкономить, исследователи из Стэнфорда собственноручно записали 175 текстовых инструкций формата «Создай список обещаний на Новый год» с вариантами ответов, которые затем загрузили в GPT, чтобы сгенерировать еще больше подобных примеров. На выходе у них получилось 52 тыс. вариантов, что обошлось исследователям в $500.

🛠 Еще $100 и 8 часов рабочего времени авторы потратили на то, чтобы с помощью полученных синтетических данных, используя систему Nvidia A100, «докрутить» LLaMA, на которой работает Alpaca.

✖️ Авторы говорят, что их модель сравнима по результатам с теми, которые выдает GPT-3,5. Эксперимент Стэнфорда можно повторить и на новейшей GPT-4, правда, для ее дальнейшего использования есть ограничения. Так, LLaMA нельзя использовать в коммерческих целях, а OpenAI запрещает использовать информацию, сгенерированную GPT, для создания конкурентов языковой модели.

*Организация, запрещенная на территории РФ

🔥8👍1

895 viewsedited 16:09

This media is not supported in your browser

VIEW IN TELEGRAM

📝➡️🖼 Runway показал новую версию Text2Video модели Gen

В отличие от первой версии, о который мы писали здесь, Gen-2 может не просто редактировать исходное видео, но генерировать его с нуля по текстовой подсказке 🪄. Еще нейросеть может превращать в короткий клип загруженное изображение, а также работать в комбинированном формате: вы можете загрузить в нейросеть изображение, а затем написать текстовую подсказку с описанием того, каким именно должно быть ваше видео 🎬.

Пока продолжительность роликов не превышает нескольких секунд, а их качество пока не назовешь идеальным. Тем не менее текстовой подсказке алгоритм следует довольно точно, а детализированность результата уже значительно выше той, что показывают конкуренты (тем более, что нейросетей конкурентов нет в открытом доступе). Мало того, Runway уже работают и над возможностью генерировать аудио с помощью Gen 🎶.

Чтобы попробовать новую версию Gen, придется зарегистрироваться на сайте Runway и ждать, когда она станет доступна.

😱4👍2🔥2❤1

1.18K viewsedited 14:54

Media is too big

VIEW IN TELEGRAM

👩 Очень умный почтовый клиент с голосом Скарлетт Йоханссон

Бывший сотрудник ИИ-стартапа Covariant Джастин Элви у себя в твиттере показал почтовый клиент на основе языковой модели GPT-3,5 и голосовой модели от ElevenLabs. Последнюю Элви, по его словам, тренировал с помощью речи виртуальной помощницы из фильма «Она» (ее, если кто забыл, озвучивала Скарлетт Йоханссон) 🏋️‍♀️.

📨 Сначала GPT-3,5 генерирует краткое содержание писем, а затем его зачитывает синтетический голос. В демо голосовая помощница Саманта рассказывает о важных письмах, которые пришли пользователю, и отвечает на них.

🆒 Выглядит действительно круто, единственное, к чему можно придраться в демонстрации — довольно продолжительные паузы между запросом и генерацией ответа.

🔥6👍2❤1😱1

825 views10:40

This media is not supported in your browser

VIEW IN TELEGRAM

ИИ, который создаст вашего клона для маркетинговых видео 👥

Стартап Tavus разработал одноименную платформу для быстрой редактуры маркетинговых видео с помощью ИИ. Например, вам нужно записать десяток однотипных видео, где меняется только имя адресата. С помощью Tavus можно просто изменить имя в редакторе, а ИИ сам вставит его в нужный момент в ролике.

📹 Чтобы начать использовать Tavus, пользователю нужно записать 15-минутный ролик, на котором будет обучаться алгоритм. Затем нужно записать «шаблон» для ролика, который предстоит редактировать, меняя вводные данные (название компании, имя клиента и т. д.). С недавнего времени Tavus поддерживает ChatGPT, с помощью которого можно сгенерировать текст для видео ✅.

🚨 Не будут ли злоумышленники использовать Tavus для создания дипфейков? Разработчики утверждают, что нет: платформа не позволяет загружать чужие видео, а каждый пользователь проходит процедуру верификации.

💵 Базовый тариф Tavus стоит $275 в месяц. На сайте можно запросить демо сервиса.

🔥5👍1

772 views15:01