D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
🤦‍♂️ Forbes назвал самые перспективные ИИ-компании

В список попали 50 компаний из самых разных областей: медицина, безопасность, продажи и даже лесоводство. Полный список можно посмотреть здесь.

💲 Из всех участников только четыре получили от инвесторов более миллиарда долларов: OpenAI, разрабатывающая оборонное ПО Anduril Industries, Anthropic и Databricks. Есть также компании, которые пока не получили от инвесторов ничего — это Midjourney и Surge AI. Последняя специализируется на разметке данных. Midjourney пока даже не собирается привлекать инвестиции.

Forbes отдельно выделили четырех участников списка:

🌐 Adept Про них мы уже писали в тексте про темных лошадок ИИ-рынка. Стартап разрабатывает браузерное расширение для автоматизации выполнения различных заданий.

💊 Insitro Этот стартап использует ML-алгоритмы для анализа человеческих генов и поиска новых лекарств.

🍿 Runway Эти люди вам должны быть хорошо знакомы. Сейчас это, наверное, самый перспективный ИИ-стартап, который разрабатывает инструменты для работы с видео и изображениями. Их ПО использовали при создании некоторых спецэффектов для «Все везде и сразу» — лучшего фильма прошлого года по версии «Оскара».

📹 Synthesia Стартап, который разрабатывает решения для создания синтетического видео с участием цифровых аватаров, которые могут говорить на 120 языках. У компании уже 35 тыс. клиентов, в том числе очень крупных, поэтому немного странно видеть ее в списке перспективных.
Please open Telegram to view this post
VIEW IN TELEGRAM
43👍2
Маск скупает GPU, OpenAI платит за поиск уязвимостей, Stable Diffusion выросла до размера XL — и другие важные новости за неделю

Илон Маск все еще пытается реанимировать Twitter и даже затеял какой-то ИИ-проект для соцсети. Для этих целей Маск недавно закупил 10 тыс. GPU и переименовал Twitter Inc. в X Corp;

Глава OpenAI Сэм Альтман начал мировое турне с целью пролоббировать использование сервисов компании. Альтман, в частности, заехал в Японию. Там глава правительства страны Фумио Кисида пообещал ему начать использовать ChatGPT, как только к безопасности чат-бота будет не так много вопросов. Всего Альтман посетит 16 стран;

OpenAI запустил Bug Bounty-программу для ChatGPT. Любой нашедший уязвимости в работе чат бота может получить от $200 до $20 тыс. За взлом сервиса никаких наград не предусмотрено;

Разработчики Stable Diffusion выпустили новую версию популярной нейросетки. Называется Stable Diffusion XL, где XL означает увеличенное количество параметров модели — 2,3 млрд против 900 млн у обычной версии. XL-версию можно попробовать через API или платный сервис DreamStudio;

Прошло пару недель, а стартап Databricks уже представил коммерческую версию своей языковой модели с открытым кодом Dolly (подробнее о ней читайте здесь). Dolly 2.0 все еще полностью бесплатная, а пользователи могут продолжить обучать ее на собственных данных;

Meta* опубликовала исходный код модели Animated Drawings, которая позволяет анимировать любые стремные каракули;

Alibaba собирается добавить своего конкурента ChatGPT по имени Tongyi Qianwen во все свои сервисы. Первыми станут корпоративная платформа DingTalk и платформа для взаимодействия с умными устройства Tmall Genie.

*Организация, запрещенная на территории РФ
🔥7
Что за AutoGPT и почему все о нем говорят 💬

AutoGPT — это на данный момент, пожалуй, самый популярный представитель экспериментальных сервисов, которые называют автономными ИИ-агентами. Идея таких сервисов заключается в том, что они могут без участия человека выполнить поставленную задачу, разработав для себя план действий. Если в ходе работы сервис находит ошибку, то он сам исправляет ее, корректируя свои действия ✔️.

Возможность оставить чат-бот без надзора так взбудоражила общественность, что про AutoGPT написали даже Cosmopolitan и Euro News 😱.

AutoGPT придумал независимый разработчик Торан Брюс Ричардс aka Significant Gravitas. Сервис работает на GPT-4 и для выполнения задач, по сути, раз за разом анализирует информацию, сгенерированную языковой моделью и корректируя ее по необходимости.

Ричардс говорит, что его цель — превратить AutoGPT в универсальный искусственный интеллект (AGI), который сможет выполнять самые разные задачи, для которых он изначально не был запрограммирован: купить ботинки, проанализировав перед этим отзывы на маркетплейсах; сделать пост для соцсети и запланировать публикацию; написать бизнес-план — что угодно 🤹.

🚼 Еще один популярный проект на ту же тему, но с уклоном в бизнес — BabyAGI, созданный инвестором Йохей Накадзимой. Вообще, больше всех появлению ИИ-агентов обрадовались розничные инвесторы, которые надеются с помощью них оптимизировать свою работу.

У обоих сервисов есть веб-версии: AutoGPT, BabyAGI 🫡.

AutoGPT и BabyAGI (а также похожий на них HyperWrite, о котором мы рассказывали пару дней назад) — пока только эксперименты по той же причине, по которой ChatGPT нельзя использовать как надежный источник информации — алгоритмы допускают слишком много ошибок, чтобы доверять им серьезные задачи.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥71👍1
Как превратить пространство вокруг себя в интерактивное хранилище запросов к ChatGPT 🗄

Основатель проекта Softspace Йилиу Шен-Бюрке у себя в твиттере показал, как с помощью AR/VR-технологий упростить взаимодействие с ChatGPT.

Суть «Прототипа 06» в том, что он предлагает отойти от уже привычного формата чат-бота и вместо этого использовать интерактивную карту в AR 🗺.

Например, пользователя интересует, что такое AGI — он вводит соответствующий запрос, получает на него ответ, а также несколько смежных тем, которые могут быть ему интересны. Эти дополнительные темы отображаются в AR в виде облака запросов, с каждым из которых можно взаимодействовать ☁️.

ИИ в данном случае отвечает за то, чтобы предлагаемая информация была максимально релевантна к первоначальному запросу.

По ходу изучения темы, пользователь получает ту самую интерактивную карту из интересующей его информации. К уже изученным темам можно возвращаться, а те, которые оказались неинтересны, можно с AR-карты удалить 🗑.

Проект можно попробовать самому, если есть Quest VR.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
«Теперь мне не нужны друзья»: американец натренировал ИИ-модель на переписке со своими знакомыми за 7 лет 📆

Data Scientist Иззи Миллер решил заменить алгоритмом вещь, которая для него, по его собственным словам, «спасательный круг, источник комфорта и точка объединения». Речь, конечно же, об общем чате с друзьями из колледжа 💬.

Для этого он выгрузил из чата с шестью участниками полмиллиона сообщений, накопившихся за 7 лет переписки, и натренировал на них модель LLaMA. Затем он создал клон интерфейса iMessage, чтобы переписка в синтетическом чате выглядела убедительнее 👍.

По словам Миллера, особенно его поразило то, что ИИ не просто выучил, кто как пишет в чате, но и кто где живет, с кем встречается, чем увлекается и т. д.

😐 Конечно, алгоритм не идеален и допускает ошибки. Например, ИИ иногда «думает», что все участники чата до сих пор учатся в колледже — все потому, что именно в тот период переписка велась особенно активно.

Во всех подробностях почитать о том, как создавался чат Robo Boys можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8🤔2👍1
Media is too big
VIEW IN TELEGRAM
📷 NeRF, который заменит фотоальбом

В Google усовершенствовали существующие NeRF-модели и добились очень крутого результата, который можно оценить выше. Да, это не видео с пролетом дрона, а полностью синтетическая 3D-сцена, созданная из фотоснимков 🦸.

Если кратко, то исследователи в компании смогли объединить достоинства Instant-моделей, которые могут создать 3D-изображение в несколько раз быстрее стандартных NeRF, со своим Mip-NeRF алгоритмом. Mip-NeRF может создавать очень детализированные синтетические панорамы, но на это у модели уходит несколько часов 🏃‍♀️.

💸 Получившуюся модель назвали Zip-NeRF. Она сохраняет качество Mip-NeRF, но работает при этом в 22 раза быстрее. Препятствием для широкого использования подобных моделей остается требовательность к ресурсам. Для работы Zip-NeRF понадобится 8 Nvidia Tesla V100-SXM2-16 GB GPU, которые стоят около ₽150 тыс. за штуку.

Коллеги уже фантазируют, что именно так будут выглядеть в будущем фотоальбомы — как бесшовные 3D-сцены, в которые можно будет погрузиться с помощью VR, чтобы поностальгировать 😌.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12🤯2
Media is too big
VIEW IN TELEGRAM
Exit Suit — экзоскелет для VR, который можно напечатать 🕴 🖨

Костюм, придуманный «VR-энтузиастом» Вилли Уинклером, состоит из нескольких haptic-датчиков, расположенных по всему телу и соединенных с VR-шлемом. Exit Suit реагирует на события, происходящие в VR, передавая сигнал на соответствующую часть тела 🦵.

Экзоскелет состоит из модулей, поэтому его части легко заменяются, а костюм можно быстро кастомизировать 🧩. Еще один плюс — Exit Suit можно распечатать на 3D-принтере.

🛠 Проект пока находится на стадии разработки, поэтому Уинклер не говорит, во сколько может обойтись самостоятельная сборка костюма. Кроме того, у Exit Suit есть некоторые технические ограничения, например, на действия, которые в нем можно выполнять.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62
Amazon поручил искусственному интеллекту следить за громкостью в сериалах и фильмах 📢

В стриминг-сервисе Amazon Prime появилась функция Dialogue Boost, которая автоматически увеличивает громкость диалогов по сравнению с остальными звуками в сериалах и фильмах 🗣.

ИИ-алгоритм целиком анализирует звуковую дорожку, находит в ней диалоги и точечно увеличивает только их громкость. Пользователь может выбрать интенсивность Dialogue Boost, для этого доступны 3 режима — High, Medium и Low 🫡.

Как утверждает Amazon, до этого момента такая функция была доступна только владельцам High-End-устройств, а теперь — любому подписчику стриминг-сервиса. Сейчас Dialogue Boost доступен для сотни тайтлов в каталоге сервиса, список обещают постепенно пополнять ☝️.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT для разработчиков игр 🎮

Так называют набор инструментов на основе генеративного ИИ Buildbox AI его разработчики.

Buildbox AI встроен в nocode-платформу Buildbox и позволяет по текстовому запросу создавать ассеты, чтобы затем использовать их в играх 💬.

Сгенерированные объекты совместимы с самыми популярными игровыми движками Unity и Unreal.

Пользователи Buildbox AI выступают еще и в роли тестеров платформы: генерируя ассеты, они одновременно тренируют ИИ-модель 🏋️‍♀️.

У платформы есть бесплатная версия, но ИИ доступен только в платных версиях — стоимость начинается от $45 в год.

🫴 Интересно, что разработчики Buildbox зарабатывают не только на подписке, но и получая фиксированные проценты от выручки, которую зарабатывает автор игры.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
Reddit тоже против ИИ, нейрокартинка выиграла престижный фотоконкурс, со стриминг-сервисов удалили несуществующую песню Дрейка и The Weeknd — и другие важные новости за неделю

Фотограф Борис Эльдагсен отправил свой снимок на престижный конкурс Sony World Photography, а когда выиграл — отказался от приза и признался, что фотографию сгенерировала нейросеть. По словам Эльдагсена, он специально проверял жюри конкурса;

Samsung и LG лоббируют замену проекторов в кинотеатрах на LED-экраны. Такие экраны ярче проекторов и поддерживают фишки вроде HDR, но при этом гораздо дороже и энергозатратнее;

Главный интернет-форум Reddit больше не хочет, чтобы ИИ-модели тренировались на сообщениях его пользователей бесплатно. Владельцы отправили API сайта под пейволл — теперь тем, кому нужен особый доступ к контенту сайта (то есть разработчикам ИИ-алгоритмов), придется за это заплатить. Цены пока не названы;

Музыкальный бизнес продолжает воевать с нейросетями. Теперь по требованию мейджоров со Spotify и Apple Music удалили совместный трек Дрейка и The Weeknd, полностью созданный искусственным интеллектом. В TikTok Heart On My Sleeve успел набрать больше 13 млн прослушиваний;

Яндекс в мае этого года откроет в Москве центр для тестирования складских роботов собственного производства. В перспективе Яндекс хочет продавать их другим компаниям и на экспорт;

Разработчики нейросети Stable Diffusion представили свою первую языковую модель с открытым кодом. Бесплатная модель доступна в вариантах с 3, 7, 15, 65 млрд параметров;

Google объединил все подразделения, которые занимаются ИИ, в одно и назвал его Google DeepMind. Объясняется это необходимостью повысить эффективность работы команд в попытке угнаться за Microsoft.
👍11
OpenAI тратит около $1 миллиона в день на работу ChatGPT 😱

К такому выводу пришли аналитики из фирмы SemiAnalysis, исходя из приблизительной стоимости серверов, которые арендует стартап.

По словам главного аналитика SemiAnalysis Дилана Патела, работа ChatGPT на языковой модели GPT-3 стоила OpenAI около $700 тыс. в день. Соответственно, новейшая GPT-4 обходится компании еще дороже 💸.

Обучение такой модели, как GPT-4, стоит десятки миллионов долларов, а значит, поддержание модели в рабочем состоянии может обходиться в сопоставимую сумму каждую неделю.

🛠 Для того чтобы сократить огромные затраты, Microsoft собирается разрабатывать собственные чипы, заточенные под работу ИИ-моделей. Так компания сможет оставаться независимой от компаний вроде Nvidia, не опасаясь дефицита полупроводников из-за растущего спроса. Чипы должны показать в начале следующего года.

🧠 Эксперты связывают серьезное удешевление разработки ИИ-моделей с дальнейшим развитием нейроморфных вычислений — компьютерной архитектуры, построенной по аналогии с работой человеческого мозга. Но на это может уйти еще как минимум несколько лет.
Please open Telegram to view this post
VIEW IN TELEGRAM
😱7😁1
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ-ассистент, который записывает все, что делает пользователь ✍️

Rewind запоминает, что пользователь делает на своем компьютере (пока программа работает только на Mac), чтобы при необходимости напомнить ему 🗒.

Недавно ассистент получил поддержку GPT-4 и теперь с ними можно общаться в режиме чат-бота. Достаточно спросить: «Что я вчера заказывал на Amazon?» или «Откуда я знаю этого человека?», и Rewind быстренько все напомнит 🧠.

👮‍♂️ Учтите, что Rewind запомнит не только вашу историю браузера: программа запишет ваш созвон в Zoom, вашу переписку в мессенджере. И да — какие запросы вы вбивали в поисковик тоже запишет (к отдельным приложениям Rewind можно ограничить доступ).

Из всего этого следует логичный вопрос: что будет, если ко всей этой информации доступ получит злоумышленник? В Rewind на это отвечают, что всю конфиденциальную информацию программа хранит локально, а в облако попадают только обезличенные данные и только текстового формата. Сами решайте, достаточно ли для вас такой защиты 🤔.

У программы есть несколько вариантов подписки, включая бесплатную, которые отличаются количеством «перемоток», которые вам дадут сделать за месяц, а также приоритетным доступом к новым функциям.
🤔41👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Супермодель превратилась в метачеловека 💃

Мы уже рассказывали про технологию MetaHuman от разработчиков из Epic Games, которая на основе видео, снятого даже на айфон, может в реальном времени создать реалистичную лицевую анимацию.

👗 Спустя несколько недель для MetaHuman нашлось практическое применение: чешская супермодель Ева Герцигова согласилась создать свой цифровой аватар с помощью программы. Потом его можно будет использовать для виртуальных модных показов.

🎦 Снимали Герцигову, конечно же, не на 1 айфон — для создания аватара использовали сразу 70 камер. Пригодилась и продвинутая mocap-система Vicon, разработанная американской компанией Cemtrex.

До Герциговой MetaHuman тестировали на баскетболисте Луке Дончиче 🏀.
This media is not supported in your browser
VIEW IN TELEGRAM
Video2Video-нейросеть Gen-1 — уже на вашем айфоне 🤳

Пока доступ к Gen-2 получают только избранные, можно потестировать предыдущую версию модели — зато сразу на смартфоне через приложение RunwayML (пока только на iOS) 🥳.

✂️ 🎞 Редактировать свои видео в приложении можно, используя готовые фильтры, собственные изображения или с помощью текстовых подсказок.

Бесплатная версия ограничена 525 кредитами — 1 секунда отредактированного видео стоит 14 кредитов. Докупать кредиты в бесплатной версии нельзя. Gen-1 редактирует первые 5 секунд загруженного ролика, сам процесс занимает 2-3 минуты .

📅 Если хотите развлекаться с Gen-1 дальше, то придется купить месячную или годовую подписку. Они отличаются количеством устройств для установки, объемом облачного хранилища и форматами, которые доступны для экспорта файлов. Стоимость подписки на месяц начинается от ₽1,3 тыс., на год — от ₽13 тыс.
Please open Telegram to view this post
VIEW IN TELEGRAM
4
This media is not supported in your browser
VIEW IN TELEGRAM
Sci-Fi-фильм, полностью сгенерированный ИИ

🧩 Пользователь твиттера TomLikesRobots показал 40-секундный мини-фильм, за каждый элемент которого отвечала отдельная нейросеть:

— Визуальный ряд создан с помощью Text2Video-модели Gen-2;

— Сценарий написал ChatGPT;

— аудио синтезировал алгоритм от ElevenLabs (результат вы пока не услышите — автор пообещал добавить его позже).

📝 Сюжет, который явно вдохновлен классикой вроде «Чужого», рассказывает о команде космонавтов, которые во время выполнения миссии получают сигнал с неизвестного корабля. На корабле они находят загадочную женщину и забирают ее с собой. Естественно, после этого с героями начинают происходить странные вещи 🤯.

🍿 Посмотрев результат, можно согласиться с режиссером фильмов Marvel Джо Руссо, который прогнозирует, что ИИ научится снимать 1,5-часовые фильмы в течение двух лет.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
«Как семья, но больше сыра»: посмотрите нейрорекламу выдуманной пиццерии 🍕

Художник под ником Pizza Later потратил 3 часа жизни, чтобы создать с помощью нейросетей рекламу выдуманной сети пиццерий Pepperoni Hug Spot.

Получилось, пожалуй, даже криповее, чем видео с Уиллом Смитом, поедающим спагетти 😳.

🛠 Pizza Later использовал ChatGPT (сценарий), Midjourney (иллюстрации), Gen-2 (видео), сервис Eleven Labs (голос) и Soundraw AI (музыка). Все вместе автор сводил с помощью Adobe After Effects.

👕 Если ролик привел вас в восторг, то можно купить мерч с логотипом Pepperoni Hug Spot.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁52
ИИ взломает любой пароль менее чем за минуту. Или нет? 🤔

Выяснить решили специалисты из компании Home Security Heroes (HSH), которая специализируется на кибербезопасности.

Для эксперимента исследователи использовали модель PassGAN, которая обучается на датасетах из уже используемых паролей, чтобы эффективно взламывать новые комбинации 🔐.

🔢 В HSH загрузили пароли в PassGAN из утекшей базы сервиса RockYou, взломанного еще в 2009 году — почти 15,7 млн комбинаций. В выборку попали пароли не короче 4 символов и не длиннее 18.

📆 Авторы эксперимента утверждают, что PassGAN смог взломать 51% паролей менее чем за минуту. Чтобы угадать 81% комбинаций, у алгоритма ушел месяц.

Правда, не все верят в суперспособности нейросетей. Издание Ars Technica пишет, что результаты PassGAN можно считать значимыми, только если не сравнивать их с результатами применения обычных методов, включая даже примитивный Brute Force 🫤.

Кроме того, использование 1-го датасета с паролями более чем 10-летней давности — тоже не добавляет эксперименту убедительности, считают в Ars Technica. Авторы делают вывод, что всесильного ИИ-взламывателя паролей бояться пока не стоит 😮‍💨.
Please open Telegram to view this post
VIEW IN TELEGRAM
😱3
TikTok добавит возможность генерировать аватар с помощью нейросетей. Вот как это будет работать

Соцсеть сначала попросит пользователя загрузить в приложение 3-10 своих фото 🔼.

Какое-то время уйдет на генерацию серии аватаров (до 30 вариантов) в разных стилях, которые потом можно будет скачать, установить в качестве фото профиля и запостить в истории.

☝️ Генерировать новые аватары можно будет не больше 1-го раза в день — вероятно, чтобы не перегружать сервера.

Официально TikTok называет новый инструмент экспериментом, доступным в ограниченном количестве стран. Когда аналог нашумевшей Lensa будет доступен всем пользователям соцсети, не уточняется 🤷‍♀️.

TikTok не первый раз балуется с нейросетями. Прошлым летом в приложении соцсети появилась простенькая Text2Image-модель.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31