D. Lab
1.11K subscribers
503 photos
499 videos
1 file
900 links
Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
WebAI — новая no-code платформа для компьютерного зрения 👀

С помощью webAI разработчики могут создавать новые модели компьютерного зрения. Платформа позволит бизнесу быстро и бесплатно создавать прототипы продуктов на основе компьютерного зрения и уже потом принимать решение, инвестировать ли в это деньги.

Первая фишка webAI — это no-code платформа. Работать на ней может любой разработчик, а не только эксперт в области ИИ или машинного обучения. Для последних есть версия full-code. По словам одного из гендиректоров Iris Дэвида Стаута, в мире сейчас насчитывают 55 млн разработчиков софта и всего 300 тысяч экспертов в сфере ИИ 🤏.

Вторая особенность — webAI работает быстрее и на меньшем объеме данных. Например, по сравнению с платформой YoloV7, которая считается самым быстрым и точным софтом по обнаружению объектов для задач компьютерного зрения, webAI строит модели в 3 раза быстрее и использует в 5 раз меньше данных 💪. WebAI не нужны большие вычислительные мощности — для работы подойдут обычные ноутбуки.

Платформу создавали в течение 3 лет на основе собственной архитектуры Deep Detection. Потренировать на ней свои ИИ-модели пока не получится — бета-версию открыли только для 200 человек 🥺.
👍1
Google представил самый быстрый генератор картинок на основе текста🏃‍♀️

Muse генерирует высококачественные изображения с рекордной скоростью — всего за 1,3 секунды 😱.

Такой эффективности удалось добиться благодаря использованию модели трансформера, а не диффузионной модели, на которой работает, например, Stable Diffusion.

Модель, использованная в Muse, натренирована на большой языковой модели, что позволяет нейросети точнее обрабатывать текстовые подсказки и генерировать на их основе более детализированные изображения. В частности, за счет того, что модель может «предсказать», что хотел увидеть пользователь, даже если не указал это в подсказке. Кроме того, изображения можно быстро редактировать, меняя отдельные слова в промпте.

При этом детализированность изображения не влияет на скорость его генерации. Это происходит благодаря использованию нескольких передовых алгоритмов, включая параллельное декодирование (это означает, что при работе Muse несколько процессов происходят одновременно, а не последовательно, что сокращает время генерации изображения).

По скорости Muse превосходит Stable Diffusion 1.4 почти на 2,5 секунды (1,3 секунды против 3,7 секунды).

Попробовать новую нейросеть пока не получится, но можно почитать исследовательскую работу о ней.
3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Как обойти копирайт с помощью расширения для Chrome

Продолжаем рассказывать об интересных ИИ-расширениях для браузеров. Сегодня посмотрим, как с помощью программы Synthesys X создавать собственные версии любых изображений, найденных онлайн.

Synthesys X работает в браузере Chrome. Данное расширение с помощью ИИ анализирует объекты на изображении, создает на их основе текстовую подсказку, а затем генерирует максимально похожий аналог. Оценить сходство можно на видео выше.

Скачивать другие приложения или посещать сторонние сайты не придется, подчеркивают разработчики. Главное в Synthesys X: вы получаете все авторские права на новое творение и можете свободно и бесплатно его использовать.

Чтобы протестировать решение, установите его себе с сайта разработчика.
👍3🔥1
🙅‍♂️Эксперимент с чат-ботом в психологии раскритиковали за неэтичность

Стартап Koko в сфере ментального здоровья недавно провел эксперимент: обучил чат-бота на основе GPT-3 отвечать на вопросы пользователей и запустил его в Discord. С синтетическим психологом успели пообщаться примерно 4000 человек. Целью теста в компании назвали создание доступного сервиса для тех, кто не может позволить себе услуги настоящего специалиста 💵.

В компании рассказали, что все шло хорошо, пока пользователи не узнали, что общаются с искусственным интеллектом: советы чат-бота нравились им больше тех, что написаны человеком, кроме того, у ИИ уходило на ответ меньше минуты . Однако как только люди узнавали, что общаются с «роботом», иллюзия рушилась и участники эксперимента больше не могли нормально воспринимать советы. Как объяснили в Koko, пользователям становилось не по себе от «симулированной эмпатии» 🤖.

Интересно, что после критики со стороны профессионального сообщества (ИИ мог нанести реальный ущерб человеку в нестабильном эмоциональном состоянии), в Koko заявили, что их не так поняли: на самом деле бот писал советы в коллаборации вместе с людьми, и участники эксперимента знали об этом 🤷‍♀️.
👏4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Расширение для Chrome, которое простым языком объяснит сложные термины

Новый день — новое умное расширение для браузера! На этот раз разбираемся с ассистентом ExplainThis

ExplainThis может развернуто объяснить непонятный термин и ответить на уточняющие вопросы. Для этого нужно выделить слово или словосочетание, кликнуть по нему правой кнопкой мыши и выбрать Explain This.

Кроме того ИИ поможет, если нужно быстро понять содержание длинного текста и подготовит его краткий пересказ.

Расширение обещают запустить в наступившем году, пока на сайте продукта можно записаться в очередь.
🔥6👍1
Искусственный интеллект работает адвокатом, играет в Minecraft, создает компьютерные вирусы — и другие интересные новости за неделю

В США чат-бот поможет оспорить в суде штраф. Стартап DoNotPay выдаст не названному гражданину смартфон с установленным чат-ботом, который будет слушать доводы обвинения в режиме онлайн и подсказывать линию защиты;

Microsoft собирается инвестировать еще $10 млрд в OpenAI — создателя ChatGPT. Оценочная стоимость компании может вырасти почти до $30 млрд. Вдохновленные разработчики уже готовят платную версию чат-бота;

Киберпреступники тоже оценили возможности ChatGPT и пользуются им для создания вирусов. Пока вредоносные программы не слишком опасны, но специалисты бьют тревогу;

Маркетинговое агентство наняло на работу двух «цифровых интернов», которые сами придумали себе имена и внешность. Айко и Айден будут заниматься графическим дизайном и редакторской работой;

DeepMind научили ИИ играть в Minecraft. DreamerV3 может без помощи человека искать в игре алмазы — один из самых дефицитных ресурсов в Minecraft;

Кроме обучения искусственного интеллекта игре в Minecraft, DeepMind также собирается в 2023-м году выпустить свой ответ ChatGPT под названием Sparrow.
👍4
Темные лошадки: самые перспективные игроки на рынке ИИ, о которых мало кто знает

ИИ — это не только OpenAI и DeepMind. The Information выбрал шесть стартапов, которые могут стать конкурентами сегодняшних лидеров.

🖥 Adept AI Labs с помощью браузерного расширения автоматизируют выполнение заданий. Например, расширение через текстовую подсказку поможет найти в интернете предложения о сдаче жилья в городе по нужной вам цене и составить список вариантов. Компанию основали ключевые люди из Google Brain и OpenAI.

⌨️ AI21 Labs создают решения для автоматического копирайтинга, а также сервисы для разработки приложений на основе больших языковых моделей и инструменты для автоматического пересказа текстов. Создатели AI21 Labs до этого основали стартапы, которые потом успешно продали Intel и Google за миллиарды долларов.

🤝 Anthropic разрабатывают «толерантные» языковые модели — не генерирующие сексистский, расистский и другой неприемлемый контент. Компанию возглавляют брат и сестра — бывшие вице-президенты OpenAI. Оценочная стоимость Anthropic весной 2022 года достигла $4 млрд.

🧙 Character создают чат-боты, которые общаются с пользователем от лица разных персонажей — от Драко Малфоя до Зигмунда Фрейда. Их чат-боты могут создавать текстовые RPG, которые легко кастомизировать. Основатели Character — выходцы из Google и работали над перспективной языковой моделью LaMDA от Google.

🤖 Cohere работают над программой, которая позволит разработчикам добавлять в свои приложения чат-боты и функции, связанные с распознаванием языка. У стартапа уже есть договоренности о стратегическом партнерстве с Google, компания также ведет переговоры о привлечении инвестиций от Google и Nvidia.

🤷 Inflection занимаются пока непонятно чем. «Скоро у нас появится возможность делиться мыслями и идеями с компьютером тем же разговорным языком, который мы используем при общении с людьми»‌‎, — говорится на сайте компании. CEO Мустафа Сулейман был одним из основателей компании DeepMind, которую в 2014 году Google приобрел за полмиллиарда долларов.
👍7
Новый выпуск нашего дайджеста новостей и трендов ин да хаус! Декабрь оказался богатым на важные новости.

В этот раз вы узнаете:

🟣 Зачем Netflix добавил в каталог фитнес;

🟣 Почему Apple разрешит устанавливать приложения не из App Store;

🟣 Как доля российского кино в прокате оказалось рекордной за всё время;

🟣 Куда из Twitter сбежали два миллиона пользователей;

И еще больше тем, которые останутся актуальными в ближайшие месяцы!
🔥2
🚨 Американский ритейлер придумал, как с помощью блокчейна испортить жизнь ворам

Американская сеть магазинов по продаже товаров для дома и ремонта Lowe’s представила технологию Project Unlock на основе блокчейна и RFID-меток. Она блокирует товары, которые пронесли мимо кассы. Компания пошла на это из-за роста воровства в американском ритейле до $100 млрд 😱.

При заводской сборке на товар устанавливается несколько меток, каждая из которых имеет уникальный номер. На кассе эти метки считывают сканером, проданное устройство активируется — без этого товар использовать невозможно 🙅‍♀️.

Для дополнительной защиты используется блокчейн, в котором хранится обезличенная информация о покупке. Если вор попытается продать украденную вещь (которую он так и не смог активировать), товар можно будет легко вычислить 🫵.

🤔 У проекта есть несколько очевидных минусов: таким способом от воровства можно защитить только вещи, для работы которых требуется электричество. Кроме того, установка дополнительных меток при сборке усложнит процесс для производителя.
🔥4
Forbes выбрал самые пугающие технологические тренды

🤡 Дипфейки в метавселенных. Синтетический контент — настоящее раздолье для мошенников. А в сочетании с метавселенными, где человек представлен только в виде цифрового аватара, возможностей для такой деятельности становится еще больше.

👌 Квантовые компьютеры. Такие устройства могут быть в триллионы раз мощнее тех, что доступны сегодня. Обратная сторона прогресса: квантовыми компьютерами будут пользоваться хакеры, которые смогут за несколько минут обойти современную защиту.

💡 Возможность напечатать что угодно. 3D-принтеры позволяют удешевить многие производственные процессы, но в тоже время на них можно печатать огнестрельное оружие, схемы которого лежат в интернете. В Британии уже появляются подпольные заводы, которые занимаются именно этим.

👋 Технологическая сингулярность. Так называют момент в будущем, когда машины станут умнее людей. Но искусственный интеллект уже сейчас может справиться со многими задачами лучше человека. Это приведет к тому, что до 90% сегодняшних профессий будут использовать ИИ, а в некоторых случаях ИИ полностью заменит человека.

🐣 «Редактируемые» люди. Технологии вроде CRISPR позволяют редактировать человеческие гены, — например, чтобы победить наследственные заболевания. Но эти методы плохо изучены и непонятно чем «отредактированные» гены грозят следующим поколениям. Многие страны запрещают подобные технологии, но в США и КНР они полностью легальны.

💪 Слияние людей и машин. Технологии уже позволяют улучшать зрение людей или заменять потерянные части тела. Но что если прогресс зайдет слишком далеко и технологии позволят создавать суперлюдей, которые, например, с помощью экзоскелетов получат невероятную силу?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🟥 ИИ поможет стримеру выбрать самые хайповые моменты в трансляции

Израильский стартап Playstream получил $2 млн инвестиций на развитие ИИ-модели, которая выбирает лучшие моменты из стримов.

Кратко: Spikes.gg AI Engine может за несколько секунд проанализировать часы видеоконтента и выбрать из него минуты, которые вызвали у зрителей самый сильный отзыв.

Подробнее: алгоритм выбирает эти моменты, ориентируясь на так называемые скачки (spikes) — эпизоды, когда зрители лайвстрима были наиболее вовлечены в просмотр. Скачком может быть что угодно: удачный выстрел в Fortnite или момент, когда к стримеру в прямом эфире присоединилась его кошка. Разработчики говорят, что их алгоритм анализирует не только аудио и видео, но и реакцию пользователей в чатах во время стрима.

Spikes.gg AI Engine способен не только находить такие моменты, но и ранжировать их по виральности. Выбранным моментом можно также за пару кликов поделиться в соцсетях. Разработчики считают, что используя моменты, выбранные ИИ, стример сможет привлечь к себе на канал рекламодателей и новую аудиторию.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
Media is too big
VIEW IN TELEGRAM
👁 Модель компьютерного зрения YOLOv8 как вершина возможностей технологии

Только что вышедшая версия алгоритма с открытым кодом YOLO (You Only Look Once) может не только с высокой точностью и быстро определить объект на видео, но и классифицировать его.

Впечатляющие результаты работы модели можно оценить на видео выше 🎆.

Еще одна отличительная черта YOLOv8 в ее гибкости: модель можно запустить хоть на мини-компьютере Raspberry Pi, хоть на топовом компьютере. Для этого у модели существует 5 версий (Nano, S, M, L, XL), каждая из которых отличается точностью определения объектов и, соответственно, требовательностью к ресурсам 🏋️‍♂️.

Конечно, еще один большой плюс YOLO в ее бесплатности. Любой желающий может попробовать модель, скачав с Github.
🔥4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
💥 Microsoft показал нейросеть — подарок для 3D-художников

3D Avatar Diffusion может из одной портретной фотографии создать объемную цифровую модель человека. Как можно догадаться из названия, инструмент использует диффузионную модель, как и всеми любимые Stable Diffusion и Midjourney.

Нейромодель в первую очередь нацелена на упрощение жизни 3D-художников.

Нейросеть способна создавать аватары не только по фотографии, но и по текстовой подсказке. Получившиеся модели можно затем отредактировать также с помощью текстовой подсказки.

Похожий продукт недавно выпустил израильский стартап D-ID.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
👨‍💻 В AR появятся полностью интерактивные голографические объекты

Производитель голографических дисплеев VividQ и разработчик AR-решений Dispelix представили технологию, которая позволит корректно переносить голографические 3D-объекты в дополненную реальность.

Разработчики обещают, что технология позволит пользователям взаимодействовать с виртуальными объектами в AR «естественно и комфортно». В этом главное отличие разработки от решений вроде HoloLens от Microsoft, где объекты всегда двумерные, а из-за постоянного фокусного расстояния (то есть объекты всегда находятся на одном расстоянии от пользователя) у человека быстро устают глаза 😵‍💫.

«Пока все разрабатывали 2D-экран, который можно носить на лице, мы создавали „окно“, через которое можно одновременно взаимодействовать с реальным и виртуальным миром», — говорят разработчики 💪.
Please open Telegram to view this post
VIEW IN TELEGRAM
🗣 Stable Diffusion хотят засудить

Фотоагентство Getty Images подало в суд на разработчиков нейросети Stable Diffusion за то, что ИИ тренировали на изображениях, которые являются интеллектуальной собственностью ©️.

В пресс-релизе Getty Images говорится, что разработчики Stability AI ради коммерческой выгоды незаконно «скопировали и обработали» миллионы изображений, защищенных копирайтом.

🫵 Stable Diffusion часто ловят на том, что нейросеть генерирует изображения с узнаваемой вотермаркой Getty Images (см. выше).

Несколько дней назад к Stable Diffusion и еще одной нейросети Midjourney по тем же причинам подали коллективный иск в Калифорнии. Еще раньше в суд за ИИ-плагиат вызвали сервис Github, принадлежащий Microsoft.
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 Робот Boston Dynamics в новом видео играючи помогает на стройке

Когда батя пообещал тебе купить плойку за помощь с ремонтом дома
🔥4
Media is too big
VIEW IN TELEGRAM
ИИ-помощник, который сделает текст лучше и не возьмет за это денег 🫶

Стартап AI21 Labs (мы уже про него рассказывали) представил ассистента Wordtune Spices.

🧠 Текстовый редактор через контекстное меню может добавить в текст факт по теме, шутку, развернутое объяснение, контраргумент и так далее.

Spices борется и с вечным проклятием подобных сервисов — непроверенной информацией. Для любой информации, которую предложит вам помощник, можно посмотреть источник 📚.

Если вам кажется, что всё это слишком хорошо, чтобы быть правдой, то протестируйте ассистента бесплатно.
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Стартап придумал, как оценить эффективность виртуальной рекламы 💡

Компания Anzu, которая занимается размещением рекламы внутри видеоигр, запатентовала технологию, позволяющую замерить уровень просматриваемости (viewability) рекламных кампаний на цифровых билбордах 👀.

Разработка Anzu также может проанализировать эффективность рекламной кампании с точки зрения местоположения билборда в виртуальном пространстве и даже его расположения по отношению к игрокам. Например, система не считает за просмотр момент, когда игрок смотрел на рекламное объявление, но ему загородили обзор — как показано выше в ролике с грузовиком 🚛.

Технология замеряет просматриваемость несколько раз в секунду, используя комбинацию геометрических, физических и математических данных. На создание решения ушло 5 лет.

В области цифровой рекламы работает и Microsoft. В декабре компания подала заявку на патент для технологии, которая позволит размещать в играх персонализированную рекламу 👨‍🦰.
2
This media is not supported in your browser
VIEW IN TELEGRAM
Шоу «Голос»: китайцы показали ИИ, который генерируют лицевую анимацию только по звуку

Главная особенность алгоритма — он в первую очередь обучен на большом количестве звуковой информации, а не на визуальной. Это позволяет мультиязычной модели генерировать реалистичную лицевую анимацию, даже из некачественного исходного аудио. При этом анимации в каждом случае остаются уникальными.

Подробнее о технологии можно узнать из этого видео.

Недавно мы рассказывали о моделях, которые на основе речи могут создать полную трехмерную модель человека, а также генерируют лицевую анимацию на основе эмоционального состояния актера.
😱3
Ситуация следующая. Гендиректор компании OpenAI (модель GPT, ChatGPT) Сэм Альтман дал видеоинтервью изданию TechCrunch, в котором рассказал о следующей версии GPT и будущем ИИ. Мы решили посмотреть, кто лучше сделает выжимку речи Альтмана: искусственный интеллект или опытный медиа-аналитик.

Как мы это провернули. Мы использовали расширение Eightify для Chrome, которое обещает в любом YouTube-видео найти 8 ключевых идей — символично, что Eightify работает как раз на основе GPT от OpenAI. Затем мы попросили нашего аналитика посмотреть интервью и вручную сделать его выжимку.

Вот что у нас получилось:
👍3🔥3