D. Lab – Telegram

D. Lab

1.11K subscribers

503 photos

499 videos

1 file

900 links

Цифровая лаборатория Газпром-Медиа Холдинга — R&D, коллаборация, поиск точек роста.

Download Telegram

About

Blog

Apps

Platform

1.11K subscribers

This media is not supported in your browser

VIEW IN TELEGRAM

WebAI — новая no-code платформа для компьютерного зрения 👀

С помощью webAI разработчики могут создавать новые модели компьютерного зрения. Платформа позволит бизнесу быстро и бесплатно создавать прототипы продуктов на основе компьютерного зрения и уже потом принимать решение, инвестировать ли в это деньги.

Первая фишка webAI — это no-code платформа. Работать на ней может любой разработчик, а не только эксперт в области ИИ или машинного обучения. Для последних есть версия full-code. По словам одного из гендиректоров Iris Дэвида Стаута, в мире сейчас насчитывают 55 млн разработчиков софта и всего 300 тысяч экспертов в сфере ИИ 🤏.

Вторая особенность — webAI работает быстрее и на меньшем объеме данных. Например, по сравнению с платформой YoloV7, которая считается самым быстрым и точным софтом по обнаружению объектов для задач компьютерного зрения, webAI строит модели в 3 раза быстрее и использует в 5 раз меньше данных 💪. WebAI не нужны большие вычислительные мощности — для работы подойдут обычные ноутбуки.

Платформу создавали в течение 3 лет на основе собственной архитектуры Deep Detection. Потренировать на ней свои ИИ-модели пока не получится — бета-версию открыли только для 200 человек 🥺.

👍1

231 views10:01

Google представил самый быстрый генератор картинок на основе текста🏃‍♀️

Muse генерирует высококачественные изображения с рекордной скоростью — всего за 1,3 секунды 😱.

Такой эффективности удалось добиться благодаря использованию модели трансформера, а не диффузионной модели, на которой работает, например, Stable Diffusion.

Модель, использованная в Muse, натренирована на большой языковой модели, что позволяет нейросети точнее обрабатывать текстовые подсказки и генерировать на их основе более детализированные изображения. В частности, за счет того, что модель может «предсказать», что хотел увидеть пользователь, даже если не указал это в подсказке. Кроме того, изображения можно быстро редактировать, меняя отдельные слова в промпте.

При этом детализированность изображения не влияет на скорость его генерации. Это происходит благодаря использованию нескольких передовых алгоритмов, включая параллельное декодирование (это означает, что при работе Muse несколько процессов происходят одновременно, а не последовательно, что сокращает время генерации изображения).

По скорости Muse превосходит Stable Diffusion 1.4 почти на 2,5 секунды (1,3 секунды против 3,7 секунды)⏱.

Попробовать новую нейросеть пока не получится, но можно почитать исследовательскую работу о ней.

❤3👍1

227 views09:39

This media is not supported in your browser

VIEW IN TELEGRAM

Как обойти копирайт с помощью расширения для Chrome

Продолжаем рассказывать об интересных ИИ-расширениях для браузеров. Сегодня посмотрим, как с помощью программы Synthesys X создавать собственные версии любых изображений, найденных онлайн.

Synthesys X работает в браузере Chrome. Данное расширение с помощью ИИ анализирует объекты на изображении, создает на их основе текстовую подсказку, а затем генерирует максимально похожий аналог. Оценить сходство можно на видео выше.

Скачивать другие приложения или посещать сторонние сайты не придется, подчеркивают разработчики. Главное в Synthesys X: вы получаете все авторские права на новое творение и можете свободно и бесплатно его использовать.

Чтобы протестировать решение, установите его себе с сайта разработчика.

👍3🔥1

326 views13:01

🙅‍♂️Эксперимент с чат-ботом в психологии раскритиковали за неэтичность

Стартап Koko в сфере ментального здоровья недавно провел эксперимент: обучил чат-бота на основе GPT-3 отвечать на вопросы пользователей и запустил его в Discord. С синтетическим психологом успели пообщаться примерно 4000 человек. Целью теста в компании назвали создание доступного сервиса для тех, кто не может позволить себе услуги настоящего специалиста 💵.

В компании рассказали, что все шло хорошо, пока пользователи не узнали, что общаются с искусственным интеллектом: советы чат-бота нравились им больше тех, что написаны человеком, кроме того, у ИИ уходило на ответ меньше минуты . Однако как только люди узнавали, что общаются с «роботом», иллюзия рушилась и участники эксперимента больше не могли нормально воспринимать советы. Как объяснили в Koko, пользователям становилось не по себе от «симулированной эмпатии» 🤖.

Интересно, что после критики со стороны профессионального сообщества (ИИ мог нанести реальный ущерб человеку в нестабильном эмоциональном состоянии), в Koko заявили, что их не так поняли: на самом деле бот писал советы в коллаборации вместе с людьми, и участники эксперимента знали об этом 🤷‍♀️.

👏4🔥1

209 viewsedited 11:50

This media is not supported in your browser

VIEW IN TELEGRAM

Расширение для Chrome, которое простым языком объяснит сложные термины

Новый день — новое умное расширение для браузера! На этот раз разбираемся с ассистентом ExplainThis

ExplainThis может развернуто объяснить непонятный термин и ответить на уточняющие вопросы. Для этого нужно выделить слово или словосочетание, кликнуть по нему правой кнопкой мыши и выбрать Explain This.

Кроме того ИИ поможет, если нужно быстро понять содержание длинного текста и подготовит его краткий пересказ.

Расширение обещают запустить в наступившем году, пока на сайте продукта можно записаться в очередь.

🔥6👍1

222 views13:39

Искусственный интеллект работает адвокатом, играет в Minecraft, создает компьютерные вирусы — и другие интересные новости за неделю

✅ В США чат-бот поможет оспорить в суде штраф. Стартап DoNotPay выдаст не названному гражданину смартфон с установленным чат-ботом, который будет слушать доводы обвинения в режиме онлайн и подсказывать линию защиты;

✅ Microsoft собирается инвестировать еще $10 млрд в OpenAI — создателя ChatGPT. Оценочная стоимость компании может вырасти почти до $30 млрд. Вдохновленные разработчики уже готовят платную версию чат-бота;

✅ Киберпреступники тоже оценили возможности ChatGPT и пользуются им для создания вирусов. Пока вредоносные программы не слишком опасны, но специалисты бьют тревогу;

✅ Маркетинговое агентство наняло на работу двух «цифровых интернов», которые сами придумали себе имена и внешность. Айко и Айден будут заниматься графическим дизайном и редакторской работой;

✅ DeepMind научили ИИ играть в Minecraft. DreamerV3 может без помощи человека искать в игре алмазы — один из самых дефицитных ресурсов в Minecraft;

✅ Кроме обучения искусственного интеллекта игре в Minecraft, DeepMind также собирается в 2023-м году выпустить свой ответ ChatGPT под названием Sparrow.

👍4

233 views07:07

Темные лошадки: самые перспективные игроки на рынке ИИ, о которых мало кто знает

ИИ — это не только OpenAI и DeepMind. The Information выбрал шесть стартапов, которые могут стать конкурентами сегодняшних лидеров.

🖥 Adept AI Labs с помощью браузерного расширения автоматизируют выполнение заданий. Например, расширение через текстовую подсказку поможет найти в интернете предложения о сдаче жилья в городе по нужной вам цене и составить список вариантов. Компанию основали ключевые люди из Google Brain и OpenAI.

⌨️ AI21 Labs создают решения для автоматического копирайтинга, а также сервисы для разработки приложений на основе больших языковых моделей и инструменты для автоматического пересказа текстов. Создатели AI21 Labs до этого основали стартапы, которые потом успешно продали Intel и Google за миллиарды долларов.

🤝 Anthropic разрабатывают «толерантные» языковые модели — не генерирующие сексистский, расистский и другой неприемлемый контент. Компанию возглавляют брат и сестра — бывшие вице-президенты OpenAI. Оценочная стоимость Anthropic весной 2022 года достигла $4 млрд.

🧙 Character создают чат-боты, которые общаются с пользователем от лица разных персонажей — от Драко Малфоя до Зигмунда Фрейда. Их чат-боты могут создавать текстовые RPG, которые легко кастомизировать. Основатели Character — выходцы из Google и работали над перспективной языковой моделью LaMDA от Google.

🤖 Cohere работают над программой, которая позволит разработчикам добавлять в свои приложения чат-боты и функции, связанные с распознаванием языка. У стартапа уже есть договоренности о стратегическом партнерстве с Google, компания также ведет переговоры о привлечении инвестиций от Google и Nvidia.

🤷 Inflection занимаются пока непонятно чем. «Скоро у нас появится возможность делиться мыслями и идеями с компьютером тем же разговорным языком, который мы используем при общении с людьми»‌‎, — говорится на сайте компании. CEO Мустафа Сулейман был одним из основателей компании DeepMind, которую в 2014 году Google приобрел за полмиллиарда долларов.

👍7

249 views13:23

Новый выпуск нашего дайджеста новостей и трендов ин да хаус! Декабрь оказался богатым на важные новости.

В этот раз вы узнаете:

🟣 Зачем Netflix добавил в каталог фитнес;

🟣 Почему Apple разрешит устанавливать приложения не из App Store;

🟣 Как доля российского кино в прокате оказалось рекордной за всё время;

🟣 Куда из Twitter сбежали два миллиона пользователей;

И еще больше тем, которые останутся актуальными в ближайшие месяцы!

🔥2

207 views14:36

🚨 Американский ритейлер придумал, как с помощью блокчейна испортить жизнь ворам

Американская сеть магазинов по продаже товаров для дома и ремонта Lowe’s представила технологию Project Unlock на основе блокчейна и RFID-меток. Она блокирует товары, которые пронесли мимо кассы. Компания пошла на это из-за роста воровства в американском ритейле до $100 млрд 😱.

При заводской сборке на товар устанавливается несколько меток, каждая из которых имеет уникальный номер. На кассе эти метки считывают сканером, проданное устройство активируется — без этого товар использовать невозможно 🙅‍♀️.

Для дополнительной защиты используется блокчейн, в котором хранится обезличенная информация о покупке. Если вор попытается продать украденную вещь (которую он так и не смог активировать), товар можно будет легко вычислить 🫵.

🤔 У проекта есть несколько очевидных минусов: таким способом от воровства можно защитить только вещи, для работы которых требуется электричество. Кроме того, установка дополнительных меток при сборке усложнит процесс для производителя.

🔥4

208 views15:48

Forbes выбрал самые пугающие технологические тренды

🤡

Дипфейки в метавселенных. Синтетический контент — настоящее раздолье для мошенников. А в сочетании с метавселенными, где человек представлен только в виде цифрового аватара, возможностей для такой деятельности становится еще больше.

👌

Квантовые компьютеры. Такие устройства могут быть в триллионы раз мощнее тех, что доступны сегодня. Обратная сторона прогресса: квантовыми компьютерами будут пользоваться хакеры, которые смогут за несколько минут обойти современную защиту.

💡

Возможность напечатать что угодно. 3D-принтеры позволяют удешевить многие производственные процессы, но в тоже время на них можно печатать огнестрельное оружие, схемы которого лежат в интернете. В Британии уже появляются подпольные заводы, которые занимаются именно этим.

👋

Технологическая сингулярность. Так называют момент в будущем, когда машины станут умнее людей. Но искусственный интеллект уже сейчас может справиться со многими задачами лучше человека. Это приведет к тому, что до 90% сегодняшних профессий будут использовать ИИ, а в некоторых случаях ИИ полностью заменит человека.

🐣

«Редактируемые» люди. Технологии вроде CRISPR позволяют редактировать человеческие гены, — например, чтобы победить наследственные заболевания. Но эти методы плохо изучены и непонятно чем «отредактированные» гены грозят следующим поколениям. Многие страны запрещают подобные технологии, но в США и КНР они полностью легальны.

💪

Слияние людей и машин. Технологии уже позволяют улучшать зрение людей или заменять потерянные части тела. Но что если прогресс зайдет слишком далеко и технологии позволят создавать суперлюдей, которые, например, с помощью экзоскелетов получат невероятную силу?

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4👍1

222 views16:05

This media is not supported in your browser

VIEW IN TELEGRAM

🟥

ИИ поможет стримеру выбрать самые хайповые моменты в трансляции

Израильский стартап Playstream получил $2 млн инвестиций на развитие ИИ-модели, которая выбирает лучшие моменты из стримов.

Кратко: Spikes.gg AI Engine может за несколько секунд проанализировать часы видеоконтента и выбрать из него минуты, которые вызвали у зрителей самый сильный отзыв.

Подробнее: алгоритм выбирает эти моменты, ориентируясь на так называемые скачки (spikes) — эпизоды, когда зрители лайвстрима были наиболее вовлечены в просмотр. Скачком может быть что угодно: удачный выстрел в Fortnite или момент, когда к стримеру в прямом эфире присоединилась его кошка. Разработчики говорят, что их алгоритм анализирует не только аудио и видео, но и реакцию пользователей в чатах во время стрима.

Spikes.gg AI Engine способен не только находить такие моменты, но и ранжировать их по виральности. Выбранным моментом можно также за пару кликов поделиться в соцсетях. Разработчики считают, что используя моменты, выбранные ИИ, стример сможет привлечь к себе на канал рекламодателей и новую аудиторию.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

181 views07:51

Media is too big

VIEW IN TELEGRAM

👁 Модель компьютерного зрения YOLOv8 как вершина возможностей технологии

Только что вышедшая версия алгоритма с открытым кодом YOLO (You Only Look Once) может не только с высокой точностью и быстро определить объект на видео, но и классифицировать его.

Впечатляющие результаты работы модели можно оценить на видео выше 🎆.

Еще одна отличительная черта YOLOv8 в ее гибкости: модель можно запустить хоть на мини-компьютере Raspberry Pi, хоть на топовом компьютере. Для этого у модели существует 5 версий (Nano, S, M, L, XL), каждая из которых отличается точностью определения объектов и, соответственно, требовательностью к ресурсам 🏋️‍♂️.

Конечно, еще один большой плюс YOLO в ее бесплатности. Любой желающий может попробовать модель, скачав с Github.

🔥4👍1

206 views09:03

This media is not supported in your browser

VIEW IN TELEGRAM

💥

Microsoft показал нейросеть — подарок для 3D-художников

3D Avatar Diffusion может из одной портретной фотографии создать объемную цифровую модель человека. Как можно догадаться из названия, инструмент использует диффузионную модель, как и всеми любимые Stable Diffusion и Midjourney.

Нейромодель в первую очередь нацелена на упрощение жизни 3D-художников.

Нейросеть способна создавать аватары не только по фотографии, но и по текстовой подсказке. Получившиеся модели можно затем отредактировать также с помощью текстовой подсказки.

Похожий продукт недавно выпустил израильский стартап D-ID.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2

181 views13:33

👨‍💻

В AR появятся полностью интерактивные голографические объекты

Производитель голографических дисплеев VividQ и разработчик AR-решений Dispelix представили технологию, которая позволит корректно переносить голографические 3D-объекты в дополненную реальность.

Разработчики обещают, что технология позволит пользователям взаимодействовать с виртуальными объектами в AR «естественно и комфортно». В этом главное отличие разработки от решений вроде HoloLens от Microsoft, где объекты всегда двумерные, а из-за постоянного фокусного расстояния (то есть объекты всегда находятся на одном расстоянии от пользователя) у человека быстро устают глаза 😵‍💫.

«Пока все разрабатывали 2D-экран, который можно носить на лице, мы создавали „окно“, через которое можно одновременно взаимодействовать с реальным и виртуальным миром», — говорят разработчики 💪.

Please open Telegram to view this post

VIEW IN TELEGRAM

197 views15:13

🗣 Stable Diffusion хотят засудить

Фотоагентство Getty Images подало в суд на разработчиков нейросети Stable Diffusion за то, что ИИ тренировали на изображениях, которые являются интеллектуальной собственностью ©️.

В пресс-релизе Getty Images говорится, что разработчики Stability AI ради коммерческой выгоды незаконно «скопировали и обработали» миллионы изображений, защищенных копирайтом.

🫵 Stable Diffusion часто ловят на том, что нейросеть генерирует изображения с узнаваемой вотермаркой Getty Images (см. выше).

Несколько дней назад к Stable Diffusion и еще одной нейросети Midjourney по тем же причинам подали коллективный иск в Калифорнии. Еще раньше в суд за ИИ-плагиат вызвали сервис Github, принадлежащий Microsoft.

212 views06:49

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 Робот Boston Dynamics в новом видео играючи помогает на стройке

Когда батя пообещал тебе купить плойку за помощь с ремонтом дома

🔥4

259 views11:10

Media is too big

VIEW IN TELEGRAM

ИИ-помощник, который сделает текст лучше и не возьмет за это денег 🫶

Стартап AI21 Labs (мы уже про него рассказывали) представил ассистента Wordtune Spices.

🧠 Текстовый редактор через контекстное меню может добавить в текст факт по теме, шутку, развернутое объяснение, контраргумент и так далее.

Spices борется и с вечным проклятием подобных сервисов — непроверенной информацией. Для любой информации, которую предложит вам помощник, можно посмотреть источник 📚.

Если вам кажется, что всё это слишком хорошо, чтобы быть правдой, то протестируйте ассистента бесплатно.

🔥3

264 viewsedited 13:00

This media is not supported in your browser

VIEW IN TELEGRAM

Стартап придумал, как оценить эффективность виртуальной рекламы 💡

Компания Anzu, которая занимается размещением рекламы внутри видеоигр, запатентовала технологию, позволяющую замерить уровень просматриваемости (viewability) рекламных кампаний на цифровых билбордах 👀.

Разработка Anzu также может проанализировать эффективность рекламной кампании с точки зрения местоположения билборда в виртуальном пространстве и даже его расположения по отношению к игрокам. Например, система не считает за просмотр момент, когда игрок смотрел на рекламное объявление, но ему загородили обзор — как показано выше в ролике с грузовиком 🚛.

Технология замеряет просматриваемость несколько раз в секунду, используя комбинацию геометрических, физических и математических данных. На создание решения ушло 5 лет.

В области цифровой рекламы работает и Microsoft. В декабре компания подала заявку на патент для технологии, которая позволит размещать в играх персонализированную рекламу 👨‍🦰.

❤2

233 views14:48

This media is not supported in your browser

VIEW IN TELEGRAM

Шоу «Голос»: китайцы показали ИИ, который генерируют лицевую анимацию только по звуку

Главная особенность алгоритма — он в первую очередь обучен на большом количестве звуковой информации, а не на визуальной. Это позволяет мультиязычной модели генерировать реалистичную лицевую анимацию, даже из некачественного исходного аудио. При этом анимации в каждом случае остаются уникальными.

Подробнее о технологии можно узнать из этого видео.

Недавно мы рассказывали о моделях, которые на основе речи могут создать полную трехмерную модель человека, а также генерируют лицевую анимацию на основе эмоционального состояния актера.

😱3

213 views10:52

Ситуация следующая. Гендиректор компании OpenAI (модель GPT, ChatGPT) Сэм Альтман дал видеоинтервью изданию TechCrunch, в котором рассказал о следующей версии GPT и будущем ИИ. Мы решили посмотреть, кто лучше сделает выжимку речи Альтмана: искусственный интеллект или опытный медиа-аналитик.

Как мы это провернули. Мы использовали расширение Eightify для Chrome, которое обещает в любом YouTube-видео найти 8 ключевых идей — символично, что Eightify работает как раз на основе GPT от OpenAI. Затем мы попросили нашего аналитика посмотреть интервью и вручную сделать его выжимку.

Вот что у нас получилось:

👍3🔥3

217 viewsedited 15:48