Transformer
1.46K subscribers
19 photos
7 videos
3 files
50 links
Про ИИ и стартапы.

Денис Волхонский @den_vol. Рекламу не продаю
Download Telegram
​​Как обучать self-driving car в GTA 5

Вчера я показал вам много применений CycleGAN — нейросети, которая переводит одно изображение в другое. Сложно представить ситуацию, где нам понадобится делать из апельсинов на фото яблоки. Оказывается, одна такая модель может упростить жизнь и сохранить денег.

Представим, что вы разрабатываете self-driving car. Вам нужно сделать алгоритмы, которые ориентируются в пространстве. Для этого нужно много данных. Очень много. Если машину с необученными алгоритмами пустить на улицу собирать данные — вы сядите в тюрьму за убийство.

Если будете сами управлять машиной — данные будете собирать долго. Безусловно, это нужно будет делать. Но процесс можно ускорить.

Знаете игру GTA? В ней продуманный реалистичный мир, в котором можно ездить на машине. Чем не плацдарм для сбора данных? А чтобы нарисованный мир был похож на наш, можно использовать CycleGAN.

А чтобы ещё расширить данные, можно опять применить CycleGAN: изменить время суток и время года. Так вы сможете обучать ваши алгоритмы не только в солнечные летние дни, но и среди сугробов.

С помощью одной модели AI и популярной игры можно получить много данных для обучения самопилотируемых алгоритмов. Причём на этой стадии машина не нужна.
👍1
​​Есть такая профессия — родину защищать. А ещё есть профессия дизайнера стульев. Человек, который вкладывает все свои эмоции, чтобы создать оригинальный стул. Там, где человек что-то создаёт, рано или поздно появится нейросеть, которая создаёт это за него.

Учёные из NVidia натравили генеративные нейросети на датасет из стульев. А потом люди воспроизвели наработки нейросети в реальной жизни. Получилось интересно (см фото под постом). Но долго на таком стуле не просидишь.
​​А молоко у вас когда привозят?

Пришли в магазин за молоком. А его там нет. Вы не получили того, что хотели. Магазин не получил клиента. Всем плохо.

Нужен кто-то, чтобы следить за всеми полками и бить тревогу, когда товар заканчивается. У кассиров не всегда есть такая возможность. Они могут пропустить товар, заниматься другими делами. В конце концов, им за это нужно платить.

Российский стартап neurus.ru решает эту проблему. Алгоритмы считывают видео с камер в магазине и анализируют наличие товаров. Такая система уже работает в магазинах Вкусвилл. Похожее решение есть у X5 — технические детали можно посмотреть тут. Помимо наличия товаров, камеры могут анализировать их разнообразие.

Профит для компании можно посчитать. Если увеличить доступность товаров на 3-4 процента, то прирост товарооборота увеличится на один процент.
Пост в видео-формате смотрите ниже.

На прошлой неделе mail.ru показала систему для создания виртуальных ведущих. Загружаете текст, выбираете диктора и получаете видео. Виртуальная девушка зачитывает ваш текст.

Если вы владелец B2C бизнеса — потенциально сможете создавать персональные(!) видео для пользователей. Например, ваш пользователь прошёл 10к шагов за день. Вылезает видео, в котором девушка говорит ему: "Молодец, Петя, ты наконец-то использовал свои умные часы по назначению".

Похожий стартап есть в Англии. Synthesia помогает создавать видео на основе вашего текста. Стартап выглядит более зрелым, но не поддерживает русский язык. Согласно crunchbase, суммарно они получили $4.1 млн инвестиций.

Со стороны AI могу сказать, что сейчас очень много разработок ведётся именно в генерации данных. Потенциально мы сможем заменить многие творческие профессии. А это может оказаться экономически выгоднее, чем заменять рутинные низкооплачиваемые профессии.
👍1
Редакция вернулась из отпуска. И начнёт своё вещание с крутой модельки от OpenAI.

Представьте, что вы написали книгу и хотите добавить картинок. Художники голодными быть не хотят, просят много денег. В этот момент вы можете заменить их труд на генератор картинок по текстовому описанию DALL.E.

Эта штука принимает на вход текст, который описывает, что должно быть на картинке. А на выходе вы получаете саму картинку. Да ещё какую. Да и не одну, а целых N штук. Нарисует вам художник столько?

Интересно, что моделька генерит ещё и то, что трезвому человеку бы не пришло на ум. Чайник в форме рыбы — пожалуйста. Кошка, сделанная из чеснока — а почему бы и нет.

Работает DALL.E на основе технологии Transformer. Та же самая технология выдаёт state of the art в генерации текста. Всего 12 миллиардов параметров.

Интересно, что эта модель не основана на ГАНах — нейросетях, которые все используют для генерации картинок. Так что эта работа — своего рода демонстрация миру, что можно по-другому.

Блог | Неофициальный GitHub
​​AI замена фитнесс-тренера

Одна персональная тренировка в зале в Москве стоит минимум 1000 рублей. За эту сумму вы получите услуги человека, который может быть неквалифицированным. Скорее всего, он даст вам шаблонную программу тренировок и будет следить за вашей техникой. Польза от этого, безусловно, есть.

Задачи тренера можно автоматизировать с помощью AI. И с этим неплохо справляется стартап Onyx. Это приложение для iPhone, которое руководит вашей тренировкой. И выполняет все те функции, которые мы ждём от физрука.

Оно не только говорит, какие упражнения делать. Onyx корректирует вашу технику и считает повторения, анализируя вашу позу. Приседаете с кривой спиной — оно попросит вас её выпрямить. Отжимаетесь недостаточно низко — скажет приседать ниже.

Стоит всё это удовольствие 1200 рублей в месяц. Для приложения дороговато, но не забывайте — надо сравнивать с тренером. Для желающих не платить есть бесплатные тренировки, которые меняются каждую неделю.

Я попробовал провести несколько тренировок. Тренировка проходит футуристично — телефон тебя видит и понимает, что ты делаешь. Но сам тренировочный контент мне не очень понравился. Слишком интенсивные тренировки длиной в 5-10 минут череваты проблемами для организма.

Для тех, кто не хочет тратить на тренировки по часу за раз — самое то. Для тех, кто хочет качественно покачаться, увы, не подойдёт.
​​Быстрая оценка позы от Google на любом устройстве

Гугл недавно выкатили модельку для оценки позы человека на фото и видео. Фишка их модели в том, что она очень лёгкая и быстрая. Её можно запустить на iOS, Android и даже в браузере. И она в реальном времени будет оценивать позу человека на видео.

Достигается лёгкость и скорость за счёт того, что сетка предсказывает координаты точек (x, y). Предыдущие модели обычно классифицировали каждый пиксель, что сильно замедляло их работу.

Как это можно использовать?

1. В фитнес-приложениях. С помощью оценки позы можно понять, что человек делать в упражнении не так. По такому принципу работают приложения Onyx, Zenia.
2. На предприятиях, чтобы понять, кто чем занимается. По позе не сложно отличить, работает ли человек или сплетничает у кулера.
3. Для перевода с языка жестов на русский. Чтобы это сделать, можно классифицировать последовательность поз.

Пост | Модель
​​ИИ вместо личного секретаря

Пандемия перевела почти весь мир в онлайн. Если раньше мы могли в любой момент организовать митинг в офисе, то теперь приходится договариваться о созвонах.

Найти время, которое всем удобно, не просто. Один может только вечером, другой вечером уже уедет, а третий не отвечает последние два часа. Если все эти люди в разных чатах, задача ещё усложняется. "Спроси Васю, когда Петя и Антон могут созвониться". Сложно.

Чтобы упростить организацию созвонов, нужен личный секретарь. Эту проблему закрывает стартап x.ai. Работает это так: вы указываете свою доступность и посылаете коллегам своё расписание. Они в пару кликов выбирают нужный временной слот.

Это ещё не всё. Когда у вас есть расписание доступности, вы пишите коллегам письмо, и ставите x.ai в копию. ИИ связывается со всеми адресатами и согласовывает время встречи.

Алгоритм распознаёт то, что вы пишите в письме. Например, вы пишите (на английском): "Привет, Лиза и Майк, давайте проведём встречу по проекту в начале следующей недели в моём офисе". После этого создаётся событие со всеми деталями: их ИИ достаёт из текста.

Для персонального использования сервис бесплатный. Для команды сервис стоит 15 долларов за человека в месяц. Всего сервис привлекал $45 млн инвестиций.
​​Я забыл, что хотел сказать

Наша память несовершенна. Сколько бы мы в школе не учили стихов, всё равно иногда говорим фразу "я забыл, что хотел сказать". И это не самое плохое. Иногда мы забываем то, что стоит помнить: счастливые моменты, интересные идеи, впечатления от поездок, воспоминания о родственниках.

На каждую проблему найдётся отважный предприниматель, который будет её решать. Стартап hu.man.ai решил заменить вашу плохую память с помощью цифровой.

Работает это следующим образом. Вы на родном английском пишите воспоминание. Например, "Прошлым летом мы ездили на шашлыки и нечаянно уронили всё мясо в мангал". Когда захотели вспомнить, что же там было, вы начинаете набирать в окошке "на шашлыках летом", а система выдаёт вам ваше воспоминание.

Под капотом — AI. Думаю, что используют какую-то архитектуру трансформеров. За сохранность данных отвечает блокчейн. На сайте пишут, что к данным ни у кого доступа не будет. И в фейсбуке таргет по воспоминаниям вы не увидите.

Интересно позиционирование стартапа. Внутри поиск предложений. Технология далеко не новая. Но продавать поиск по базе предложений не интересно. А вот оцифровать человеческую память — благородное занятие.

За всё время стартап поднял $3.2 млн. Пока что стартап на стадии сбора заявок на использование — я оставил и жду подтверждения. Хочу попробовать его в качестве хранилища инсайдов и идей, которые приходят в голову.