Как заствить человека улыбаться, даже если он едет в метро (с помощью ИИ)
Недавно волну хайпа поймало приложение Face App. Оно добавляет на фото улыбку, делает человека на фото старее или моложе.
Чтобы добиться этого, решают задачу image to image translation. На вход картинка, на выход — тоже. Обычно для обучения нужно иметь набор однозначных соответствий между картинками. Например, фото одного и того же человека с улыбкой и без. Получить такую разметку — сложно.
На помощь приходит CycleGAN. Ему не нужно точных соответствий. Достаточно два папки картинок: в одной фото с улыбками, в другой без.
Внутри CycleGAN четыре нейросети. Два генератора переводят картинку с улыбкой в картинку без улыбки и обратно. Два дискриминатора пытаются понять, настоящая ли картинка на выходе генератора или нет.
Для обучения достаточно иметь по тысяче фото каждого типа. В следующем посте расскажу про многочисленные применения этой технологии. А пока можно посмотреть, как люди в метро начинают улыбаться:)
Недавно волну хайпа поймало приложение Face App. Оно добавляет на фото улыбку, делает человека на фото старее или моложе.
Чтобы добиться этого, решают задачу image to image translation. На вход картинка, на выход — тоже. Обычно для обучения нужно иметь набор однозначных соответствий между картинками. Например, фото одного и того же человека с улыбкой и без. Получить такую разметку — сложно.
На помощь приходит CycleGAN. Ему не нужно точных соответствий. Достаточно два папки картинок: в одной фото с улыбками, в другой без.
Внутри CycleGAN четыре нейросети. Два генератора переводят картинку с улыбкой в картинку без улыбки и обратно. Два дискриминатора пытаются понять, настоящая ли картинка на выходе генератора или нет.
Для обучения достаточно иметь по тысяче фото каждого типа. В следующем посте расскажу про многочисленные применения этой технологии. А пока можно посмотреть, как люди в метро начинают улыбаться:)
Редактируем фото с помощью нейросетей
Вчера рассказал вам про CycleGAN — модель для перевода одного изображение в другое. Я разбирал всё на конкретно примере: перевод фото лица без улыбки в лицо с улыбкой. У CycleGAN есть много других применений. Фото я собрал под постом
1. Превращаем фото персонажа Игры престолов в куклу
2. Делаем старые фото цветными
3. Любимого котика превращаем в пёселя
4. Из картины создаём пейзаж. Из пейзажа — картину
5. Фото превращаем в картины разных художников (Style Transfer)
6. Из лошади делаем зебру и наоборот. Яблоки превращаем в апельсины
7. Из GTA создаём реалистичную местность
8. Изменяем время года на фото
Пока что такие применения кажутся баловством. Но у этой технологии большой потенциал. С помощью неё можно расширять наборы данных для обучения. А ещё она применяется во всех современных айфонах. Об этом расскажу завтра.
Вчера рассказал вам про CycleGAN — модель для перевода одного изображение в другое. Я разбирал всё на конкретно примере: перевод фото лица без улыбки в лицо с улыбкой. У CycleGAN есть много других применений. Фото я собрал под постом
1. Превращаем фото персонажа Игры престолов в куклу
2. Делаем старые фото цветными
3. Любимого котика превращаем в пёселя
4. Из картины создаём пейзаж. Из пейзажа — картину
5. Фото превращаем в картины разных художников (Style Transfer)
6. Из лошади делаем зебру и наоборот. Яблоки превращаем в апельсины
7. Из GTA создаём реалистичную местность
8. Изменяем время года на фото
Пока что такие применения кажутся баловством. Но у этой технологии большой потенциал. С помощью неё можно расширять наборы данных для обучения. А ещё она применяется во всех современных айфонах. Об этом расскажу завтра.
Как обучать self-driving car в GTA 5
Вчера я показал вам много применений CycleGAN — нейросети, которая переводит одно изображение в другое. Сложно представить ситуацию, где нам понадобится делать из апельсинов на фото яблоки. Оказывается, одна такая модель может упростить жизнь и сохранить денег.
Представим, что вы разрабатываете self-driving car. Вам нужно сделать алгоритмы, которые ориентируются в пространстве. Для этого нужно много данных. Очень много. Если машину с необученными алгоритмами пустить на улицу собирать данные — вы сядите в тюрьму за убийство.
Если будете сами управлять машиной — данные будете собирать долго. Безусловно, это нужно будет делать. Но процесс можно ускорить.
Знаете игру GTA? В ней продуманный реалистичный мир, в котором можно ездить на машине. Чем не плацдарм для сбора данных? А чтобы нарисованный мир был похож на наш, можно использовать CycleGAN.
А чтобы ещё расширить данные, можно опять применить CycleGAN: изменить время суток и время года. Так вы сможете обучать ваши алгоритмы не только в солнечные летние дни, но и среди сугробов.
С помощью одной модели AI и популярной игры можно получить много данных для обучения самопилотируемых алгоритмов. Причём на этой стадии машина не нужна.
Вчера я показал вам много применений CycleGAN — нейросети, которая переводит одно изображение в другое. Сложно представить ситуацию, где нам понадобится делать из апельсинов на фото яблоки. Оказывается, одна такая модель может упростить жизнь и сохранить денег.
Представим, что вы разрабатываете self-driving car. Вам нужно сделать алгоритмы, которые ориентируются в пространстве. Для этого нужно много данных. Очень много. Если машину с необученными алгоритмами пустить на улицу собирать данные — вы сядите в тюрьму за убийство.
Если будете сами управлять машиной — данные будете собирать долго. Безусловно, это нужно будет делать. Но процесс можно ускорить.
Знаете игру GTA? В ней продуманный реалистичный мир, в котором можно ездить на машине. Чем не плацдарм для сбора данных? А чтобы нарисованный мир был похож на наш, можно использовать CycleGAN.
А чтобы ещё расширить данные, можно опять применить CycleGAN: изменить время суток и время года. Так вы сможете обучать ваши алгоритмы не только в солнечные летние дни, но и среди сугробов.
С помощью одной модели AI и популярной игры можно получить много данных для обучения самопилотируемых алгоритмов. Причём на этой стадии машина не нужна.
👍1
Есть такая профессия — родину защищать. А ещё есть профессия дизайнера стульев. Человек, который вкладывает все свои эмоции, чтобы создать оригинальный стул. Там, где человек что-то создаёт, рано или поздно появится нейросеть, которая создаёт это за него.
Учёные из NVidia натравили генеративные нейросети на датасет из стульев. А потом люди воспроизвели наработки нейросети в реальной жизни. Получилось интересно (см фото под постом). Но долго на таком стуле не просидишь.
Учёные из NVidia натравили генеративные нейросети на датасет из стульев. А потом люди воспроизвели наработки нейросети в реальной жизни. Получилось интересно (см фото под постом). Но долго на таком стуле не просидишь.
А молоко у вас когда привозят?
Пришли в магазин за молоком. А его там нет. Вы не получили того, что хотели. Магазин не получил клиента. Всем плохо.
Нужен кто-то, чтобы следить за всеми полками и бить тревогу, когда товар заканчивается. У кассиров не всегда есть такая возможность. Они могут пропустить товар, заниматься другими делами. В конце концов, им за это нужно платить.
Российский стартап neurus.ru решает эту проблему. Алгоритмы считывают видео с камер в магазине и анализируют наличие товаров. Такая система уже работает в магазинах Вкусвилл. Похожее решение есть у X5 — технические детали можно посмотреть тут. Помимо наличия товаров, камеры могут анализировать их разнообразие.
Профит для компании можно посчитать. Если увеличить доступность товаров на 3-4 процента, то прирост товарооборота увеличится на один процент.
Пришли в магазин за молоком. А его там нет. Вы не получили того, что хотели. Магазин не получил клиента. Всем плохо.
Нужен кто-то, чтобы следить за всеми полками и бить тревогу, когда товар заканчивается. У кассиров не всегда есть такая возможность. Они могут пропустить товар, заниматься другими делами. В конце концов, им за это нужно платить.
Российский стартап neurus.ru решает эту проблему. Алгоритмы считывают видео с камер в магазине и анализируют наличие товаров. Такая система уже работает в магазинах Вкусвилл. Похожее решение есть у X5 — технические детали можно посмотреть тут. Помимо наличия товаров, камеры могут анализировать их разнообразие.
Профит для компании можно посчитать. Если увеличить доступность товаров на 3-4 процента, то прирост товарооборота увеличится на один процент.
Пост в видео-формате смотрите ниже.
На прошлой неделе mail.ru показала систему для создания виртуальных ведущих. Загружаете текст, выбираете диктора и получаете видео. Виртуальная девушка зачитывает ваш текст.
Если вы владелец B2C бизнеса — потенциально сможете создавать персональные(!) видео для пользователей. Например, ваш пользователь прошёл 10к шагов за день. Вылезает видео, в котором девушка говорит ему: "Молодец, Петя, ты наконец-то использовал свои умные часы по назначению".
Похожий стартап есть в Англии. Synthesia помогает создавать видео на основе вашего текста. Стартап выглядит более зрелым, но не поддерживает русский язык. Согласно crunchbase, суммарно они получили $4.1 млн инвестиций.
Со стороны AI могу сказать, что сейчас очень много разработок ведётся именно в генерации данных. Потенциально мы сможем заменить многие творческие профессии. А это может оказаться экономически выгоднее, чем заменять рутинные низкооплачиваемые профессии.
На прошлой неделе mail.ru показала систему для создания виртуальных ведущих. Загружаете текст, выбираете диктора и получаете видео. Виртуальная девушка зачитывает ваш текст.
Если вы владелец B2C бизнеса — потенциально сможете создавать персональные(!) видео для пользователей. Например, ваш пользователь прошёл 10к шагов за день. Вылезает видео, в котором девушка говорит ему: "Молодец, Петя, ты наконец-то использовал свои умные часы по назначению".
Похожий стартап есть в Англии. Synthesia помогает создавать видео на основе вашего текста. Стартап выглядит более зрелым, но не поддерживает русский язык. Согласно crunchbase, суммарно они получили $4.1 млн инвестиций.
Со стороны AI могу сказать, что сейчас очень много разработок ведётся именно в генерации данных. Потенциально мы сможем заменить многие творческие профессии. А это может оказаться экономически выгоднее, чем заменять рутинные низкооплачиваемые профессии.
👍1
Редакция вернулась из отпуска. И начнёт своё вещание с крутой модельки от OpenAI.
Представьте, что вы написали книгу и хотите добавить картинок. Художники голодными быть не хотят, просят много денег. В этот момент вы можете заменить их труд на генератор картинок по текстовому описанию DALL.E.
Эта штука принимает на вход текст, который описывает, что должно быть на картинке. А на выходе вы получаете саму картинку. Да ещё какую. Да и не одну, а целых N штук. Нарисует вам художник столько?
Интересно, что моделька генерит ещё и то, что трезвому человеку бы не пришло на ум. Чайник в форме рыбы — пожалуйста. Кошка, сделанная из чеснока — а почему бы и нет.
Работает DALL.E на основе технологии Transformer. Та же самая технология выдаёт state of the art в генерации текста. Всего 12 миллиардов параметров.
Интересно, что эта модель не основана на ГАНах — нейросетях, которые все используют для генерации картинок. Так что эта работа — своего рода демонстрация миру, что можно по-другому.
Блог | Неофициальный GitHub
Представьте, что вы написали книгу и хотите добавить картинок. Художники голодными быть не хотят, просят много денег. В этот момент вы можете заменить их труд на генератор картинок по текстовому описанию DALL.E.
Эта штука принимает на вход текст, который описывает, что должно быть на картинке. А на выходе вы получаете саму картинку. Да ещё какую. Да и не одну, а целых N штук. Нарисует вам художник столько?
Интересно, что моделька генерит ещё и то, что трезвому человеку бы не пришло на ум. Чайник в форме рыбы — пожалуйста. Кошка, сделанная из чеснока — а почему бы и нет.
Работает DALL.E на основе технологии Transformer. Та же самая технология выдаёт state of the art в генерации текста. Всего 12 миллиардов параметров.
Интересно, что эта модель не основана на ГАНах — нейросетях, которые все используют для генерации картинок. Так что эта работа — своего рода демонстрация миру, что можно по-другому.
Блог | Неофициальный GitHub
AI замена фитнесс-тренера
Одна персональная тренировка в зале в Москве стоит минимум 1000 рублей. За эту сумму вы получите услуги человека, который может быть неквалифицированным. Скорее всего, он даст вам шаблонную программу тренировок и будет следить за вашей техникой. Польза от этого, безусловно, есть.
Задачи тренера можно автоматизировать с помощью AI. И с этим неплохо справляется стартап Onyx. Это приложение для iPhone, которое руководит вашей тренировкой. И выполняет все те функции, которые мы ждём от физрука.
Оно не только говорит, какие упражнения делать. Onyx корректирует вашу технику и считает повторения, анализируя вашу позу. Приседаете с кривой спиной — оно попросит вас её выпрямить. Отжимаетесь недостаточно низко — скажет приседать ниже.
Стоит всё это удовольствие 1200 рублей в месяц. Для приложения дороговато, но не забывайте — надо сравнивать с тренером. Для желающих не платить есть бесплатные тренировки, которые меняются каждую неделю.
Я попробовал провести несколько тренировок. Тренировка проходит футуристично — телефон тебя видит и понимает, что ты делаешь. Но сам тренировочный контент мне не очень понравился. Слишком интенсивные тренировки длиной в 5-10 минут череваты проблемами для организма.
Для тех, кто не хочет тратить на тренировки по часу за раз — самое то. Для тех, кто хочет качественно покачаться, увы, не подойдёт.
Одна персональная тренировка в зале в Москве стоит минимум 1000 рублей. За эту сумму вы получите услуги человека, который может быть неквалифицированным. Скорее всего, он даст вам шаблонную программу тренировок и будет следить за вашей техникой. Польза от этого, безусловно, есть.
Задачи тренера можно автоматизировать с помощью AI. И с этим неплохо справляется стартап Onyx. Это приложение для iPhone, которое руководит вашей тренировкой. И выполняет все те функции, которые мы ждём от физрука.
Оно не только говорит, какие упражнения делать. Onyx корректирует вашу технику и считает повторения, анализируя вашу позу. Приседаете с кривой спиной — оно попросит вас её выпрямить. Отжимаетесь недостаточно низко — скажет приседать ниже.
Стоит всё это удовольствие 1200 рублей в месяц. Для приложения дороговато, но не забывайте — надо сравнивать с тренером. Для желающих не платить есть бесплатные тренировки, которые меняются каждую неделю.
Я попробовал провести несколько тренировок. Тренировка проходит футуристично — телефон тебя видит и понимает, что ты делаешь. Но сам тренировочный контент мне не очень понравился. Слишком интенсивные тренировки длиной в 5-10 минут череваты проблемами для организма.
Для тех, кто не хочет тратить на тренировки по часу за раз — самое то. Для тех, кто хочет качественно покачаться, увы, не подойдёт.
Быстрая оценка позы от Google на любом устройстве
Гугл недавно выкатили модельку для оценки позы человека на фото и видео. Фишка их модели в том, что она очень лёгкая и быстрая. Её можно запустить на iOS, Android и даже в браузере. И она в реальном времени будет оценивать позу человека на видео.
Достигается лёгкость и скорость за счёт того, что сетка предсказывает координаты точек (x, y). Предыдущие модели обычно классифицировали каждый пиксель, что сильно замедляло их работу.
Как это можно использовать?
1. В фитнес-приложениях. С помощью оценки позы можно понять, что человек делать в упражнении не так. По такому принципу работают приложения Onyx, Zenia.
2. На предприятиях, чтобы понять, кто чем занимается. По позе не сложно отличить, работает ли человек или сплетничает у кулера.
3. Для перевода с языка жестов на русский. Чтобы это сделать, можно классифицировать последовательность поз.
Пост | Модель
Гугл недавно выкатили модельку для оценки позы человека на фото и видео. Фишка их модели в том, что она очень лёгкая и быстрая. Её можно запустить на iOS, Android и даже в браузере. И она в реальном времени будет оценивать позу человека на видео.
Достигается лёгкость и скорость за счёт того, что сетка предсказывает координаты точек (x, y). Предыдущие модели обычно классифицировали каждый пиксель, что сильно замедляло их работу.
Как это можно использовать?
1. В фитнес-приложениях. С помощью оценки позы можно понять, что человек делать в упражнении не так. По такому принципу работают приложения Onyx, Zenia.
2. На предприятиях, чтобы понять, кто чем занимается. По позе не сложно отличить, работает ли человек или сплетничает у кулера.
3. Для перевода с языка жестов на русский. Чтобы это сделать, можно классифицировать последовательность поз.
Пост | Модель