Как нейросети обеспечивают privacy данных
Представьте, что у вас есть датасет. И вы хотите отдать его другой компании, чтобы она натренеровала алгоритмы машинного обучения на нём. Вы обезличиваете данные и отправляете им файлики. Звучит безопасно: подрядчик не знает, что это за люди. Он знает лишь их описание.
Компания mostly.ai утверждает, что это небезопасно. 80% людей можно идентифицировать по трём транзакциям по кредитке, когда известны лишь магазин и дата. 87% людей можно идентифицировать по их дате рождения, полу и ZIP-коду. Подрядчик может использовать эти данные не по назначению.
Решение такое: давайте будем генерировать данные, которые похожи на настоящие. Но это будут данные несуществующих людей. Такие данные можно смело отдавать подрядчику.
В основе решений используются генеративные нейронные сети. Их задача — сгенерировать несуществующие данные, которые похожи на реальные.
Игроков на рынке несколько: tonic.ai, synthesized.io, hazy.com. В основном это платформы: компания ставит себе программу, соединяет с БД и нажимает "Сгенерировать". Похожих российских компаний я не встречал.
Представьте, что у вас есть датасет. И вы хотите отдать его другой компании, чтобы она натренеровала алгоритмы машинного обучения на нём. Вы обезличиваете данные и отправляете им файлики. Звучит безопасно: подрядчик не знает, что это за люди. Он знает лишь их описание.
Компания mostly.ai утверждает, что это небезопасно. 80% людей можно идентифицировать по трём транзакциям по кредитке, когда известны лишь магазин и дата. 87% людей можно идентифицировать по их дате рождения, полу и ZIP-коду. Подрядчик может использовать эти данные не по назначению.
Решение такое: давайте будем генерировать данные, которые похожи на настоящие. Но это будут данные несуществующих людей. Такие данные можно смело отдавать подрядчику.
В основе решений используются генеративные нейронные сети. Их задача — сгенерировать несуществующие данные, которые похожи на реальные.
Игроков на рынке несколько: tonic.ai, synthesized.io, hazy.com. В основном это платформы: компания ставит себе программу, соединяет с БД и нажимает "Сгенерировать". Похожих российских компаний я не встречал.
👍1
Как сделать красивый таймлапс из одного фото
Что нужно, чтобы сделать красивый таймлапс? Фотограф должен прийти на место, установить штатив с камерой и ждать. Если он хочет на видео сделать смену дня и ночи — ждать нужно долго. Пойдёт дождь — всё по новой. Красота требует жертв.
На помощь приходит AI. В 2019 году появилась работа, в которой нейросеть анимирует пейзаж. Подаёте на вход одно фото, а на выходе получаете видео. Модель может как изменять время суток на фото, так и заставлять облака и воду двигаться.
Не удивлюсь, если в телефонах в скором времени появится функция "анимировать фото". А пока можно посмотреть, как это работает.
Что нужно, чтобы сделать красивый таймлапс? Фотограф должен прийти на место, установить штатив с камерой и ждать. Если он хочет на видео сделать смену дня и ночи — ждать нужно долго. Пойдёт дождь — всё по новой. Красота требует жертв.
На помощь приходит AI. В 2019 году появилась работа, в которой нейросеть анимирует пейзаж. Подаёте на вход одно фото, а на выходе получаете видео. Модель может как изменять время суток на фото, так и заставлять облака и воду двигаться.
Не удивлюсь, если в телефонах в скором времени появится функция "анимировать фото". А пока можно посмотреть, как это работает.
Как нейросети заменят иллюстраторов
Представьте, что вы пишете детский рассказ. Дети любят картинки. Поэтому существует работа иллюстратора — человека, создающего рисунки на основе текста. Может ли нейросеть заменить его?
Пока рано, но скоро заменит. Существует задача под названием text to image. Цель — построить нейронную сеть, которая принимает на вход текст и на выходе выдаёт изображение. Причём изображение должно соответствовать тектовому описанию.
Самая лучшая работа из тех, что я нашёл, называется MirrorGAN. Результат прикрепил картинкой к посту. Первая строчка — вход, предпоследняя — их результат. На самой последней строчке настоящие изображения. Видно, что есть ещё над чем работать.
Где это может применяться кроме книг? В Яндекс.Еде часто нет фото продуктов. Видимо, для магазина делать их дорого. Нейронка давала бы примерное представление о продукте.
Потенциально, из текста можно будет генерировать и видео. Написал сценарий мультфильма, нажал кнопку — получил результат. Не понравилось, попробовал ещё 100 раз.
Представьте, что вы пишете детский рассказ. Дети любят картинки. Поэтому существует работа иллюстратора — человека, создающего рисунки на основе текста. Может ли нейросеть заменить его?
Пока рано, но скоро заменит. Существует задача под названием text to image. Цель — построить нейронную сеть, которая принимает на вход текст и на выходе выдаёт изображение. Причём изображение должно соответствовать тектовому описанию.
Самая лучшая работа из тех, что я нашёл, называется MirrorGAN. Результат прикрепил картинкой к посту. Первая строчка — вход, предпоследняя — их результат. На самой последней строчке настоящие изображения. Видно, что есть ещё над чем работать.
Где это может применяться кроме книг? В Яндекс.Еде часто нет фото продуктов. Видимо, для магазина делать их дорого. Нейронка давала бы примерное представление о продукте.
Потенциально, из текста можно будет генерировать и видео. Написал сценарий мультфильма, нажал кнопку — получил результат. Не понравилось, попробовал ещё 100 раз.
Новости недели
По выходным буду рассказывать вам о интересных новостях из мира AI. Сегодня речь пойдёт о генераторе кода, который представила компания Илона Маска Open AI.
ИИ скоро заменит рутинные профессии. Не нужны будут водители, кассиры, работники call-центров. Но что будет с менее рутинными профессиями? Останется ли программист без работы?
Пока что речь идёт об ускорении разработки. Представьте, что вы словами диктуете то, что хотите запрогать. Нажимате кнопку. И получаете код. Магия? Нет, GPT-3. Эта модель для генерации текста, которую представили Open AI в этом году.
На этой неделе они показали, как из комментариев к коду автоматически генерировать код. Посмотрите видео. Модель генерирует простой, но рабочий год. Спустя время такой ассистент будет незаменимым для любого разработчика.
Сейчас я сам пользуюсь решением с ИИ для дополнения кода: tabnine.com. Он обучается на коде, который я пишу. Чем больше кода я написал, тем лучше он предсказывает.
Профит для бизнеса тут очевидный: разработчики быстрее пишут код. Один программист может сделать больше работы за то же время. А самых неэффективных кодеров можно увольнять.
По выходным буду рассказывать вам о интересных новостях из мира AI. Сегодня речь пойдёт о генераторе кода, который представила компания Илона Маска Open AI.
ИИ скоро заменит рутинные профессии. Не нужны будут водители, кассиры, работники call-центров. Но что будет с менее рутинными профессиями? Останется ли программист без работы?
Пока что речь идёт об ускорении разработки. Представьте, что вы словами диктуете то, что хотите запрогать. Нажимате кнопку. И получаете код. Магия? Нет, GPT-3. Эта модель для генерации текста, которую представили Open AI в этом году.
На этой неделе они показали, как из комментариев к коду автоматически генерировать код. Посмотрите видео. Модель генерирует простой, но рабочий год. Спустя время такой ассистент будет незаменимым для любого разработчика.
Сейчас я сам пользуюсь решением с ИИ для дополнения кода: tabnine.com. Он обучается на коде, который я пишу. Чем больше кода я написал, тем лучше он предсказывает.
Профит для бизнеса тут очевидный: разработчики быстрее пишут код. Один программист может сделать больше работы за то же время. А самых неэффективных кодеров можно увольнять.
Как заствить человека улыбаться, даже если он едет в метро (с помощью ИИ)
Недавно волну хайпа поймало приложение Face App. Оно добавляет на фото улыбку, делает человека на фото старее или моложе.
Чтобы добиться этого, решают задачу image to image translation. На вход картинка, на выход — тоже. Обычно для обучения нужно иметь набор однозначных соответствий между картинками. Например, фото одного и того же человека с улыбкой и без. Получить такую разметку — сложно.
На помощь приходит CycleGAN. Ему не нужно точных соответствий. Достаточно два папки картинок: в одной фото с улыбками, в другой без.
Внутри CycleGAN четыре нейросети. Два генератора переводят картинку с улыбкой в картинку без улыбки и обратно. Два дискриминатора пытаются понять, настоящая ли картинка на выходе генератора или нет.
Для обучения достаточно иметь по тысяче фото каждого типа. В следующем посте расскажу про многочисленные применения этой технологии. А пока можно посмотреть, как люди в метро начинают улыбаться:)
Недавно волну хайпа поймало приложение Face App. Оно добавляет на фото улыбку, делает человека на фото старее или моложе.
Чтобы добиться этого, решают задачу image to image translation. На вход картинка, на выход — тоже. Обычно для обучения нужно иметь набор однозначных соответствий между картинками. Например, фото одного и того же человека с улыбкой и без. Получить такую разметку — сложно.
На помощь приходит CycleGAN. Ему не нужно точных соответствий. Достаточно два папки картинок: в одной фото с улыбками, в другой без.
Внутри CycleGAN четыре нейросети. Два генератора переводят картинку с улыбкой в картинку без улыбки и обратно. Два дискриминатора пытаются понять, настоящая ли картинка на выходе генератора или нет.
Для обучения достаточно иметь по тысяче фото каждого типа. В следующем посте расскажу про многочисленные применения этой технологии. А пока можно посмотреть, как люди в метро начинают улыбаться:)
Редактируем фото с помощью нейросетей
Вчера рассказал вам про CycleGAN — модель для перевода одного изображение в другое. Я разбирал всё на конкретно примере: перевод фото лица без улыбки в лицо с улыбкой. У CycleGAN есть много других применений. Фото я собрал под постом
1. Превращаем фото персонажа Игры престолов в куклу
2. Делаем старые фото цветными
3. Любимого котика превращаем в пёселя
4. Из картины создаём пейзаж. Из пейзажа — картину
5. Фото превращаем в картины разных художников (Style Transfer)
6. Из лошади делаем зебру и наоборот. Яблоки превращаем в апельсины
7. Из GTA создаём реалистичную местность
8. Изменяем время года на фото
Пока что такие применения кажутся баловством. Но у этой технологии большой потенциал. С помощью неё можно расширять наборы данных для обучения. А ещё она применяется во всех современных айфонах. Об этом расскажу завтра.
Вчера рассказал вам про CycleGAN — модель для перевода одного изображение в другое. Я разбирал всё на конкретно примере: перевод фото лица без улыбки в лицо с улыбкой. У CycleGAN есть много других применений. Фото я собрал под постом
1. Превращаем фото персонажа Игры престолов в куклу
2. Делаем старые фото цветными
3. Любимого котика превращаем в пёселя
4. Из картины создаём пейзаж. Из пейзажа — картину
5. Фото превращаем в картины разных художников (Style Transfer)
6. Из лошади делаем зебру и наоборот. Яблоки превращаем в апельсины
7. Из GTA создаём реалистичную местность
8. Изменяем время года на фото
Пока что такие применения кажутся баловством. Но у этой технологии большой потенциал. С помощью неё можно расширять наборы данных для обучения. А ещё она применяется во всех современных айфонах. Об этом расскажу завтра.
Как обучать self-driving car в GTA 5
Вчера я показал вам много применений CycleGAN — нейросети, которая переводит одно изображение в другое. Сложно представить ситуацию, где нам понадобится делать из апельсинов на фото яблоки. Оказывается, одна такая модель может упростить жизнь и сохранить денег.
Представим, что вы разрабатываете self-driving car. Вам нужно сделать алгоритмы, которые ориентируются в пространстве. Для этого нужно много данных. Очень много. Если машину с необученными алгоритмами пустить на улицу собирать данные — вы сядите в тюрьму за убийство.
Если будете сами управлять машиной — данные будете собирать долго. Безусловно, это нужно будет делать. Но процесс можно ускорить.
Знаете игру GTA? В ней продуманный реалистичный мир, в котором можно ездить на машине. Чем не плацдарм для сбора данных? А чтобы нарисованный мир был похож на наш, можно использовать CycleGAN.
А чтобы ещё расширить данные, можно опять применить CycleGAN: изменить время суток и время года. Так вы сможете обучать ваши алгоритмы не только в солнечные летние дни, но и среди сугробов.
С помощью одной модели AI и популярной игры можно получить много данных для обучения самопилотируемых алгоритмов. Причём на этой стадии машина не нужна.
Вчера я показал вам много применений CycleGAN — нейросети, которая переводит одно изображение в другое. Сложно представить ситуацию, где нам понадобится делать из апельсинов на фото яблоки. Оказывается, одна такая модель может упростить жизнь и сохранить денег.
Представим, что вы разрабатываете self-driving car. Вам нужно сделать алгоритмы, которые ориентируются в пространстве. Для этого нужно много данных. Очень много. Если машину с необученными алгоритмами пустить на улицу собирать данные — вы сядите в тюрьму за убийство.
Если будете сами управлять машиной — данные будете собирать долго. Безусловно, это нужно будет делать. Но процесс можно ускорить.
Знаете игру GTA? В ней продуманный реалистичный мир, в котором можно ездить на машине. Чем не плацдарм для сбора данных? А чтобы нарисованный мир был похож на наш, можно использовать CycleGAN.
А чтобы ещё расширить данные, можно опять применить CycleGAN: изменить время суток и время года. Так вы сможете обучать ваши алгоритмы не только в солнечные летние дни, но и среди сугробов.
С помощью одной модели AI и популярной игры можно получить много данных для обучения самопилотируемых алгоритмов. Причём на этой стадии машина не нужна.
👍1
Есть такая профессия — родину защищать. А ещё есть профессия дизайнера стульев. Человек, который вкладывает все свои эмоции, чтобы создать оригинальный стул. Там, где человек что-то создаёт, рано или поздно появится нейросеть, которая создаёт это за него.
Учёные из NVidia натравили генеративные нейросети на датасет из стульев. А потом люди воспроизвели наработки нейросети в реальной жизни. Получилось интересно (см фото под постом). Но долго на таком стуле не просидишь.
Учёные из NVidia натравили генеративные нейросети на датасет из стульев. А потом люди воспроизвели наработки нейросети в реальной жизни. Получилось интересно (см фото под постом). Но долго на таком стуле не просидишь.
А молоко у вас когда привозят?
Пришли в магазин за молоком. А его там нет. Вы не получили того, что хотели. Магазин не получил клиента. Всем плохо.
Нужен кто-то, чтобы следить за всеми полками и бить тревогу, когда товар заканчивается. У кассиров не всегда есть такая возможность. Они могут пропустить товар, заниматься другими делами. В конце концов, им за это нужно платить.
Российский стартап neurus.ru решает эту проблему. Алгоритмы считывают видео с камер в магазине и анализируют наличие товаров. Такая система уже работает в магазинах Вкусвилл. Похожее решение есть у X5 — технические детали можно посмотреть тут. Помимо наличия товаров, камеры могут анализировать их разнообразие.
Профит для компании можно посчитать. Если увеличить доступность товаров на 3-4 процента, то прирост товарооборота увеличится на один процент.
Пришли в магазин за молоком. А его там нет. Вы не получили того, что хотели. Магазин не получил клиента. Всем плохо.
Нужен кто-то, чтобы следить за всеми полками и бить тревогу, когда товар заканчивается. У кассиров не всегда есть такая возможность. Они могут пропустить товар, заниматься другими делами. В конце концов, им за это нужно платить.
Российский стартап neurus.ru решает эту проблему. Алгоритмы считывают видео с камер в магазине и анализируют наличие товаров. Такая система уже работает в магазинах Вкусвилл. Похожее решение есть у X5 — технические детали можно посмотреть тут. Помимо наличия товаров, камеры могут анализировать их разнообразие.
Профит для компании можно посчитать. Если увеличить доступность товаров на 3-4 процента, то прирост товарооборота увеличится на один процент.
Пост в видео-формате смотрите ниже.
На прошлой неделе mail.ru показала систему для создания виртуальных ведущих. Загружаете текст, выбираете диктора и получаете видео. Виртуальная девушка зачитывает ваш текст.
Если вы владелец B2C бизнеса — потенциально сможете создавать персональные(!) видео для пользователей. Например, ваш пользователь прошёл 10к шагов за день. Вылезает видео, в котором девушка говорит ему: "Молодец, Петя, ты наконец-то использовал свои умные часы по назначению".
Похожий стартап есть в Англии. Synthesia помогает создавать видео на основе вашего текста. Стартап выглядит более зрелым, но не поддерживает русский язык. Согласно crunchbase, суммарно они получили $4.1 млн инвестиций.
Со стороны AI могу сказать, что сейчас очень много разработок ведётся именно в генерации данных. Потенциально мы сможем заменить многие творческие профессии. А это может оказаться экономически выгоднее, чем заменять рутинные низкооплачиваемые профессии.
На прошлой неделе mail.ru показала систему для создания виртуальных ведущих. Загружаете текст, выбираете диктора и получаете видео. Виртуальная девушка зачитывает ваш текст.
Если вы владелец B2C бизнеса — потенциально сможете создавать персональные(!) видео для пользователей. Например, ваш пользователь прошёл 10к шагов за день. Вылезает видео, в котором девушка говорит ему: "Молодец, Петя, ты наконец-то использовал свои умные часы по назначению".
Похожий стартап есть в Англии. Synthesia помогает создавать видео на основе вашего текста. Стартап выглядит более зрелым, но не поддерживает русский язык. Согласно crunchbase, суммарно они получили $4.1 млн инвестиций.
Со стороны AI могу сказать, что сейчас очень много разработок ведётся именно в генерации данных. Потенциально мы сможем заменить многие творческие профессии. А это может оказаться экономически выгоднее, чем заменять рутинные низкооплачиваемые профессии.
👍1
Редакция вернулась из отпуска. И начнёт своё вещание с крутой модельки от OpenAI.
Представьте, что вы написали книгу и хотите добавить картинок. Художники голодными быть не хотят, просят много денег. В этот момент вы можете заменить их труд на генератор картинок по текстовому описанию DALL.E.
Эта штука принимает на вход текст, который описывает, что должно быть на картинке. А на выходе вы получаете саму картинку. Да ещё какую. Да и не одну, а целых N штук. Нарисует вам художник столько?
Интересно, что моделька генерит ещё и то, что трезвому человеку бы не пришло на ум. Чайник в форме рыбы — пожалуйста. Кошка, сделанная из чеснока — а почему бы и нет.
Работает DALL.E на основе технологии Transformer. Та же самая технология выдаёт state of the art в генерации текста. Всего 12 миллиардов параметров.
Интересно, что эта модель не основана на ГАНах — нейросетях, которые все используют для генерации картинок. Так что эта работа — своего рода демонстрация миру, что можно по-другому.
Блог | Неофициальный GitHub
Представьте, что вы написали книгу и хотите добавить картинок. Художники голодными быть не хотят, просят много денег. В этот момент вы можете заменить их труд на генератор картинок по текстовому описанию DALL.E.
Эта штука принимает на вход текст, который описывает, что должно быть на картинке. А на выходе вы получаете саму картинку. Да ещё какую. Да и не одну, а целых N штук. Нарисует вам художник столько?
Интересно, что моделька генерит ещё и то, что трезвому человеку бы не пришло на ум. Чайник в форме рыбы — пожалуйста. Кошка, сделанная из чеснока — а почему бы и нет.
Работает DALL.E на основе технологии Transformer. Та же самая технология выдаёт state of the art в генерации текста. Всего 12 миллиардов параметров.
Интересно, что эта модель не основана на ГАНах — нейросетях, которые все используют для генерации картинок. Так что эта работа — своего рода демонстрация миру, что можно по-другому.
Блог | Неофициальный GitHub