Transformer
1.46K subscribers
19 photos
7 videos
3 files
50 links
Про ИИ и стартапы.

Денис Волхонский @den_vol. Рекламу не продаю
Download Telegram
Channel created
Привет, читатель!

Меня зовут Денис Волхонский.

На этом канале я буду рассказывать про искусственный интеллект (ИИ). Что это такое, и как он устроен изнутри. Я сам занимаюсь разработкой алгоритмов ИИ. Поэтому могу делиться с тобой деталями.

Я расскажу тебе про применения ИИ. Мы посмотрим на стартапы и крупные компании, которые используют его. Я буду разбираться, какие алгоритмы используются, и как они применяются.

Ещё я понятно расскажу о последних научных исследованиях: как создаются фотографии несуществующих людей, как анимировать фото, как создаются новые звуки и рассказы.

Моя цель — простым языком объяснить тебе, что там и как. Пока я буду тебе что-то рассказывать, я сам буду учиться. Ведь лучший способ что-то понять — это объяснить это тебе, мой читатель.

Ты всегда можешь написать мне в Telegram на @den_vol. Буду рад любой обратной связи.
👍3🔥1
Как нейросети обеспечивают privacy данных

Представьте, что у вас есть датасет. И вы хотите отдать его другой компании, чтобы она натренеровала алгоритмы машинного обучения на нём. Вы обезличиваете данные и отправляете им файлики. Звучит безопасно: подрядчик не знает, что это за люди. Он знает лишь их описание.

Компания mostly.ai утверждает, что это небезопасно. 80% людей можно идентифицировать по трём транзакциям по кредитке, когда известны лишь магазин и дата. 87% людей можно идентифицировать по их дате рождения, полу и ZIP-коду. Подрядчик может использовать эти данные не по назначению.

Решение такое: давайте будем генерировать данные, которые похожи на настоящие. Но это будут данные несуществующих людей. Такие данные можно смело отдавать подрядчику.

В основе решений используются генеративные нейронные сети. Их задача — сгенерировать несуществующие данные, которые похожи на реальные.

Игроков на рынке несколько: tonic.ai, synthesized.io, hazy.com. В основном это платформы: компания ставит себе программу, соединяет с БД и нажимает "Сгенерировать". Похожих российских компаний я не встречал.
👍1
​​Как сделать красивый таймлапс из одного фото

Что нужно, чтобы сделать красивый таймлапс? Фотограф должен прийти на место, установить штатив с камерой и ждать. Если он хочет на видео сделать смену дня и ночи — ждать нужно долго. Пойдёт дождь — всё по новой. Красота требует жертв.

На помощь приходит AI. В 2019 году появилась работа, в которой нейросеть анимирует пейзаж. Подаёте на вход одно фото, а на выходе получаете видео. Модель может как изменять время суток на фото, так и заставлять облака и воду двигаться.

Не удивлюсь, если в телефонах в скором времени появится функция "анимировать фото". А пока можно посмотреть, как это работает.
​​Как нейросети заменят иллюстраторов

Представьте, что вы пишете детский рассказ. Дети любят картинки. Поэтому существует работа иллюстратора — человека, создающего рисунки на основе текста. Может ли нейросеть заменить его?

Пока рано, но скоро заменит. Существует задача под названием text to image. Цель — построить нейронную сеть, которая принимает на вход текст и на выходе выдаёт изображение. Причём изображение должно соответствовать тектовому описанию.

Самая лучшая работа из тех, что я нашёл, называется MirrorGAN. Результат прикрепил картинкой к посту. Первая строчка — вход, предпоследняя — их результат. На самой последней строчке настоящие изображения. Видно, что есть ещё над чем работать.

Где это может применяться кроме книг? В Яндекс.Еде часто нет фото продуктов. Видимо, для магазина делать их дорого. Нейронка давала бы примерное представление о продукте.

Потенциально, из текста можно будет генерировать и видео. Написал сценарий мультфильма, нажал кнопку — получил результат. Не понравилось, попробовал ещё 100 раз.
​​Новости недели

По выходным буду рассказывать вам о интересных новостях из мира AI. Сегодня речь пойдёт о генераторе кода, который представила компания Илона Маска Open AI.

ИИ скоро заменит рутинные профессии. Не нужны будут водители, кассиры, работники call-центров. Но что будет с менее рутинными профессиями? Останется ли программист без работы?

Пока что речь идёт об ускорении разработки. Представьте, что вы словами диктуете то, что хотите запрогать. Нажимате кнопку. И получаете код. Магия? Нет, GPT-3. Эта модель для генерации текста, которую представили Open AI в этом году.

На этой неделе они показали, как из комментариев к коду автоматически генерировать код. Посмотрите видео. Модель генерирует простой, но рабочий год. Спустя время такой ассистент будет незаменимым для любого разработчика.

Сейчас я сам пользуюсь решением с ИИ для дополнения кода: tabnine.com. Он обучается на коде, который я пишу. Чем больше кода я написал, тем лучше он предсказывает.

Профит для бизнеса тут очевидный: разработчики быстрее пишут код. Один программист может сделать больше работы за то же время. А самых неэффективных кодеров можно увольнять.
​​Как заствить человека улыбаться, даже если он едет в метро (с помощью ИИ)

Недавно волну хайпа поймало приложение Face App. Оно добавляет на фото улыбку, делает человека на фото старее или моложе.

Чтобы добиться этого, решают задачу image to image translation. На вход картинка, на выход — тоже. Обычно для обучения нужно иметь набор однозначных соответствий между картинками. Например, фото одного и того же человека с улыбкой и без. Получить такую разметку — сложно.

На помощь приходит CycleGAN. Ему не нужно точных соответствий. Достаточно два папки картинок: в одной фото с улыбками, в другой без.

Внутри CycleGAN четыре нейросети. Два генератора переводят картинку с улыбкой в картинку без улыбки и обратно. Два дискриминатора пытаются понять, настоящая ли картинка на выходе генератора или нет.

Для обучения достаточно иметь по тысяче фото каждого типа. В следующем посте расскажу про многочисленные применения этой технологии. А пока можно посмотреть, как люди в метро начинают улыбаться:)
Редактируем фото с помощью нейросетей

Вчера рассказал вам про CycleGAN — модель для перевода одного изображение в другое. Я разбирал всё на конкретно примере: перевод фото лица без улыбки в лицо с улыбкой. У CycleGAN есть много других применений. Фото я собрал под постом

1. Превращаем фото персонажа Игры престолов в куклу
2. Делаем старые фото цветными
3. Любимого котика превращаем в пёселя
4. Из картины создаём пейзаж. Из пейзажа — картину
5. Фото превращаем в картины разных художников (Style Transfer)
6. Из лошади делаем зебру и наоборот. Яблоки превращаем в апельсины
7. Из GTA создаём реалистичную местность
8. Изменяем время года на фото

Пока что такие применения кажутся баловством. Но у этой технологии большой потенциал. С помощью неё можно расширять наборы данных для обучения. А ещё она применяется во всех современных айфонах. Об этом расскажу завтра.