Neurohive - Нейронные сети, AI, ML, DL
4.69K subscribers
263 photos
52 videos
1.42K links
Нейросети - свежие новости. State-of-the-art модели и методы, AI, Deep learning, Big data, Machine learning, NLP, Computer vision
Website: neurohive.io/ru/
По вопросам сотрудничества: @cyrud
Download Telegram
​​Нейросеть научилась распознавать лица в малом масштабе

Модель генерирует изображения высокого разрешения, используя исходные размытые фрагменты. В основе метода — генеративно-состязательная нейросеть (GAN), состоящая из генератора и дискриминатора. Структура генератора включает две нейросети: первая выделяет и увеличивает фрагменты лиц на фото, а вторая повышает их разрешение в 4 раза. В дискриминатор добавлена классификационная ветвь, которая позволяет не только распознавать лица и другие объекты, но и различать созданные и реальные изображения.

Метод показывает улучшенные результаты по сравнению с предыдущими подходами.
Нейронные сети вычислили фаворитов ЧМ по футболу FIFA 2018

Испания, Бразилия, Франция, Бельгия или Германия? Сравнение методов Random Forest ("Случайный леc"), регрессии Лассо и ранжирования для определения фаворитов Чемпионата Мира по футболу 2018.

Подробнее 👇
https://medium.com/@neurohiveru/нейросети-выбрали-фаворитов-чм-по-футболу-78b9576b33a6
Нейросеть превращает человека в аниме-персонажа

Twin-GAN может преобразовать портрет человека в аниме, кошачью морду или любого другого персонажа, в зависимости от входных данных.

В основе нейросети комбинация методов Neural Style Transfer и генеративно-состязательных нейросетей (GAN). Автор также использовал PGGAN  (передовую модель в создании изображений)  в качестве генератора, и нейросеть СycleGan для работы с непарными наборами данных. Подробнее про архитектуру и полученные результаты👇
https://vk.com/@neurohive-twingan-mezhdomennyi-perenos-chelovecheskih-portretov
Простой пример того, как нейросеть может помочь разработчику. Автор рассказывает, как на основе библиотеки brain.js написать приложение для автоподбора цвета текста в зависимости от цвета фона.

Интерфейс собран на фреймворке React. Обучите нейросеть на нужных вам цветах и используйте в своих задачах.

Видео 👇
https://youtu.be/W1SbBEjohJc
​​Uber представил веб-приложение для создания интерактивных карт

Kepler.gl — гибкий инструмент визуализации карт, основанный на работе со слоями. Kepler позволяет создавать наглядные многоуровневые карты, накладывая, фильтруя и суммируя данные. Слои, фильтры, базовые карты с низким контрастом и возможностью смешивания цветов делают Kepler очень гибким инструментом для создания красивых карт. Визуализации в считанные минуты можно экспортировать в статические карты или анимированные видео. Uber выложил свой инструмент open source.
Нейросеть от Nvidia превращает обычные видео в Slow-motion

Нейросеть автоматически генерирует новые кадры для создания плавного перехода на видео. Модель состоит из двух свёрточных нейросетей: первая анализирует движения объектов и прогнозирует новые движения для каждого кадра, а вторая интерполирует оптический поток и удаляет артефакты вокруг движущихся объектов.

Предложенный способ — это только имитация slow-mo. Скорее всего, разработчики ищут новые подходы к сжатию видео без видимых потерь качества.

Смотреть 👇
https://youtu.be/MjViy6kyiqs
Нейросеть создаёт детальную 3D-модель одежды на основе одной фотографии

Новый метод восстановления формы и свойств материалов, который можно применить для анимации одежды виртуальных персонажей и в приложениях «try-on» для примерки вещей. Алгоритм анализирует информацию о форме тела и особенностях ткани, сопоставляет и реконструирует в 3D-модель. Нейросеть полностью переносит дизайн, свойства материала и складки на ткани. 3D-модель меняет размер и подстраивается под позу человека на фотографиях, даже если он запечатлен в движении.

Видео 👇
https://youtu.be/_E3iFrEqJeI
Обработка 3D-облаков точек при помощи свёрточной нейросети

Исследователи из Австралии задались вопросом - почему СNN хуже справляются с 3D данными? Они предложили инновационный способ обработки данных облаков точек. Основная идея состоит в том, чтобы разбить трёхмерное облако точек на сферические ядра, и представить его в виде древовидной структуры. Метод позволит эффективно обрабатывать нерегулярные 3D облака точек.

Все результаты и сравнения с другими подходами 👇
https://vk.com/@neurohive-sfericheskie-cnn-yadra-dlya-trehmernyh-oblakov-tochek
GAN для создания и редактирования синтетических изображений в высоком разрешении

Разработчики из Nvidia представили генеративно-состязательную нейросеть (GAN), которая создаёт фотореалистичные изображения на основе семантических карт. Полученное изображение представляет собой виртуальную среду, которую можно изменять в интерактивном режиме: менять фон, добавлять объекты, стилизовать и менять их цвет и форму. Нейросеть основана на системе pix2pix, обучена на PyTorch, и состоит из «масштабирующего» генератора и дискриминатора.

Посмотреть как работает 👇
https://youtu.be/G6o_7Pz35Sk
Беспилотный автомобиль «Яндекс» совершил первую поездку между городами

Беспилотник «Яндекс.Такси» проехал 789 км из Москвы в Казань. Машина находилась в пути 11 часов и 99% времени работала в автоматическом режиме. Испытание проходило в условиях реального дорожного движения в дневное и ночное время суток и в разных погодных условиях: на части маршрута шёл сильный дождь. В машине во время поездки находился водитель, который мог принять управление, когда качество разметки и дороги не позволяло ехать на автопилоте.

«Яндекс» планирует продолжать испытания как на полигоне, так и на обычных дорогах для дальнейшего улучшения технологии.

Видео 👇
https://youtu.be/zljaMjLFqfI
​​Есть ли потребность в дорогостоящих датчиках для оценки глубины окружения?

Исследователи из Университетского колледжа Лондона разработали архитектуру для оценки карты глубины, которая может использоваться в беспилотных автомобилях. Сеть реализована на Pytorch и способна дать оценку глубины сцены, учитывая только цвета на изображении. Подробности в статье.
​​Google Cloud TPU доступны в Европе и Азии по предварительной цене

Тензорные процессоры Google (Tensor Processing Units, TPU), которые специально разработаны для ускорения глубокого обучения, теперь доступны на платформе Google Cloud, и выходят на европейский и азиатский рынок по цене на 70% ниже обычной. Например, обучение Cloud TPU бенчмарка ResNet-50 на датасете для классификации изображений с нуля стоит $7,50; а обучение RetinaNet распознаванию объектов — $12.

Один Cloud TPU (v2-8) поставляет до 180 TFLOPS и 64 ГБ памяти и является альтернативой графическим процессорам Nvidia.
​​В США разработчика уволил ИИ, и ни один человек не смог ничего сделать

Ибрагим Диалло рассказал в своём блоге, как машина увольняла его с работы, но никто не понимал в чём дело, и не мог отменить её действия. Сначала у Диалло перестал работать пропуск, затем был запрещен доступ к рабочим программам. В системе сотрудник числился уволенным, а рекрутёры и охрана получали письма о том, что его нужно лишить доступа к данным и выпроводить из офиса.

Разобраться, почему так происходит, в компании смогли только через 3 недели. Машинная система управления персоналом решила, что разработчик больше не является сотрудником компании, и запустила процесс увольнения, который нельзя было остановить, потому что он был полностью автоматизирован.
Нейросеть анализирует спортивные трансляции в реальном времени

Sportlogiq - стартап из Монреаля, который использует глубокое обучение и технологии компьютерного зрения для сбора спортивной аналитики из видео.

Нейросеть распознаёт и анализирует действия игроков и может составлять аналитику об их эффективности. Алгоритм тренировали на тысячах часов спортивных видео, используя графические процессоры Nvidia. Сейчас стартап работает в основном с хоккеем, но технология может применяться и для других видов спорта.

https://youtu.be/fiOYDTnO_fU
​​Интерактивное выделение объектов на видео с помощью попиксельного поиска

Исследователи из Цюриха предложили новый метод сегментации объектов с помощью попиксельного (pixel-wise) поиска в пространстве эмбеддинга. Модель построена с помощью обучения полной свёрточной сети и использует модифицированный triplet loss, специально предназначенный для выделения объектов на видео. Вручную размеченные пиксели являются эталонными образцами, а остальные пиксели классифицируются с помощью метода поиска ближайшего соседа.

Скорость вычислений превосходит существующие методы и делает модель наиболее подходящей для интерактивной сегментации объектов.
Новая open source библиотека c алгоритмами для обработки естественного языка от Intel

NLP Architect — открытая и гибкая библиотека для изучения и работы с актуальными архитектурами глубоких нейросетей и методами обработки и понимания текста. Библиотека содержит синтаксические анализаторы, state-of-the-art модели для понимания языка, модули для семантического анализа, основы для создания чат-ботов и другие инструменты для NLP и NLU.

Подробный обзор текущей версии NLP Architect в статье.

https://vk.com/@neurohive-nlp-architect-ot-intel-open-source-biblioteka-modelei-obrabo
ИИ от OpenAI победил полупрофессионалов в Dota 2

Команда из пяти нейронных сетей, OpenAI Five, начала побеждать любительские и полупрофессиональные команды в Dota 2. В основе алгоритма — расширенная версия Proximal Policy Optimization, работающая на 256 графических процессорах и 128 000 ядер. Система тренируется каждый день, играя против самой себя и проживая по 180 лет игрового времени. Для каждой нейросети используется отдельная LTSM, которая помогает анализировать окружающую среду и обходить препятствия.

Разработчики планируют провести матч против топ-игроков 28 июля 2018 года, трансляцию можно будет посмотреть на Twitch.

Смотреть видео: https://youtu.be/eHipy_j29Xw
​​Новые библиотеки для оптимизации данных и работы с изображениями от Nvidia

На конференции CVPR 2018 компания представила две библиотеки:
Nvidia DALI подходит для ускоренной загрузки изображений и оптимизации потоков данных для глубокого обучения. Имеет простую интеграцию с MxNet, TensorFlow и PyTorch и поддерживает различные форматы данных: JPEG, RAW, LMDB, RecordIO и TFRecord.
Nvidia nvJPEG — высокопроизводительная библиотека для декодирования JPEG, которая поддерживает декодирование одиночных и пакетных изображений, многофазное и гибридное декодирование с использованием как CPU, так и GPU. Позволяет преобразовывать цветовое пространство и поддерживает форматы RGB, BGR, RGBI, BGRI и YUV.

DALI доступна open source: https://github.com/NVIDIA/dali
nvJPEG можно скачать здесь: https://developer.nvidia.com/nvjpeg
Как выбрать GPU для обучения нейросети и сколько это стоит?

Или как найти компромисс между стоимостью и производительностью различных поставщиков GPU? В статье приведены результаты тестов Amazon Web Services AWS EC2, Google Cloud Engine GCE, IBM Softlayer, Hetzner, Paperspace и LeaderGPU как на сложных, так и на простых задачах.

Цель сравнения — показать, стоят ли дорогие инстансы своих денег. Автор статьи также рассказывает, для каких задач лучше использовать те или иные GPU, и как сэкономить на обучении моделей.

Читать:
https://medium.com/@neurohiveru/сравнение-cloud-gpu-для-машинного-обучения-amazon-google-hetzner-ibm-paperspace-leadergpu-3309a9414208
Adobe создали ИИ, который распознаёт «фотошоп» на фотографии

Нейросети уже умеют «фотошопить» фотографии в промышленном масштабе, а качество изменённых фото растет на глазах. Adobe представили технологию, которая должна сохранить доверие к СМИ и цифровым медиа. Искусственный интеллект определяет, была ли изменена фотография и обнаруживает участки изменений. Он сможет распознавать три вида манипуляций: удаление объектов, клонирование участков и склейку нескольких изображений.

ИИ за несколько секунд выявляет отредактированные участки, анализируя водяные знаки, разницу в контрасте и распределение шума на изображении. На видео показан результат работы, более подробно о техниках и методах работы нейросети мы расскажем на следующей неделе.

Смотреть:
https://youtu.be/7e5Q0TgPR54
Deep Drone Racing: исследователи научили дронов автономному полёту в меняющихся условиях

Учёные из Цюриха представили разработку, которая позволяет дронам автономно перемещаться между препятствиями и не врезаться ни в одно из них. Система использует свёрточную нейронную сеть (CNN) и современную систему планирования и управления траекторией. Нейросеть получает изображение со встроенной камеры на дроне, анализирует его, после чего планировщик корректирует курс, скорость и траекторию полёта.

Автономный квадрокоптер успешно справляется с полётом, даже если одно из препятствий меняет положение, однако в скорости всё ещё значительно уступает дрону под управлением пилота.

Смотреть:
https://youtu.be/8RILnqPxo1s