Нейросеть научилась распознавать лица в малом масштабе
Модель генерирует изображения высокого разрешения, используя исходные размытые фрагменты. В основе метода — генеративно-состязательная нейросеть (GAN), состоящая из генератора и дискриминатора. Структура генератора включает две нейросети: первая выделяет и увеличивает фрагменты лиц на фото, а вторая повышает их разрешение в 4 раза. В дискриминатор добавлена классификационная ветвь, которая позволяет не только распознавать лица и другие объекты, но и различать созданные и реальные изображения.
Метод показывает улучшенные результаты по сравнению с предыдущими подходами.
Модель генерирует изображения высокого разрешения, используя исходные размытые фрагменты. В основе метода — генеративно-состязательная нейросеть (GAN), состоящая из генератора и дискриминатора. Структура генератора включает две нейросети: первая выделяет и увеличивает фрагменты лиц на фото, а вторая повышает их разрешение в 4 раза. В дискриминатор добавлена классификационная ветвь, которая позволяет не только распознавать лица и другие объекты, но и различать созданные и реальные изображения.
Метод показывает улучшенные результаты по сравнению с предыдущими подходами.
Нейронные сети вычислили фаворитов ЧМ по футболу FIFA 2018
Испания, Бразилия, Франция, Бельгия или Германия? Сравнение методов Random Forest ("Случайный леc"), регрессии Лассо и ранжирования для определения фаворитов Чемпионата Мира по футболу 2018.
Подробнее 👇
https://medium.com/@neurohiveru/нейросети-выбрали-фаворитов-чм-по-футболу-78b9576b33a6
Испания, Бразилия, Франция, Бельгия или Германия? Сравнение методов Random Forest ("Случайный леc"), регрессии Лассо и ранжирования для определения фаворитов Чемпионата Мира по футболу 2018.
Подробнее 👇
https://medium.com/@neurohiveru/нейросети-выбрали-фаворитов-чм-по-футболу-78b9576b33a6
Medium
Нейросети выбрали фаворитов ЧМ по футболу
Сравниваем подходы Random Forest, Poisson Regression и Ranking Methods
Нейросеть превращает человека в аниме-персонажа
Twin-GAN может преобразовать портрет человека в аниме, кошачью морду или любого другого персонажа, в зависимости от входных данных.
В основе нейросети комбинация методов Neural Style Transfer и генеративно-состязательных нейросетей (GAN). Автор также использовал PGGAN (передовую модель в создании изображений) в качестве генератора, и нейросеть СycleGan для работы с непарными наборами данных. Подробнее про архитектуру и полученные результаты👇
https://vk.com/@neurohive-twingan-mezhdomennyi-perenos-chelovecheskih-portretov
Twin-GAN может преобразовать портрет человека в аниме, кошачью морду или любого другого персонажа, в зависимости от входных данных.
В основе нейросети комбинация методов Neural Style Transfer и генеративно-состязательных нейросетей (GAN). Автор также использовал PGGAN (передовую модель в создании изображений) в качестве генератора, и нейросеть СycleGan для работы с непарными наборами данных. Подробнее про архитектуру и полученные результаты👇
https://vk.com/@neurohive-twingan-mezhdomennyi-perenos-chelovecheskih-portretov
Vk
TwinGAN — междоменный перенос человеческих портретов
С тех пор как Джерри Ли, автор этой статьи, начал смотреть аниме, одна мысль не давала ем покоя: он просто не умеет рисовать. После многочисленных попыток, которые закончились “уничтожением” любимых персонажей, он сдался… пока не начал заниматься машинным…
Простой пример того, как нейросеть может помочь разработчику. Автор рассказывает, как на основе библиотеки brain.js написать приложение для автоподбора цвета текста в зависимости от цвета фона.
Интерфейс собран на фреймворке React. Обучите нейросеть на нужных вам цветах и используйте в своих задачах.
Видео 👇
https://youtu.be/W1SbBEjohJc
Интерфейс собран на фреймворке React. Обучите нейросеть на нужных вам цветах и используйте в своих задачах.
Видео 👇
https://youtu.be/W1SbBEjohJc
YouTube
Brain.js Нейронные сети в JavaScript
Видео посвещено теме нейронных сетей. Мы попытаемся разобраться как использовать библиотеку brain.js в web-разработке.
Ссылка на проект, использованный в ролике: https://github.com/ubcent/brain-color
Ссылка на проект, использованный в ролике: https://github.com/ubcent/brain-color
Uber представил веб-приложение для создания интерактивных карт
Kepler.gl — гибкий инструмент визуализации карт, основанный на работе со слоями. Kepler позволяет создавать наглядные многоуровневые карты, накладывая, фильтруя и суммируя данные. Слои, фильтры, базовые карты с низким контрастом и возможностью смешивания цветов делают Kepler очень гибким инструментом для создания красивых карт. Визуализации в считанные минуты можно экспортировать в статические карты или анимированные видео. Uber выложил свой инструмент open source.
Kepler.gl — гибкий инструмент визуализации карт, основанный на работе со слоями. Kepler позволяет создавать наглядные многоуровневые карты, накладывая, фильтруя и суммируя данные. Слои, фильтры, базовые карты с низким контрастом и возможностью смешивания цветов делают Kepler очень гибким инструментом для создания красивых карт. Визуализации в считанные минуты можно экспортировать в статические карты или анимированные видео. Uber выложил свой инструмент open source.
Нейросеть от Nvidia превращает обычные видео в Slow-motion
Нейросеть автоматически генерирует новые кадры для создания плавного перехода на видео. Модель состоит из двух свёрточных нейросетей: первая анализирует движения объектов и прогнозирует новые движения для каждого кадра, а вторая интерполирует оптический поток и удаляет артефакты вокруг движущихся объектов.
Предложенный способ — это только имитация slow-mo. Скорее всего, разработчики ищут новые подходы к сжатию видео без видимых потерь качества.
Смотреть 👇
https://youtu.be/MjViy6kyiqs
Нейросеть автоматически генерирует новые кадры для создания плавного перехода на видео. Модель состоит из двух свёрточных нейросетей: первая анализирует движения объектов и прогнозирует новые движения для каждого кадра, а вторая интерполирует оптический поток и удаляет артефакты вокруг движущихся объектов.
Предложенный способ — это только имитация slow-mo. Скорее всего, разработчики ищут новые подходы к сжатию видео без видимых потерь качества.
Смотреть 👇
https://youtu.be/MjViy6kyiqs
YouTube
Research at NVIDIA: Transforming Standard Video Into Slow Motion with AI
Researchers from NVIDIA developed a deep learning-based system that can produce high-quality slow-motion videos from a 30-frame-per-second video, outperforming various state-of-the-art methods that aim to do the same.
Learn more: https://nvda.ws/2Mr2ZPt…
Learn more: https://nvda.ws/2Mr2ZPt…
Нейросеть создаёт детальную 3D-модель одежды на основе одной фотографии
Новый метод восстановления формы и свойств материалов, который можно применить для анимации одежды виртуальных персонажей и в приложениях «try-on» для примерки вещей. Алгоритм анализирует информацию о форме тела и особенностях ткани, сопоставляет и реконструирует в 3D-модель. Нейросеть полностью переносит дизайн, свойства материала и складки на ткани. 3D-модель меняет размер и подстраивается под позу человека на фотографиях, даже если он запечатлен в движении.
Видео 👇
https://youtu.be/_E3iFrEqJeI
Новый метод восстановления формы и свойств материалов, который можно применить для анимации одежды виртуальных персонажей и в приложениях «try-on» для примерки вещей. Алгоритм анализирует информацию о форме тела и особенностях ткани, сопоставляет и реконструирует в 3D-модель. Нейросеть полностью переносит дизайн, свойства материала и складки на ткани. 3D-модель меняет размер и подстраивается под позу человека на фотографиях, даже если он запечатлен в движении.
Видео 👇
https://youtu.be/_E3iFrEqJeI
Обработка 3D-облаков точек при помощи свёрточной нейросети
Исследователи из Австралии задались вопросом - почему СNN хуже справляются с 3D данными? Они предложили инновационный способ обработки данных облаков точек. Основная идея состоит в том, чтобы разбить трёхмерное облако точек на сферические ядра, и представить его в виде древовидной структуры. Метод позволит эффективно обрабатывать нерегулярные 3D облака точек.
Все результаты и сравнения с другими подходами 👇
https://vk.com/@neurohive-sfericheskie-cnn-yadra-dlya-trehmernyh-oblakov-tochek
Исследователи из Австралии задались вопросом - почему СNN хуже справляются с 3D данными? Они предложили инновационный способ обработки данных облаков точек. Основная идея состоит в том, чтобы разбить трёхмерное облако точек на сферические ядра, и представить его в виде древовидной структуры. Метод позволит эффективно обрабатывать нерегулярные 3D облака точек.
Все результаты и сравнения с другими подходами 👇
https://vk.com/@neurohive-sfericheskie-cnn-yadra-dlya-trehmernyh-oblakov-tochek
Vk
Сферические CNN-ядра для трехмерных облаков точек
В задачах структурирования данных облака точек представляются как неупорядоченные множества векторов. Эти облака — специфичный тип данных, сильно отличающийся от других, таких как фото или видео. Тем не менее, датчики, например, Kinect и LIDAR (применяющийся…
GAN для создания и редактирования синтетических изображений в высоком разрешении
Разработчики из Nvidia представили генеративно-состязательную нейросеть (GAN), которая создаёт фотореалистичные изображения на основе семантических карт. Полученное изображение представляет собой виртуальную среду, которую можно изменять в интерактивном режиме: менять фон, добавлять объекты, стилизовать и менять их цвет и форму. Нейросеть основана на системе pix2pix, обучена на PyTorch, и состоит из «масштабирующего» генератора и дискриминатора.
Посмотреть как работает 👇
https://youtu.be/G6o_7Pz35Sk
Разработчики из Nvidia представили генеративно-состязательную нейросеть (GAN), которая создаёт фотореалистичные изображения на основе семантических карт. Полученное изображение представляет собой виртуальную среду, которую можно изменять в интерактивном режиме: менять фон, добавлять объекты, стилизовать и менять их цвет и форму. Нейросеть основана на системе pix2pix, обучена на PyTorch, и состоит из «масштабирующего» генератора и дискриминатора.
Посмотреть как работает 👇
https://youtu.be/G6o_7Pz35Sk
YouTube
Research at NVIDIA: Generating and Editing High-Resolution Synthetic Images with GANs
Researchers from NVIDIA, led by Ting-Chun Wang, have developed a new deep learning-based system that can generate photorealistic images from high-level labels, and at the same time create a virtual environment that allows the user to modify a scene interactively.…
Беспилотный автомобиль «Яндекс» совершил первую поездку между городами
Беспилотник «Яндекс.Такси» проехал 789 км из Москвы в Казань. Машина находилась в пути 11 часов и 99% времени работала в автоматическом режиме. Испытание проходило в условиях реального дорожного движения в дневное и ночное время суток и в разных погодных условиях: на части маршрута шёл сильный дождь. В машине во время поездки находился водитель, который мог принять управление, когда качество разметки и дороги не позволяло ехать на автопилоте.
«Яндекс» планирует продолжать испытания как на полигоне, так и на обычных дорогах для дальнейшего улучшения технологии.
Видео 👇
https://youtu.be/zljaMjLFqfI
Беспилотник «Яндекс.Такси» проехал 789 км из Москвы в Казань. Машина находилась в пути 11 часов и 99% времени работала в автоматическом режиме. Испытание проходило в условиях реального дорожного движения в дневное и ночное время суток и в разных погодных условиях: на части маршрута шёл сильный дождь. В машине во время поездки находился водитель, который мог принять управление, когда качество разметки и дороги не позволяло ехать на автопилоте.
«Яндекс» планирует продолжать испытания как на полигоне, так и на обычных дорогах для дальнейшего улучшения технологии.
Видео 👇
https://youtu.be/zljaMjLFqfI
YouTube
Yandex Self-Driving Car. First Long-Distance Ride
Yandex.Taxi's self-driving car successfully navigated itself 500 miles from Moscow to Kazan, staying in autonomous mode 99% of the time. During the journey, which took about 11 hours, the car handled traffic, rain, dusk, and night driving situations.
Беспилотный…
Беспилотный…
Есть ли потребность в дорогостоящих датчиках для оценки глубины окружения?
Исследователи из Университетского колледжа Лондона разработали архитектуру для оценки карты глубины, которая может использоваться в беспилотных автомобилях. Сеть реализована на Pytorch и способна дать оценку глубины сцены, учитывая только цвета на изображении. Подробности в статье.
Исследователи из Университетского колледжа Лондона разработали архитектуру для оценки карты глубины, которая может использоваться в беспилотных автомобилях. Сеть реализована на Pytorch и способна дать оценку глубины сцены, учитывая только цвета на изображении. Подробности в статье.
Google Cloud TPU доступны в Европе и Азии по предварительной цене
Тензорные процессоры Google (Tensor Processing Units, TPU), которые специально разработаны для ускорения глубокого обучения, теперь доступны на платформе Google Cloud, и выходят на европейский и азиатский рынок по цене на 70% ниже обычной. Например, обучение Cloud TPU бенчмарка ResNet-50 на датасете для классификации изображений с нуля стоит $7,50; а обучение RetinaNet распознаванию объектов — $12.
Один Cloud TPU (v2-8) поставляет до 180 TFLOPS и 64 ГБ памяти и является альтернативой графическим процессорам Nvidia.
Тензорные процессоры Google (Tensor Processing Units, TPU), которые специально разработаны для ускорения глубокого обучения, теперь доступны на платформе Google Cloud, и выходят на европейский и азиатский рынок по цене на 70% ниже обычной. Например, обучение Cloud TPU бенчмарка ResNet-50 на датасете для классификации изображений с нуля стоит $7,50; а обучение RetinaNet распознаванию объектов — $12.
Один Cloud TPU (v2-8) поставляет до 180 TFLOPS и 64 ГБ памяти и является альтернативой графическим процессорам Nvidia.
В США разработчика уволил ИИ, и ни один человек не смог ничего сделать
Ибрагим Диалло рассказал в своём блоге, как машина увольняла его с работы, но никто не понимал в чём дело, и не мог отменить её действия. Сначала у Диалло перестал работать пропуск, затем был запрещен доступ к рабочим программам. В системе сотрудник числился уволенным, а рекрутёры и охрана получали письма о том, что его нужно лишить доступа к данным и выпроводить из офиса.
Разобраться, почему так происходит, в компании смогли только через 3 недели. Машинная система управления персоналом решила, что разработчик больше не является сотрудником компании, и запустила процесс увольнения, который нельзя было остановить, потому что он был полностью автоматизирован.
Ибрагим Диалло рассказал в своём блоге, как машина увольняла его с работы, но никто не понимал в чём дело, и не мог отменить её действия. Сначала у Диалло перестал работать пропуск, затем был запрещен доступ к рабочим программам. В системе сотрудник числился уволенным, а рекрутёры и охрана получали письма о том, что его нужно лишить доступа к данным и выпроводить из офиса.
Разобраться, почему так происходит, в компании смогли только через 3 недели. Машинная система управления персоналом решила, что разработчик больше не является сотрудником компании, и запустила процесс увольнения, который нельзя было остановить, потому что он был полностью автоматизирован.
Нейросеть анализирует спортивные трансляции в реальном времени
Sportlogiq - стартап из Монреаля, который использует глубокое обучение и технологии компьютерного зрения для сбора спортивной аналитики из видео.
Нейросеть распознаёт и анализирует действия игроков и может составлять аналитику об их эффективности. Алгоритм тренировали на тысячах часов спортивных видео, используя графические процессоры Nvidia. Сейчас стартап работает в основном с хоккеем, но технология может применяться и для других видов спорта.
https://youtu.be/fiOYDTnO_fU
Sportlogiq - стартап из Монреаля, который использует глубокое обучение и технологии компьютерного зрения для сбора спортивной аналитики из видео.
Нейросеть распознаёт и анализирует действия игроков и может составлять аналитику об их эффективности. Алгоритм тренировали на тысячах часов спортивных видео, используя графические процессоры Nvidia. Сейчас стартап работает в основном с хоккеем, но технология может применяться и для других видов спорта.
https://youtu.be/fiOYDTnO_fU
YouTube
Inception Spotlight: Sportlogiq - An AI-powered Sports Analytics Company
Sportlogiq is a Montreal, Canada based startup that uses deep learning and NVIDIA GPUs to collect sports analytics from a standard single-camera in real-time...
Интерактивное выделение объектов на видео с помощью попиксельного поиска
Исследователи из Цюриха предложили новый метод сегментации объектов с помощью попиксельного (pixel-wise) поиска в пространстве эмбеддинга. Модель построена с помощью обучения полной свёрточной сети и использует модифицированный triplet loss, специально предназначенный для выделения объектов на видео. Вручную размеченные пиксели являются эталонными образцами, а остальные пиксели классифицируются с помощью метода поиска ближайшего соседа.
Скорость вычислений превосходит существующие методы и делает модель наиболее подходящей для интерактивной сегментации объектов.
Исследователи из Цюриха предложили новый метод сегментации объектов с помощью попиксельного (pixel-wise) поиска в пространстве эмбеддинга. Модель построена с помощью обучения полной свёрточной сети и использует модифицированный triplet loss, специально предназначенный для выделения объектов на видео. Вручную размеченные пиксели являются эталонными образцами, а остальные пиксели классифицируются с помощью метода поиска ближайшего соседа.
Скорость вычислений превосходит существующие методы и делает модель наиболее подходящей для интерактивной сегментации объектов.
Новая open source библиотека c алгоритмами для обработки естественного языка от Intel
NLP Architect — открытая и гибкая библиотека для изучения и работы с актуальными архитектурами глубоких нейросетей и методами обработки и понимания текста. Библиотека содержит синтаксические анализаторы, state-of-the-art модели для понимания языка, модули для семантического анализа, основы для создания чат-ботов и другие инструменты для NLP и NLU.
Подробный обзор текущей версии NLP Architect в статье.
https://vk.com/@neurohive-nlp-architect-ot-intel-open-source-biblioteka-modelei-obrabo
NLP Architect — открытая и гибкая библиотека для изучения и работы с актуальными архитектурами глубоких нейросетей и методами обработки и понимания текста. Библиотека содержит синтаксические анализаторы, state-of-the-art модели для понимания языка, модули для семантического анализа, основы для создания чат-ботов и другие инструменты для NLP и NLU.
Подробный обзор текущей версии NLP Architect в статье.
https://vk.com/@neurohive-nlp-architect-ot-intel-open-source-biblioteka-modelei-obrabo
NLP Architect от Intel: open source библиотека моделей обработки естественного языка
Вы заметили, что всё больше компаний ставят на свой сайт виджет с ботом? Чат-боты сегодня повсюду. И это только один из многих примеров применения технологий обработки естественного языка (Natural Language Processing, NLP) и понимания естественного языка…
ИИ от OpenAI победил полупрофессионалов в Dota 2
Команда из пяти нейронных сетей, OpenAI Five, начала побеждать любительские и полупрофессиональные команды в Dota 2. В основе алгоритма — расширенная версия Proximal Policy Optimization, работающая на 256 графических процессорах и 128 000 ядер. Система тренируется каждый день, играя против самой себя и проживая по 180 лет игрового времени. Для каждой нейросети используется отдельная LTSM, которая помогает анализировать окружающую среду и обходить препятствия.
Разработчики планируют провести матч против топ-игроков 28 июля 2018 года, трансляцию можно будет посмотреть на Twitch.
Смотреть видео: https://youtu.be/eHipy_j29Xw
Команда из пяти нейронных сетей, OpenAI Five, начала побеждать любительские и полупрофессиональные команды в Dota 2. В основе алгоритма — расширенная версия Proximal Policy Optimization, работающая на 256 графических процессорах и 128 000 ядер. Система тренируется каждый день, играя против самой себя и проживая по 180 лет игрового времени. Для каждой нейросети используется отдельная LTSM, которая помогает анализировать окружающую среду и обходить препятствия.
Разработчики планируют провести матч против топ-игроков 28 июля 2018 года, трансляцию можно будет посмотреть на Twitch.
Смотреть видео: https://youtu.be/eHipy_j29Xw
YouTube
OpenAI Five
We've created an AI system, OpenAI Five, which has started to defeat amateur human teams at Dota 2. This video contains an overview of our system, some example gameplay, and professional caster Blitz's analysis of our bot, as we start to gear up for playing…
Новые библиотеки для оптимизации данных и работы с изображениями от Nvidia
На конференции CVPR 2018 компания представила две библиотеки:
Nvidia DALI подходит для ускоренной загрузки изображений и оптимизации потоков данных для глубокого обучения. Имеет простую интеграцию с MxNet, TensorFlow и PyTorch и поддерживает различные форматы данных: JPEG, RAW, LMDB, RecordIO и TFRecord.
Nvidia nvJPEG — высокопроизводительная библиотека для декодирования JPEG, которая поддерживает декодирование одиночных и пакетных изображений, многофазное и гибридное декодирование с использованием как CPU, так и GPU. Позволяет преобразовывать цветовое пространство и поддерживает форматы RGB, BGR, RGBI, BGRI и YUV.
DALI доступна open source: https://github.com/NVIDIA/dali
nvJPEG можно скачать здесь: https://developer.nvidia.com/nvjpeg
На конференции CVPR 2018 компания представила две библиотеки:
Nvidia DALI подходит для ускоренной загрузки изображений и оптимизации потоков данных для глубокого обучения. Имеет простую интеграцию с MxNet, TensorFlow и PyTorch и поддерживает различные форматы данных: JPEG, RAW, LMDB, RecordIO и TFRecord.
Nvidia nvJPEG — высокопроизводительная библиотека для декодирования JPEG, которая поддерживает декодирование одиночных и пакетных изображений, многофазное и гибридное декодирование с использованием как CPU, так и GPU. Позволяет преобразовывать цветовое пространство и поддерживает форматы RGB, BGR, RGBI, BGRI и YUV.
DALI доступна open source: https://github.com/NVIDIA/dali
nvJPEG можно скачать здесь: https://developer.nvidia.com/nvjpeg
Как выбрать GPU для обучения нейросети и сколько это стоит?
Или как найти компромисс между стоимостью и производительностью различных поставщиков GPU? В статье приведены результаты тестов Amazon Web Services AWS EC2, Google Cloud Engine GCE, IBM Softlayer, Hetzner, Paperspace и LeaderGPU как на сложных, так и на простых задачах.
Цель сравнения — показать, стоят ли дорогие инстансы своих денег. Автор статьи также рассказывает, для каких задач лучше использовать те или иные GPU, и как сэкономить на обучении моделей.
Читать:
https://medium.com/@neurohiveru/сравнение-cloud-gpu-для-машинного-обучения-amazon-google-hetzner-ibm-paperspace-leadergpu-3309a9414208
Или как найти компромисс между стоимостью и производительностью различных поставщиков GPU? В статье приведены результаты тестов Amazon Web Services AWS EC2, Google Cloud Engine GCE, IBM Softlayer, Hetzner, Paperspace и LeaderGPU как на сложных, так и на простых задачах.
Цель сравнения — показать, стоят ли дорогие инстансы своих денег. Автор статьи также рассказывает, для каких задач лучше использовать те или иные GPU, и как сэкономить на обучении моделей.
Читать:
https://medium.com/@neurohiveru/сравнение-cloud-gpu-для-машинного-обучения-amazon-google-hetzner-ibm-paperspace-leadergpu-3309a9414208
Medium
Выбираем GPU для машинного обучения: Amazon, Google, Hetzner, IBM, Paperspace или LeaderGPU
В решении задач машинного обучения графические процессоры не знают себе равных по скорости вычислений, важно найти компромисс между…
Adobe создали ИИ, который распознаёт «фотошоп» на фотографии
Нейросети уже умеют «фотошопить» фотографии в промышленном масштабе, а качество изменённых фото растет на глазах. Adobe представили технологию, которая должна сохранить доверие к СМИ и цифровым медиа. Искусственный интеллект определяет, была ли изменена фотография и обнаруживает участки изменений. Он сможет распознавать три вида манипуляций: удаление объектов, клонирование участков и склейку нескольких изображений.
ИИ за несколько секунд выявляет отредактированные участки, анализируя водяные знаки, разницу в контрасте и распределение шума на изображении. На видео показан результат работы, более подробно о техниках и методах работы нейросети мы расскажем на следующей неделе.
Смотреть:
https://youtu.be/7e5Q0TgPR54
Нейросети уже умеют «фотошопить» фотографии в промышленном масштабе, а качество изменённых фото растет на глазах. Adobe представили технологию, которая должна сохранить доверие к СМИ и цифровым медиа. Искусственный интеллект определяет, была ли изменена фотография и обнаруживает участки изменений. Он сможет распознавать три вида манипуляций: удаление объектов, клонирование участков и склейку нескольких изображений.
ИИ за несколько секунд выявляет отредактированные участки, анализируя водяные знаки, разницу в контрасте и распределение шума на изображении. На видео показан результат работы, более подробно о техниках и методах работы нейросети мы расскажем на следующей неделе.
Смотреть:
https://youtu.be/7e5Q0TgPR54
YouTube
Adobe Research: Spotting Image Manipulation with AI
We’re exploring the boundaries of what’s possible using new technologies, such as artificial intelligence and machine learning to more easily, reliably and q...
Deep Drone Racing: исследователи научили дронов автономному полёту в меняющихся условиях
Учёные из Цюриха представили разработку, которая позволяет дронам автономно перемещаться между препятствиями и не врезаться ни в одно из них. Система использует свёрточную нейронную сеть (CNN) и современную систему планирования и управления траекторией. Нейросеть получает изображение со встроенной камеры на дроне, анализирует его, после чего планировщик корректирует курс, скорость и траекторию полёта.
Автономный квадрокоптер успешно справляется с полётом, даже если одно из препятствий меняет положение, однако в скорости всё ещё значительно уступает дрону под управлением пилота.
Смотреть:
https://youtu.be/8RILnqPxo1s
Учёные из Цюриха представили разработку, которая позволяет дронам автономно перемещаться между препятствиями и не врезаться ни в одно из них. Система использует свёрточную нейронную сеть (CNN) и современную систему планирования и управления траекторией. Нейросеть получает изображение со встроенной камеры на дроне, анализирует его, после чего планировщик корректирует курс, скорость и траекторию полёта.
Автономный квадрокоптер успешно справляется с полётом, даже если одно из препятствий меняет положение, однако в скорости всё ещё значительно уступает дрону под управлением пилота.
Смотреть:
https://youtu.be/8RILnqPxo1s
YouTube
Deep Drone Racing: Learning Agile Flight in Dynamic Environments
Autonomous agile flight brings up fundamental challenges in robotics, such as coping with unreliable state estimation, reacting optimally to dynamically changing environments, and coupling perception and action in real time under severe resource constraints.…