Neurohive (VK)
TransGAN — GAN-модель, в которой генератор и дискриминатор состоят из двух Transformer-архитектур. Традиционно в GAN архитектуре используются свертки. В TransGAN свертки заменили на Transformer. По результатам экспериментов, модель выдает сравнимые с state-of-the-art GAN-моделями результаты.
#Arxiv
TransGAN — GAN-модель, в которой генератор и дискриминатор состоят из двух Transformer-архитектур. Традиционно в GAN архитектуре используются свертки. В TransGAN свертки заменили на Transformer. По результатам экспериментов, модель выдает сравнимые с state-of-the-art GAN-моделями результаты.
#Arxiv
Neurohive (VK)
CSTR — это сверточная нейросеть, которая распознает текст на изображениях сцены. Предложенная модель решает задачу распознавания текста на изображении сцены как задачу мультиклассовой классификации изображения. По результатам экспериментов на 6 датасетах, CSTR выдает сравнимые с state-of-the-art подходами результаты.
#Arxiv
CSTR — это сверточная нейросеть, которая распознает текст на изображениях сцены. Предложенная модель решает задачу распознавания текста на изображении сцены как задачу мультиклассовой классификации изображения. По результатам экспериментов на 6 датасетах, CSTR выдает сравнимые с state-of-the-art подходами результаты.
#Arxiv
Neurohive (VK)
PF-AFN — это нейросеть, которая генерирует изображения с примеркой одежды. Модель принимает на вход изображение человека и изображение предмета одежды. На выходе модель отдает изображение, на котором на целевую персону надет предмет одежды. Нейросеть обходит предыдущие подходы, которые основываются на модели сегментации частей человека.
#CV #Arxiv
PF-AFN — это нейросеть, которая генерирует изображения с примеркой одежды. Модель принимает на вход изображение человека и изображение предмета одежды. На выходе модель отдает изображение, на котором на целевую персону надет предмет одежды. Нейросеть обходит предыдущие подходы, которые основываются на модели сегментации частей человека.
#CV #Arxiv
Neurohive (VK)
TextFlint – это мультиязычная, многозадачная платформа для анализа устойчивости NLP-моделей. В открытом доступе для английского и китайского языков, другие языки разрабатываются.
#Development #Arxiv #NLP #Opensource
TextFlint – это мультиязычная, многозадачная платформа для анализа устойчивости NLP-моделей. В открытом доступе для английского и китайского языков, другие языки разрабатываются.
#Development #Arxiv #NLP #Opensource
Neurohive (VK)
StyleCLIP — это связка моделей CLIP и StyleGAN, предназначенная для управления стилем изображений при помощи текстового описания. Код в открытом доступе, включая блокноты Google Colab.
#AppliedDS #Arxiv
StyleCLIP — это связка моделей CLIP и StyleGAN, предназначенная для управления стилем изображений при помощи текстового описания. Код в открытом доступе, включая блокноты Google Colab.
#AppliedDS #Arxiv
Neurohive (VK)
ArtFlow — это фреймворк для переноса стиля изображения без потерь с помощью обратимых нейронных потоков. Код в открытом доступе на Github.
#stateoftheart #arXiv #styletransfer #opensource
https://neurohive.io/ru/papers/artflow/
ArtFlow — это фреймворк для переноса стиля изображения без потерь с помощью обратимых нейронных потоков. Код в открытом доступе на Github.
#stateoftheart #arXiv #styletransfer #opensource
https://neurohive.io/ru/papers/artflow/
neurohive.io
Новый метод переноса стиля ArtFlow позволяет выполнять стилизацию изображений без потерь
ArtFlow — это фреймворк для переноса стиля изображения без потерь с помощью обратимых нейронных потоков. Код в открытом доступе на Github. Зачем это нужно Задача универсального переноса стиля (UST) позволяет применять к одному изображению стиль другого. Например…