я обучала одну модель

682 views22:29

689 views20:45

Интересная довольно работа по unsupervised question answering. По сути авторы пытаются построить модель, которой не нужен размеченный датасет с вопросами по типу SQuAD. При этом, по качеству она не дотягивает до supervised обучения (когда есть ручная разметка вопрос-ответ), но хотя бы обгоняет более ранние модели QA. Что они делают:
1. Рандомно семплируются парагрфы из Википедии опредленной длины. Внутри них ищутся noun sentences или name entity sentences (то есть когда в предложении есть специфичные наименования вроде даты/места/имени/марки и т.д.).
2. Из этих предложений составляются Cloze Questions – предожения, где ответ замаскирован (например, 'летние олимпийские игры 1980 года проходили в _' или 'летние олимпийские игры _ года проходили в Москве' ). За ответ считается, собственно, named entity или главное существительное в предложении.
3. Далее нужно перевести эти Cloze Questions в вопросы, сформулированные на естественом языке. Для этого авторы используют seq2seq модель, которая по сути занимается переносом стиля на текстовых данных: она берет два корпуса – один это cloze questions, второй это реальные вопросы, составленные людьми, и пытается перенести стиль, сохранив содержание. Чтобы улучить качество переноса, авторы стали еще подавать тип ответа вместе с самим cloze question, чтобы генерировалось правильное вопросительное слово (например, если ответ – это дата (temporal), то нужно подставить вместо маски when). Еще авторы пытались повысить робастность, добавляя шум, то есть перемешивая и удаляя слова в вопросе, предполагая, что модель дожна выучиь определнные n-граммы, которые указывают на тот или иной ответ, и быть устойчивой к различным вариантам парафраза.

Тренируют это все на BERT-Large, и в принципе выходит неплохо, вообще интересно, как тема с обучением на синтетических данных будет развиваться. Еще по статье видно, что этот один из тех случаев, когда авторы умоляют нейроночку заработать с помощью любых эвристик, ну или они просто ответственные, и прямо сильно документировали процесс экспериментов с методом

Сслыка на гит

GitHub

GitHub - facebookresearch/UnsupervisedQA: Unsupervised Question answering via Cloze Translation

Unsupervised Question answering via Cloze Translation - facebookresearch/UnsupervisedQA

797 viewsedited 00:00

я обучала одну модель

Пример вопросов вот

866 views00:02

я обучала одну модель

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Просто восхитительный видос, полученный следующим образом: взяли датасет лиц Ukiyo-e, сетку для image-to-image translation (архитетура похожа на GAN с аттеншеном), и еще один очень крутой GAN, который может переводить видео в видео (вообще его изначально тренировали на аниме)
Повторюсь, единственно правильный подход к АИ-решениям я вижу именно так

22.1K viewsedited 12:26

я обучала одну модель

Специально для людей как я, которые любят заводить странички в ноушене, но не очень любят все это потом делать))) Но вообще по-моему тут очень адекватная градация скилов, к тому же списки можно кастомайзить под себя
https://towardsdatascience.com/a-checklist-to-track-your-data-science-progress-bf92e878edf2

Medium

A checklist to track your Data Science progress

Use the one-day-per-week principle to gradually tick it

1.17K views21:24

я обучала одну модель

И вот еще очень хороший роудмэп по всему DS от train-test split и knn до облачных сервисов, все идет вместе с ссылками на курсы/материалы
https://whimsical.com/machine-learning-roadmap-2020-CA7f3ykvXpnJ9Az32vYXva

Whimsical

Machine Learning Roadmap 2020

2020 machine learning roadmap built in Whimsical. View for detailed mind map on: machine learning resources and the machine learning process for projects.

1.61K views21:28

я обучала одну модель

1.04K views12:51

я обучала одну модель

Еще один достойнейший представитель аккаунтов-нейроночек в твиттере

1.33K views14:41

я обучала одну модель

Forwarded from нью крипто щит (Sasha Tsereteli)

Пока на эфире клепают однообразные pfp-проекты по образу и подобию Bored Ape Yacht Club, что-то действительно интересное неожиданно вышло на Binance Smart Chain 🐸

Друзья-соотечественники из моего любимого канала @NeuralShit сгенерили нейронкой 7777 уникальных изображений лягушонка пепе на основе нескольких тысяч артов, вытащенных с форчана, и превратили в NFT-проект Neural Pepe.

Как они сами иногда говорят, вышло «проклято, но эпично». С каждым пепе идёт 420 токенов AI, и ещё 2.3 фармится ежедневно. За 420 AI вашего нейропепе можно переименовать, увековечив его имя на блокчейне – механика наверняка знакома.

Немаловажный аспект: с правами вопрос вроде как уладили, так что проект будет жить. В продаже из 7777 разновидностей нейропепе осталось около 1500. Купить можно всего за 0.5 BNB вот тут: https://neuralpepe.com/

neuralpepe.com

Neural Pepe

The first AI-(de)generated NFT collectibles on BSC. Only 7777 neural pepes will ever exist.

696 views11:45

я обучала одну модель

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Еще один крутой аккаунт в Твиттере, куда постят картинки, сгенерированные BigGAN или VQGAN. Примечательно, что ГАНы могут довольно точно рисовать как что-то конкретное (лица конкретых людей вроде Джо Байдена), так и совершенно абстрактные концепты (например, the end of time and space).
Вот пока что мои любимые примеры:
Stairway to Heaven
The Greenhouse Shadows
Wind Over the Ocean
rococo socialist realism, dogs
The Chillwave Venue Underneath Our House

830 views22:15

я обучала одну модель

Channel photo updated

15:53

About

Blog

Apps

Platform