AI Happens
14.6K subscribers
84 photos
9 videos
193 links
Привет! Я Леша Хахунов, основатель Dbrain.io, и это мой канал про искусственный интеллект.
Download Telegram
​​Сегодня в дайджесте новостей будет лишь одно, но главное для нас событие!

Благодаря партнерству с Яндекс.Толокой Dbrain создал OCR с точностью распознавания 99%

Последние полтора года мы в Dbrain создавали собственное OCR-решение (Docr). Эта технология позволяет извлекать цифровую версию текста из любого документа: паспорта, водительского удостоверения, страхового полиса и т.д.

Теперь мы умеем:
— распознавать документы точнее, чем рядовой сотрудник компании;
— распознавать нестандартные документы;
— распознавать меньше чем за минуту абсолютное большинство документов;
— распознавать документы в real time в любой пик нагрузки 24/7.

Допустим, вы хотите взять самокат, но сначала необходимо подтвердить свою личность в приложении. В тот момент, когда вы отправляете документы на проверку, в работу вступаем мы — те, кто быстро распознает нужную для сервиса информацию. И вы сможете прокатиться с ветерком уже через пару минут — без долгого ожидания верификации аккаунта.

Причем здесь Яндекс:
Мы объединили машинное обучение и людей для распознавания документов. Принцип простой: алгоритм ошибся — человек поправит. С каждой ошибкой нейросеть дообучается и совершенствуется в реальном времени — то есть издержки остаются прежними, а качество растет. Всё это было бы невозможно без партнерства с Яндекс.Толокой: только миллионы разметчиков могут уверенно обеспечить ликвидность, а мы в Dbrain обеспечиваем качественный ML и, конечно, защиту персональных данных наших клиентов.
​​Ты узнаешь его по голосу: нейросеть Speech2Face генерирует портрет человека по аудиозаписи — и это впечатляет

В лаборатории MIT создали нейросеть, которая генерирует портрет человека по голосу. Speech2Face обучалась на видеозаписях с YouTube: на первом этапе она делала числовой вектор из голоса, на втором превращала его в картинку.

Почему важно: В машинном обучении популярен антропоморфический подход к решению задач, то есть работу нейросети строят по человеческому подобию. В то же время есть другой подход к обучению, нестандартный, — он интересен куда больше. Вспомните, как алгоритмы от лаборатории OpenAI сразились с лучшими игроками Dota 2 — после тысячи часов симуляций машина разработала стратегию, которая разительно отличалась от тактики живых противников, поэтому и выиграла.

Что мы видим в кейсе Speech2Face? Нейросеть смогла решить задачу, которая нашему мозгу непосильна. Да, мы можем отличить по голосу, кто на другом конце провода — мужчина или женщина, прикинуть возраст. Но нарисовать точный портрет вплоть до цвета волос — это идея для нового героя киновселенной Marvel, а не навыки, доступные простому смертному.

А Speech2Face смогла: она преобразовала звук в спектрограмму (aka визуальное представление аудиоволн), выдала вектор с характеристиками лица человека, чтобы затем подогнать его под стандартный анфас и сгенерировать финальный портрет. Теперь с помощью образца голоса можно составить примерный фоторобот — и кто сказал, что он не станет точнее в будущем.
​​Конец рабочей недели — время вспомнить главные события в мире машинного обучения:

1.
Помните историю ИИ, cпроектировавшего стулья с минимальным расходом? У него появился коллега-архитектор, которого создал выпускник Гарвардского университета. Его нейросеть изучает реальные планировки зданий и генерирует свои. До Захи Хадид ему еще далеко, но выступать в роли помощника может уже сейчас.

2. Twitter купил лондонский стартап Fabula AI, чьи алгоритмы обучены искать фейкньюс. Проблема актуальная — благодаря тем же твитам новости распространяются быстрее, чем мы успеваем их проверить. У компании глобальные планы по интеграции технологии в платформы всех желающих.

3. Google запустил обновление главного алгоритма. Британская газета “Daily Mail” в гневе — их дневной трафик упал на 50% (на секундочку — 5 млн. читателей). Падение произошло по всем вертикалям, устройствам, AMP- и стандартным версиям. В поисковике заверили, что обновление еще в процессе, и бросаться камнями пока рано.

4. Сверточная нейросеть EDVR восстанавливает резкость при приближении кадра из видео и устраняет размытие. Примеры впечатляют!

5. Пять профи из мира ИИ пришли сюда создать стартап и перевернуть индустрию роботехники. Как видите — стартап у них уже есть. В числе участников: фаундер iRobot (Роберт Брукс) и главный инженер Redwood Robotics (Энтони Джулз). Звездная пятерка загорелась идеей сдвинуть роботехнику с мертвой точки — избавить механических работяг от неповоротливости и, наконец, адаптировать их к среде.
​​История о том, как ваша новая аватарка в Facebook учит нейросеть, или почему нельзя защитить персональные данные в интернете

Microsoft удалил открытый датасет из 10 миллионов лиц. Снимки компания брала из открытых источников в интернете без согласия авторов. Датасет был доступен с 2016 года и неоднократно использовался всеми желающими для тренировки нейронных сетей.

Почему важно: Когда Microsoft говорил, что лица из датасета MS Celeb принадлежат только известным личностям, он, конечно, лукавил. На самом деле там много фотографий рядовых пользователей социальных сетей. Никто не спрашивал, хотят ли они участвовать в тренировке нейросетей или нет. А надо ли?

При создании датасета у компании есть два с половиной пути. Первый — собрать данные с ее сайта или приложения. Второй — ходить по открытым источникам и собирать датку из профилей Инстаграма. Еще один путь — платить копейку работникам Amazon Mechanical Turk или Яндекс.Толоки, чтобы те делали нужные для задачи снимки и отправляли компании. Не надо быть специалистом по машинному обучению, чтобы понять, какой из способов дешевле и легче.

Все технологии распознавания лиц собраны из наших снимков — вот мы гуляем в парке, сидим в баре с друзьями (много разных лиц в кадре — это хорошо), отдыхаем на море. Тысячи фотографий нашей жизни идут на обучение будущего ИИ. Да, вы можете воспользоваться правом на забвение — удалить персональные данные из поисковых запросов. Но выпилиться из датасетов, увы, не выйдет. На них закон не распространяется. Даже официально удаленный MS Celeb, понятное дело, остался в сети — у тех, кто скачал его за три года.

Возникает вопрос — а что делать? Вероятно, закон будет развиваться — сейчас он только частично оберегает персональные данные. Скоро маленькое разрешение на сбор куков на сайте расширится до огромной формы, в которой будут подробно рассказывать, чем вам грозит пребывание на сайте. Но все же стоит понимать, что интернет — самое свободное место на Земле, где вся собственность — общая, в том числе и наше “я”.
​​В эфире пятничная подборка новостей из мира ИИ:

1.
Пока Facebook пытается искоренить фейковые новости, активисты собирают тысячи просмотров в Инстаграме с помощью фальшивого Цукерберга. С технологией deepfake (алгоритм благодаря фото делает реалистичное видео) они создали основателя социальной сети, чтобы проверить, насколько эффективно работает модерация контента. Вывод печальный — видео, где Цукерберг рассуждает о контроле над миллионами людей и выдвигает конспирологические теориии, по-прежнему доступно.

2. И вновь Сан-Франциско: на этот раз ИИ будет трудиться в офисе окружного прокурора. Алгоритмы обучены исключать из отчетов полиции данные о расе и внешности подсудимых, чтобы убрать расовые предрассудки при предъявлении обвинений. А они есть: по статистике в СФ на афроамериканцев приходится 41% арестов, более того — в решениях судов нашли «существенные расовые и этнические различия».

3. Теперь о медицине: американские разработчики представили нейросеть, которая снизит дозу рентгеновского излучения (в 10 раз!) при проведении компьютерной томографии. Главное — без вреда для результата. Сверточной нейронной сети для обучения дали одинаковые КТ-изображения, полученные при стандартной и низкой дозе излучения. На каждом слое она понемногу улучшает качество и снижает шум.

4. И еще одна нейросеть: главная проблема, с которой сталкиваются разработчики детекторов, это классификация похожих объектов. Например, в кадре голубь и ворона. Детектор знает, что это птицы, но какие именно — сказать не может. Для этого и нужна Reasoning-RCNN — нейросеть, которая позволяет к любой другой нейросети добавить дополнительную классификацию для более точного анализа объекта.
​​Я тебя породил, я тебя и убью — как Adobe создал алгоритм, который находит Photoshop на фото, и зачем он это сделал?

Компания Adobe представила алгоритм, который находит признаки использования Фотошопа на снимке с точностью в 99,4%. Пока нейросеть определяет только апгрейды, сделанные при помощи фильтра Liquify (корректирует форму лица и меняет мимику). В будущем создатели хотят расширить функции алгоритма, подключив распознавания Фотошопа не только на лице, но и на теле.

Почему важно: Прошла только половина 2019 года, но уже сейчас его можно назвать годом фейков. Нейросети генерируют фейковые видео, человеческие голоса и лица, домашних питомцев, стартапы, новости. И это не предел — технология будет развиваться, и дальше обрастая механическими фальсификаторами.

Но если фейки в интернете кто-то создает, значит, кому-то нужно с ними бороться. Забавно, что одним из первых, кто вышел на тропу войны с фальшивым контентом, стал Adobe — отец Фотошопа. С чем, если не с Adobe Photoshop мы ассоциируем цифровую подделку? Развивая технологию фейков еще до того, как это стало мейнстримом, сейчас компания работает над “антивирусом”, чтобы в будущем сделать коммерческий продукт.

Закончится год фейков и начнётся год борьбы с ними. Главные компании мира уже готовятся к схватке: Twitter купил стартап, который распознает фейк-ньюс, Adobe обучает нейросети, на очереди YouTube и прочие. Пройдет еще немного времени, и наряду с «made in China» компании будут обязаны писать «made by AI», — к этому и готовится Adobe.
​​Без сна и отдыха: что делал ИИ на этой неделе?

1.
В Facebook придумали нейросеть, которая создает голоса людей (пока только знаменитостей). Для генерации аудиосигналов исследователи использовали спектрограммы — это визуальное представление аудиосигналов в 2D, которое отражает изменения голосе в тайм-лайне. А для датасета взяли аудиокниги и пятьсот часов программы TED — с оживленной манерой речи, необходимой для обучения нейросети. Забавно, что компания не стала имитировать Цукерберга, которого на прошлой неделе «дипфейкнули» активисты, вместо этого ИИ игрался с голосом Билла Гейтса.

2. Кстати, про Microsoft: в новой версии PowerPoint можно репетировать выступление перед ИИ. Ваш единственный слушатель примостится в нижнем углу экрана и даст подсказки во время речи, укажет на слова-паразиты, а также упрекнет в использовании избитых фраз. Также в обновлении появится еще одна нейросеть: ее задача — проанализировать корпоративный стиль и предложить подходящий шрифт и цвет для презентации. Ждем релиза!

3. Помните алгоритм GauGAN от NVIDIA, которая превращает примитивную картинку в шедевр фотографии? Коротко — это генеративно-состязательная нейронная сеть для обработки сегментированных изображений. Ее обучили на фотографиях реальных мест, поэтому сетка учитывает тени, текстуры и детали. А новость в том, что теперь любой может опробовать технологию. Осторожно — затягивает.
​​Все-таки пригодилась: почему ИИ обыграл китайцев в Доту, но завалил школьный тест по математике?

Исследователи из DeepMind проанализировали математические способности нейронных сетей на примере собственного алгоритма. Обучив его на наборе данных, состоящих из математических задач, создатели заставили алгоритм решать тест из школьной программы. ИИ экзамен провалил.

Причем тут математика? Благодаря теоретической науке развиваются технологии — от космоса до ИИ. Она не несет практического смысла сама по себе, но выступает инструментом для других наук. А иногда подставляет палки в колеса: в математике полно нерешенных задач. Например, теория струн (М-теория) по-прежнему находится в начале пути из-за ограниченности математического аппарата.

Почему важно? Есть маленькое, но быстро растущее направление, где люди учат нейросети понимать и решать математические задачи. Пока упражнения по сложности не выходят за рамки школьного курса, но алгоритмы уже самостоятельно переводят задачу с человеческого языка на свой родной без посторонней помощи.

Почему нейросеть завалила контрольную по математике? Первая причина — даже если алгоритм решает широкий спектр задач с точностью в 99%, он все равно не прав. Представьте, что вы решаете пример у доски: в ответе получилось 4,99, а надо 5. Учитель поставит двойку и будет прав, потому что приближенное вычисление не равно правильное. Вторая проблема — это интерпретируемость. Другими словами, если надо решить сложную задачу из последней части ЕГЭ, и вы написали только ответ, никто вам не поверит. Всегда нужно пошаговое объяснение, как вы пришли к такому результату.

Что дальше? Мы точно доживем до времен, когда алгоритм научится проверять домашнее задание не только на уровне “правильно/неправильно”, но и анализировать предоставленное решение. Что касается сложных задач — может, именно ИИ найдет подтверждение теории струн, а не человек. А пока пусть делает работу над ошибками.
​​На дворе очередная пятница — самое время пройтись по новостям из мира ИИ:

1.
Самая обсуждаемая нейросетка недели — DeepNude. Как понятно из названия, она полностью раздевает женщин на фото, дорисовывая скрытые участки тела. После того, как приложением воспользовались больше полумиллиона пользователей, создатели проекта объявили о закрытии. Сказали, мир пока не готов к подобной технологии. Другой вопрос — зачем нужна технология, которая в один миг оставит вас без одежды, хотите вы этого или нет.

2. Астрофизики сделали нейросеть для 3D-симуляции Вселенной. Цель была поиграться с параметрами и посмотреть, как развивается космос при различных сценариях. Например, алгоритм умеет моделировать изменение гравитационной силы и процент темной материи. А теперь забавный факт — нейросеть создаёт симуляцию меньше чем за секунду с погрешностью менее 3 процентов. Создатели сетки не могут объяснить, как ей это удалось.

3. Компания Walmart призналась, что ловит воров в магазине с помощью компьютерного зрения. Камеры отслеживают не людей, а продукты — ИИ определяет товары, которые покупатели положили в сумку без пробивания на кассе. Технологию уже внедрили в тысячу магазинов в надежде, что это поможет снизить убытки — из-за краж они достигают 4 миллиардов долларов в год.
​​Почему у кота, чей хозяин — инженер из Amazon, есть персональный ИИ, а у нас — нет

Инженер из Amazon научился контролировать своего кота при помощи алгоритмов машинного зрения. Все, что ему потребовалось, — это камера Amazon DeepLens, микрокомпьютер Arduino и 23 тыс. изображений пушистого объекта. После идентификации животного система принимает решение, можно ли пускать ночного охотника домой: если тот вернулся с добычей в зубах, алгоритм блокирует дверцу на 15 минут и отправляет хозяину сообщение, если без улова — проход свободен.

Почему важно: Кажется, что парень сделал милую ML-игрушку для кота, но на деле он проделал кропотливую работу. Инженер собрал датасет из 23 тысячи изображений животного (с добычей и без) и натренировал сети с высоким процентом успеха — в 5 из 6 случаев ИИ верно среагировал на добычу.

Раз ИИ добрался до котов, то скоро и у нас будут подобные решения? К сожалению, нет. Рядовой пользователь не повторит опыт инженера: только на сбор и разметку данных уйдет тысяча долларов на той же Mturk. Благодаря скилам сотрудник Amazon выполнил типичную для B2B сегмента задачу — собрал работающее решение на основе машинного зрения. Если масштабировать его в B2C, то придется учить нейросеть различать все породы котов и их добычу — выйдет дорого и долго.

Это же задача более актуальна для бизнеса. Допустим — по контракту в пару сотен тысяч долларов вы создаете архитектуру, которая определяет активность сотрудников на заводе. Чтобы решение заработало на другом предприятии, ставите там камеры, пару недель собираете действия на записи, делаете разметку, дообучаете существующую нейросеть, и все работает. Получаете прибыль, результаты и востребованное решение на рынке.

Отсюда вывод — количество ИИ-кейсов с применением компьютерного зрения будет расти в B2B секторе, где есть заводы, а вот клиентам с лапками придется еще подождать.
1
​​Съехала от родителей — нейросеть для изучения Вселенной обошла математиков и ушла далеко за пределы того, что от нее ждали

Ученые создали нейросеть для 3D-симуляции Вселенной. Алгоритм предсказывает развитие космоса при различных сценариях, в том числе моделирует изменение гравитационной силы и процент темной материи. Последнему критерию нейросеть не обучали — создатели не могут объяснить, как она до этого дошла.

Почему об этом пишем: В пятничном дайджесте мы упомянули эту новость, но хочется рассказать о ней побольше. Сначала разберемся — зачем астрофизикам понадобилось машинное обучение? Все просто — они попытались облегчить себе жизнь и понизить уровень сложности вычислительных процессов в работе. До ML это работало так — сначала описывают математическую модель, потом суют в нее разные параметры и смотрят на результат.

У классического подхода две проблемы: первая — надо найти все параметры, которые влияют на предсказываемую среду, и затем связать их между собой. Вторая — сложные модели считаются на суперкомпьютерах, и это может занять месяцы. Получается долго, но во многих областях без кропотливых вычислений не обойтись: так создают симуляции прочности мостов, анализируют протекание ядерных реакций и отрабатывают траектории полета летательных аппаратов.

Астрофизики же применили новый способ — взяли кучу данных от точной модели, использовали их как выходные данные и обучили нейросеть. Получилось слишком хорошо. Сетка создаёт симуляцию меньше чем за секунду, но что круче — она проявила инициативу, научившись считать процент темной материи, хотя не должна была это делать. Ждем развития технологии, а математикам-астрофизикам удачи. Кажется, у них появился конкурент — осталось разобраться, как он работает.
​​Что там у ИИ — порно, страховки, вирусные ролики:

1.
В американском штате Вирджиния в законе о порномести появился новый пункт, запрещающий использовать дипфейки. Уже под запретом распространение порно без согласия бывшей, а теперь вас могут арестовать за генерацию фейкового контента (например, вы подставили ее лицо в ролик). Это только начало: уверен, что скоро мы увидим больше законов по контролю ИИ-технологий.

2. Развлечение людям — датасет для ИИ: Команда Google AI скормила две тысячи роликов флешмоба Mannequin Challenge нейросети. Замирающие в кадре люди помогут алгоритмам лучше ориентироваться на видео — они научатся оценивать глубину кадра, расстояние между объектами и другие параметры. Снимаю шляпу перед смекалкой дата-сайентистов — красивое и простое решение задачи.

3. Бородатые программисты в опасности: появилась технология на основе машинного обучения, которая определяет возраст человека по внешним параметрам. Казалось бы, ничего нового, но! Если цифры в паспорте отличаются от того, сколько вам дала нейросеть, она подает предупреждающий сигнал — возможно ваше здоровье не в порядке. Авторы статьи справедливо замечают, что нейросеткой могут заинтересоваться страховые, которые пускают в ход любые средства, чтобы как можно точнее определить клиентские риски.
​​Распознавание лиц — почему нейросети легко находят законопослушного гражданина, но пропускают злодеев?

Как нейросеть вас распознает? Сначала ИИ ищет лицо, а потом определяет, кому оно принадлежит. Самое интересное начинается, когда алгоритмы пытаются установить личность. Представьте, что вы спускаетесь по эскалатору: алгоритмы вас увидели, нашли лицо, избавились от фона, выровняли изображение, сгладили искажения, а дальше перевели ваши черты лица в эмбеддинг. Так называется числовое значение, которое понятно только машинам: у нас свой язык, у них — свой. Все ваши родинки и морщинки — это числа. Алгоритмы сравнивают ваш эмбеддинг с похожими численными векторами в датасете, пока не найдут совпадение. Нашла — вас узнали.

Так ли хорошо работает система? Раньше результаты компаний были открытыми, и в данные мог заглянуть любой. С развитием технологий (а главное — спросом) количество игроков выросло, а место в рейтинге стало играть роль при выборе вендора. Новички повадились уводить датасеты других компаний домой и обучать сетки на них, а также искусственно улучшать качество без работы над алгоритмом. Теперь тестированием систем занимается суровый NIST — американский национальный институт стандартов и технологий. В 2019 году первой в точности распознавания стала российская компания VisionLabs.

Как технологию распознавания использует правительство? К чемпионату мира по футболу 2018 года камеры в общественном транспорте апгрейднулись — теперь прикрученные к ним нейросети распознают лица в толпе. Причина — обеспечить безопасность граждан и поймать всех преступников.

Почему мотивация государства под большим вопросом? Датасет в основном собирают с социальных сетей. Новая аватарка — это данные для нейросети. И тут загвоздка: преступники не спешат заводить профиль в Инстаграме. Часто единственное изображение, доступное для распознавания, — это черно-белый снимок с места преступления. Технология помогает полиции отслеживать каждый шаг обычных граждан, которые не запариваются с конфиденциальностью, а обнаружить настоящего злодея в метро ей не под силу.
​​Приключения ИИ на этой неделе — кибербуллинг, переводчик и Starcraft II:

Алгоритм, который дает возможность подумать дважды: новая функция Instagram борется с кибербуллингом. Теперь нейросеть анализирует содержание комментария и выдает пользователю предупреждение «Ты точно хочешь это отправить?», если видит признаки оскорбления, насилия или ненависти. Идея работает — первые результаты показали, что соцсеть успешно противостоит мимолетному желанию интернет-тролля обидеть других пользователей. Это лучше, чем разбираться по факту, как это делает Facebook.

Опять Google: компания обновила функцию перевода через камеру в приложении Translate, добавив еще 60 языков для распознавания. В следующем релизе приложение будет поддерживать более ста языков и автоматически определять язык текста, на который наведена камера. Вишенка на торте — создатели подтянули базовые модели нейросеток, благодаря чему существенно снизится процент ошибок при переводе. Даты обновления пока нет, но мы с нетерпением ждем. Пока перевод от Гугла напоминает таблички в китайских ресторанах — смешно и бессмысленно.

Берите отгулы, нам предстоит тяжелый бой: скоро в Starcraft II появится возможность сразиться с заклятым врагом — ИИ от Deepmind выходит на свободу. Чтобы вступить с ним в схватку, нажимаем кнопку «Участвовать» и готовимся к бою в рейтинговом режиме 1 на 1. ИИ сможет играть на любых картах и за любого персонажа. При этом для него будут введены ограничения по количеству действий в секунду, так что все по-честному. Deepmind не признается, что бои пойдут на дальнейшую прокачку нейросетей, но знайте — каждый ваш удар укрепляет врага. Важно: возможность разгромить ИИ будет доступна недолго.

В Китае создали нейросеть DSNet — она считает людей на снимке. Задача не новая — решения в этой области уже есть, однако их недостаток в том, что они работают с ограниченной областью изображения. DSNet сильно расширила анализируемую картинку благодаря плотному расширенному сверточному блоку, что позволило улучшить результат на 30% по сравнению с другими.
​​Усы и хвост — вот мои документы: китайский стартап научился распознавать собак по отпечатку носа

Разработчик технологии распознавания лиц для китайского правительства запустил новый продукт — nose recognition для собак. Владелец фотографирует нос питомца, отправляет в приложение, а дальше система сверяет картинку с базой данных, состоящую из других пользователей и приютов по всей стране. Точность распознавания животного — 95%. Благодаря технологии уже удалось вернуть хозяевам десятки тысяч потеряшек.

Почему мы до сих ходим с паспортом: процесс подтверждения собственности и личности — головная боль нашего времени. Сами подумайте: чтобы нас узнал турникет, надо вытаскивать Тройку из кармана, для машины нужны ключи и запылившиеся документы из бардачка, на чемодан клеят бирку, а квартира наша только после сотни бюрократических кругов ада. Бизнес и государство ищут способы оптимизации процесса. К примеру, ввести уникальные идентификаторы: нас распознают по лицу или сетчатки глаза, и сразу понятно — как зовут, где живем и когда последний раз ходили к зубному. Пока это все на стадии разработок, а вот собакам повезло больше.

Собачьи носы — это только начало: китайская компания Megvii, уже набившая руку на распознавании толпы, сделала то же самое для собак, заменив лица носами, а датчики — камерами. К уникальному идентификатору можно подключить медицинское обслуживание, страховку, сертификацию и возможность продажи. Больше не нужно чипировать пса, чтобы предотвратить потерю, его нос — уникальный код. Технология развивается и для других животных: недавно мы в компании учились распознавать коров по пятнам на теле (если интересно, расскажу как-нибудь подробней). Так что порадуемся за братьев наших меньших — в отличие от нас, им паспорт больше не нужен.
​​Что нового у нейросеток — вакцина от гриппа, покер, люди-невидимки:

◾️Ученые из Университета Флиндерс создали алгоритм, который вывел вакцину от гриппа. Для этого они скормили нейросети данные о химических соединениях и разработали программу, которая их генерирует, отталкиваясь от устройства иммунной системы человека. Вакцина прошла первичные испытания и уже активно тестируется на людях. Сейчас фармакологические компании тратят миллиарды на разработку лекарств. Если алгоритм докажет профпригодность, то в скором будущем нас ждут глобальные перемены. Сегодня — грипп, завтра — рак.

◾️Один алгоритм научился собирать кубик Рубика за секунду, другой — обыграл людей в покер. Победа в карты особенно интересна, потому что ИИ не анализировал, с чем сидят противники, а предсказывал удачные ходы и даже блефовал. Новости на полку к остальным: мы уже говорили про Дженгу и компьютерные игры. Зачем дата-сайентисты генерируют игровые сетки одну за другой? Все просто — они учат нейросети думать, используя тот же подход, что мы используем с детьми, — через развивающие игры. Возможно нынешние алгоритмы, обучавшиеся на кубиках, когда-нибудь эволюционируют и превзойдут учителей. А, может, останутся на второй год в школе.

◾️Пока одни распознают объекты, другие их удаляют. Алгоритм стирает человека из видео — достаточно руками вырезать его на первом кадре. Пока результаты сыроваты: присутствие скрытого пешехода заметно в кадре — видно силуэт и неровности ландшафта вокруг. На технологию будет спрос, поэтому ее развитие неизбежно. Всегда найдется тот, кто захочет остаться незамеченным для других.
​​Клуб по интересам — что такое Capture и есть ли у социальной сети на базе машинного обучения будущее?

Создатели Prisma запустили групповой мессенджер Capture. Работает это так: вы наводите камеру на объект, и приложение предлагает чат с похожей тематикой. К примеру, фотография билборда с рекламой сериала приведет в группу, где его активно обсуждают. А фото телевизора — в чат с названием “Что посмотреть?”.

Почему важно: идея команды — сделать мессенджер по интересам в мире, где уже есть Facebook, Twitter и Telegram. Гиганты социальных сетей использует ИИ только в отдельных задачах — для борьбы с порно, кибербуллингом или настройки новостной ленты. Чтобы выделиться на их фоне, ex-участники Prisma переложили выбор собеседников на алгоритмы и создали полноценную ML-платформу.

Почему построить ML-платформу — не так просто: задача, которая стояла перед Capture, близка к General AI: пользователь должен получить отклик в любой локации. Неважно, что на снимке — котик или новое изобретение Илона Маска, алгоритмы должны что-то распознать. На первых этапах разработки трудно натренировать сети находить все и сразу, но можно научить ИИ предугадывать обстановку по ключевым признакам, как это делает Google Lens.

От качества работы алгоритмов зависит успех Capture — чем лучше они научатся различать объекты, тем выше вероятность, что пользователь останется. Для этого нужны обширные датасеты: если аудитория приложения миллениалы со смартфонами, значит, алгоритмам нужны интерьеры квартир и живописные городские пейзажи. Первое можно вытянуть из Циана — там миллионы изображений, которые можно скормить нейросети. С улицей сложнее — любопытно узнать, как и где создатели собирают данные. И главное — поиск по локации никто не отменял, в Capture он тоже есть. Не надо делать миллионную фотографию Москва-Сити, чтобы присоединиться к чату тех, кто там работает.

Что будет дальше: время покажет, приживется ли Capture в мире. Возможно, название “захватить” окажется пророческим, и мы станем на шаг ближе к виртуальной реальности, а может, приложением заинтересуется Facebook. Тогда Capture познает печальную участь Instagram. Конечно же, мы болеем за первое.
​​Как тебе такое, Илон Маск? Microsoft инвестировал миллиард в OpenAI и поставил будущее перспективной компании под сомнение

Microsoft инвестирует в некоммерческую организацию OpenAI $1 млрд. Детище Илона Маска перенесет сервисы на Microsoft Azure, а корпорация сможет продавать продукты на основе технологий OpenAI в эксклюзивном порядке. В рамках партнерства компании планируют создать вычислительную платформу беспрецедентных масштабов, которая поможет вывести ИИ на новый уровень.

Почему мы грустим: Open AI считалась некоммерческой организацией, которая не принадлежит участникам рынка, а работает исключительно на благо человечества. Больше это не так. Первый тревожный звонок был в феврале этого года — из совета директоров ушел Илон Маск из-за конфликта интересов. Затем в компании вдруг появился коммерческий отдел. И, наконец, погребальный звон — миллиард от Майкрософта.

Видимо, первый $1 млрд, который в OpenAI вложили отцы-основатели в 2015 году, потихоньку заканчивается. Прошлые и нынешние инвестиции сильно отличаются по качеству: если Маск отдал деньги и отошел в сторону, то Microsoft после щедрого вложения попросил перенести вычисления на свои облачные сервисы и дать эксклюзивное право на продажи будущих технологических прорывов.

Вспомним GitHub и Skype: опыт подсказывает, что проекты не становятся лучше после того, как их покупают такие неповоротливые гиганты, как Microsoft. Так было со Skype в свое время и с GitHub в прошлом году: когда самый крутой продукт среди разработчиков ушел с молотка, доверие к нему пошатнулось. Давно известно, как Microsoft любит собирать данные о пользователях и навязывать свои услуги.

Остается только гадать, что ждет ИИ в будущем. Ясно одно: пока недовольные переменами сотрудники пакуют вещи, на двери OpenAI, самой открытой компании мира, перевернулась табличка — sorry, we're closed.
1
​​Подводим итоги недели — террористы, видеоролики, квартиры

◾️ ИИ от Facebook обновит карты в странах третьего мира. Проблема, с которой столкнулся некоммерческий сервис OpenStreetMap, — нехватка актуальных данных о расположении дорог. Миллионы километров остаются в слепой зоне в таких странах, как Афганистан и Нигерия, и среди местных нет желающих это исправить. Нейронки Марка Цукерберга специально для OpenStreetMap проанализируют спутниковые изображения с разрешением 0,1 кв. м на пиксель и добавят все отсутствующие объекты. Кажется, что теперь любой желающий сможет рассмотреть секретные бункеры запрещенных организаций.

◼️ Нейросеть от отечественной лаборатории Samsung AI генерирует видеоролики с новых ракурсов. Напомним, что так уже делали в Google, Deepmind и Nvidia, однако их результаты желают оставлять лучшего. Здесь же картинка впечатляет — даже мелкие детали выглядят реалистично словно их действительно сняли на камеру.

◼️ ИИ упрощает жизнь архитекторам. Алгоритм-планировщик квартир научился строить комнаты и вычислять подходящее положение дверей и окон в пространстве. Естественно, что на сеточное решения пускать в производство пока рано — алгоритмам не хватает данных, однако снять с архитекторов рутинные задачи по вычислениям они уже в состоянии.
​​После небольшого перерыва возвращаюсь к вам с дайджестом важных новостей о нейросетях:

◼️ Пока в Москве наступила осень, в Сибири который месяц горят леса. Ученые из РАН подключились к спасению природы — создали простенькую нейросеть, которая анализирует площадь леса. Она поможет определить масштабы бедствия после пожаров, а в будущем научится отслеживать браконьерские мародерства и предсказывать изменение природного ландшафта в связи с глобальным потеплением. Пока сетка ошибается, потому что в ее арсенале только снимки со спутника, но участники географического общества обещали предоставить больше данных.

◼️ DeepMind (aka Мои-боты-уделают-тебя-в-Starcraft) представила финансовый отчет за прошлый год, результаты печальные. ИИ-лаборатория, приобретенная Google, в минусе на полмиллиарда долларов. Из отчета видно, крупная часть бюджета ушла в медицину — ИИ-диагностику рака и других заболеваний. Однако прорыва не случилось. Если Deepmind и одержал победу, то только над зергами.

◼️ Facebook и Google — два гиганта конкурируют за то, на чем пишут разработчики. TensorFlow от Google исторически вел в этой гонке, но недавно количество статей, написанных с использованием PyTorch от Facebook, сравняло счет. Отличие между фреймворками существенное, и долгое время TF был стандартом в ресерче. Но времена меняются, тип кода в статьях — это основной драйвер для переиспользования его в своих разработках.