AI Happens
14.6K subscribers
84 photos
9 videos
193 links
Привет! Я Леша Хахунов, основатель Dbrain.io, и это мой канал про искусственный интеллект.
Download Telegram
#cv #cases

Аэропорт Хитроу задействует ИИ для посадки самолетов в непогоду

Национальная служба воздушного движения Великобритании (NATS) запустила тестовую систему, работающую на основе искусственного интеллекта, которая поможет диспетчерам контролировать самолеты в условиях плохой видимости.

Почему важно: В плохую погоду видимость с 87-метровой вышки в Хитроу минимальная –– авиадиспетчеры вынуждены полагаться только на радар, дабы убедиться, что приземлившийся самолет успел очистить посадочную полосу для следующего рейса. Все это отнимает время –– вот здесь и пригодится AI. Англичане установили на вышке 20 камер и начали испытание системы машинного зрения Aimee, разработанной канадским поставщиком Searidge Technologies.

Натренированная Aimee должна отслеживать самолеты с момента их посадки через камеры и сообщать живым коллегам, когда полоса готова принимать следующее воздушное судно. Главное, алгоритм не принимает решение, а только подсказывает диспетчерам, как поступить. И это правильно –– ИИ по-прежнему очень тяжело использовать в задачах, где нужна стопроцентная точность. Как вы понимаете, посадить 95 из 100 самолетов –– не лучшая статистика. AI, вероятно, будет играть важную роль в управлении воздушным движением в будущем, а пока ждем результатов испытаний –– их объявят в марте следующего года.
#nlp #news

Опасный ИИ –– OpenAI создала генератор текстов, который работает слишком хорошо

Алгоритм GPT-2, натренированный на 40 гигабайтах текстов из интернета, научился писать осмысленные тексты. Он предсказывает каждое следующее слово, подходящее по стилю и содержанию. OpenAI решила не выкладывать в открытый доступ полноценный программный код, полагая, что алгоритм может быть опасным, что сильно расстроило сообщество, ведь компания создавалась именно на принципах полной открытости полученных результатов.

Почему важно: В 2015 году лаборатория, основанная Илоном Маском, зарядилась альтруистической целью –– создавать ИИ на благо человечества. Но это было 4 года назад, а сейчас OpenAI побоялась выкладывать свою разработку в открытый доступ. Уж слишком высока вероятность, что ИИ быстро переманят на сторону зла и будут использовать для генерации фейковых новостей и спама. OpenAI создали мощного противника человечества в Dota 2, теперь –– идеального писателя, которому не нужно вдохновение.

Эта новость –– отличный повод поговорить о NLP (направление ML по обработке текста) и его ключевых проблемах. Даже самые огромные бюджеты, которые компании тратят на попытки автоматизации службы поддержки и ответы в чатах пользователям, упираются в число 30%. Это средний объем автоматизации сообщений, выше которого прыгнуть сложно, даже внутри одного маленького домена тем. NLP ждет какого-то фундаментального открытия, которое позволит перейти от статистических методов к полноценному deep learning подходу. Возможно алгоритм GPT-2 поможет сдвинуть NLP с текущей мертвой точки.
​​​​​​Все пишут, что Сбербанк потерял миллиард рублей из-за ИИ. Что случилось и при чем здесь Dbrain?

Вчера глава Сбербанка Герман Греф посетил «Урок цифры» в одной из московских частных школ. В разговоре со школьниками банкир сказал –– когда мы доверяем ИИ управление платежами, ошибка в проценты на транзакциях в несколько миллиардов приводит к колоссальным убыткам. Как это часто бывает, в погоне за красивым заголовком СМИ исказили факты: на встрече Греф говорил немного о другом.

Так и при чем здесь мы? Справа от Грефа сидел одиннадцатиклассник Саша Мамаев. В свободное от встреч с бизнесменами время он работает в Dbrain на позиции Middle Data Scientist. Во время дискуссии на тему safety ML Саша сказал, что самое сложное в работе с данными –– это не построить «моральный компас» для беспилотника, а удачно собрать датасет и учесть в нем правильное распределение классов. В качестве аргумента, как истинный оратор, привел в пример тезис Грефа –– к чему могут привести ошибки и аварии. Очевидно, что в fintech –– к большим денежным потерям.

Как итог –– издания пишут о миллиардных потерях Сбербанка в ИИ из-за высказывания Грефа и одного школьника Саши.
#cv #cases

ИИ пока не в силах искоренить запрещённый контент в YouTube

СМИ рассказали, как алгоритм видеохостинга проворонил целое сообщество педофилов. Под детскими роликами с соревнований по гимнастике и плаванию пользователи оставляли таймкоды с «пикантными моментами» и комментарии с сексуальным подтекстом. На протяжении месяцев алгоритм не банил педофилов, а рекомендовал им похожий контент. После публикации в СМИ YouTube оперативно закрыл комментарии к видео с детьми.

Почему важно: Отойдем от социальной повестки и остановимся на технической –– почему YouTube допустил подобную ошибку, и что можно сделать, чтобы не повторить ее в будущем?

Не будем думать, что YouTube, как плохой маркетолог, привлекает пользователей запрещенным контентом. Да, задача алгоритма –– удержать зрителя на платформе, но точно не при помощи nudity –– она давно запрещена. Видя интерес пользователя, казалось бы, к невинным видео, он не задумываясь формирует рекомендации. В своей работе ИИ опирается не только на название и категории, а также разбирает каждый кадр и содержание. Танцы детей он блокировать не обучен.

Как это исправить: Сейчас YouTube просто закрыл комментарии ко всем видео с детьми –– это решение, принятое на скорую руку, чтобы охладить возмущение общественности.

В долгосрочной перспективе у YouTube есть несколько вариантов. Во-первых, помимо nudity распознавать кадры, хотя бы отчасти напоминающие детскую эротику, и создать для нее отдельные правила. Во-вторых, что более вероятно, –– собрать для алгоритма общий шаблон поведения педофилов и за пару просмотренных видео, перемоток и комментариев начать банить их на уровне устройства. Наше мнение –– давно пора.
#cv #cases

В мобильном приложении Excel появился ИИ –– он распознает таблицы по фото

Microsoft анонсировала функцию (пока доступна только на Android), с помощью которой пользователи могут фотографировать печатную таблицу и преобразовывать ее в цифровую версию в Excel. Пользоваться фичей могут только владельцы подписки Office 365.

Почему важно: Недавно мы рассказывали, как Adobe использует machine learning для улучшения качества снимков. Теперь настало время Microsoft: тут пока нет ML, но применить классический computer vision компания уже смогла –– в Excel. Отказавшись от нейросеток, разработчики тем самым обеспечили пользователям мгновенный результат.

Правда, говорить о глобальных победах рано: с таблицами сложнее 3х5 инструмент не справляется, превращая данные в кашу. Почему? Основная сложность –– сделать результат устойчивым к условиям съемки. Вероятно, в будущем, когда компания соберет многомиллионные примеры наших таблиц, алгоритм заработает лучше.

Увы, крупные корпорации редко думают о проблемах простых людей –– пользоваться продуктом будут и так. Но раз Microsoft озаботился созданием функционала для комфортной работы в Excel, от лица всех страждущих предложим пару идей для будущих разработок: добавить автоматическое форматирование текста (шрифты, размер, расположение) и научиться предсказывать наше следующее действие в таблице на базовом уровне. Мелочи, а приятно.
Опробовали новую функцию в таблицах?
Anonymous Poll
7%
Уже да
59%
Пока нет
34%
Пользуюсь другими ресурсами
#cases

Диетолог ИИ –– почему доверять здоровье ему пока рано

Компания DayTwo разработала алгоритм, который подбирает персонализированную диету на основе анализов микрофлоры кишечника. Для обучения алгоритма создатели провели двухнедельный эксперимент, в течение которого добровольцы носили датчики глюкозы и записывали все приемы пищи.

Почему важно: Диеты «для всех» –– зло. Они не учитывают наше состояние организма –– сидеть на них опасно для здоровья. Мы можем неделями ограничивать себя в каких-то продуктах, даже не догадываясь, что без них нам тяжело функционировать. Алгоритм от DayTwo должен решить эту проблему: собрав все необходимые данные, он вычислит индивидуальные особенности организма и предложит здоровое меню на каждый день. О революции пока рано говорить, но data driven подход –– это первый шаг к созданию системы питания, которая будет заточена под конкретного пользователя. Никаких эмпирических наблюдей, только конкретные данные.

Теперь к ложке дегтя: Как массово собирать данные для алгоритма? Окей, активность, сон и пульс выкачаем из эпл-вотчей или фитнес-браслетов, но как быть с информацией по кишечнику? Тут нужны не цифровые, а реальные данные, то есть анализы.

Тестовые результаты чересчур оптимистичные, выборка в тысячу человек и отсутствие детального описания тестирования и обучения алгоритма вызывают сомнения. Бесспорно –– наступят времена, когда вопрос «Siri, что взять на ужин?» будет звучать из каждого супермаркета, но когда это случится –– пока не ясно.
#news

OpenAI и Google создают инструмент для изучения работы нейросети под «микроскопом»

Группа исследователей разработала «микроскоп» для нейронных сетей –– это инструмент Activation Atlases. Он анализирует работу алгоритмов, определяет, по какому принципу ИИ принимает решение, тем самым позволив исследователям проникнуть в «сознание» нейросети.

Почему важно: Дешифровки обученной нейросети –– старая и действительно сложная задача, потому что никто точно не может сказать, как именно ИИ приходит к решению. Машины, работающие на основе сложных алгоритмов, хранят все не в блоках памяти, как обычные компьютеры, а в «черном ящике». Чем умнее алгоритм, там сложнее расшифровка «черного ящика», другими словами, его сложно понять.

Например, мы хотим научить ИИ отличать кошечку от собачки. Собрали датасет, алгоритм работает. Однако «заглянув под капот», мы выясняем, что нейросеть заметила, что собаки чаще всего изображены с поводками и на улице, и начала различать животных таким образом –– кто на привязи, тот и пес. Хотя понятно, что этот признак далеко не ключевой.

Вот здесь и пригодится Activation Atlases –– в контроле оверфита при обучении. Оверфит –– это переобучение модели, когда вместо того, чтобы найти общие признаки класса, алгоритм понимает признаки обучающей выборки.

Другое преимущество «микроскопа» от Google –– он поможет устранить уязвимости в нейронных сетях, связанных с неточной классификацией изображений. К примеру, ранние модели нейросетей ошибочно определяли чернокожих людей как горилл –– неприятная путаница, которую теперь будет проще избежать. К тому же, зная, как устроена система, ее будет сложнее обмануть. Был известный трюк: разработчики надели на людей желтые очки и тем самым сломали фейс-рекогнишн, который до этого справлялся хорошо. Так вот –– больше так не получится.
#news

Анонимность в интернете –– как ИИ сначала ее отнял, а теперь вернул

В прошлом месяце заработал сайт thispersondoesnotexist.com –– он генерирует лица несуществующих людей. За пару секунд нейросеть создает реалистичный портрет человека, которого сложно отличить от живого. Создавать цифровых людей можно бесконечно: лица ни разу не повторяются.

Почему важно: Многие уже успели оценить разработку, нагенерировав себе сотни несуществующих лиц. Другой вопрос –– зачем? На самом деле, эта технология –– не очередной хайп на ИИ, а одно из самых значимых событий 2019 года.

Анонимность в интернете давно на грани исчезновения. Соцсети собирают информацию, добавляя все новые и новые пометки в наши личные дела каждый день. Куда ходим, что едим, с кем общаемся –– уже нет смысла обновлять статус в Фейсбуке, алгоритмы и так поняли, что вы расстались с девушкой.

Любую фотографию, которую мы отправляем в интернет, распознают и проверяют –– нет ли где-то еще человека с такими же снимками. Спрятаться под чужими фотографиями и именами уже нельзя.

А если использовать уникальное лицо, которое выдает генератор, то можно создать профиль человека, которого никогда не было и не будет. Нейросеть может не только сгенерировать лицо, но и предположить, как бы человек выглядел и в 5, и в 70 лет –– материала хватит на три семейных альбома.

Разработка основана на генеративно-состязательных нейросетях –– когда между собой соперничают две нейросети. Та, что создает изображение ("генератор"), и вторая, которая пытается понять, реальная ли эта фотография или сгенерированная. Благодаря такому подходу другие нейросети не могут понять, что перед ними фейк.

Ждем, когда в Китае, где распознавание лиц внедрили на улицы, появятся подпольные фабрики по производству силиконовых масок с творениями нейросетки. Гай Фокс версия 2.0 –– теперь в киберпанке.
Разметчик в полосатой пижаме –– как финский стартап обучает ИИ с помощью заключенных

Финский стартап Vainu с помощью ИИ собирает базу данных компаний для облегчения поиска клиентов и подрядчиков. Чтобы искусственный интеллект не путал статьи о компании Apple со статьями про яблоки, людям нужно вручную размечать сотни текстов для обучения алгоритма. Статьи на английском языке можно перепоручить подрядчикам на краудсорсинговых платформах, но на финском таких сервисов нет. Так в Vainu придумали отдать эту задачу на аутсорс заключенным.

Компания поставила десять компьютеров в две тюрьмы в Хельсинки и Турку, на которых работает сто человек. Разметчики получают вознаграждение за каждую выполненную задачу, правда, большую часть забирает государство.

Почему важно: Мы уже писали, как финны приобщили пенсионеров к ИИ. Пришла очередь заключенных. Люди из «мест не столь отдаленных» дорого обходятся государству. Нарушил закон –– и вот ты уже сидишь в тюрьме с трехразовым питанием за счет налогоплательщиков. В России, к примеру, в год на одного заключенного уходит почти полмиллиона рублей.

Задача ведомства –– создание дополнительных рабочих мест для заключенных. Пока в России в тюрьмах шьют одежду, в Финляндии размечают данные. Такое сотрудничество выгодно обеим сторонам –– стартап обеспечил себя разметчиками, у которых по объективным причинам уйма свободного времени и сил, а тюрьме –– прибыль.
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня без новостей, но с просьбой

На Product Hunt запустился Handl — это наш сервис для разметки от Dbrain. Мы хотим, чтобы больше людей узнали о нашем проекте, для этого нужны ваши голоса. Потратьте меньше минуты — оставьте фидбек.

Вот ссылка и наше уважение: https://www.producthunt.com/posts/handl-3
Привет, с вами Леша — сооснователь Dbrain. У меня для вас две хорошие новости:

Первая — с вашей помощью вчерашний запуск нашего сервиса для разметки Handl на Product Hunt прошел успешно. Мы заняли второе место в лучших продуктах дня, собрали клиентов, получили фидбек от разметчиков и друзей. Жму руку каждому — без вас бы ничего не получилоcь.

Немного о Handl: частая проблема в разработке ИИ — подготовить данные. Мы упростили этот процесс и запустили платформу, которая объединяет удалённых работников и технологические компании для создания ИИ. Подробнее читайте в нашей статье на VC.ru

Вторая новость — журнал Forbes включил меня в список «30 до 30» в категории «Наука и технологии». Отдельно хочется сказать еще раз спасибо всей команде Dbrain, это наша общая победа.

На этом сегодня все. Скоро вернусь к вам со свежими постами.

AI happens!
#news

В Южной Корее следователи раскрыли криптовалютную пирамиду. СМИ говорят — при помощи ИИ. Объясняем, почему ИИ здесь ни при чем.

Корейские следователи научили алгоритм при помощи ключевых слов находить скамеров в интернете. Благодаря технологии стражи порядка уже задержали создателей крупной финансовой пирамиды на базе токена M-coin, который не представлен ни на одной крупной бирже. За платную подписку мошенники выдавали пользователями 600 токенов и предлагали столько же за привлечение друзей. Меньше чем за год преступники заработали $18 млн.

Почему важно: ИИ помогает спецслужбам и государственным банкам ловить финансовых преступников — в Южной Корее в том числе. Алгоритмы следят за тем, как вы совершаете покупки по карте, и, если видят признаки того, что у вас ее увели, бьют тревогу, — классический ML в действии.

Конкретно в этой истории для борьбы с мошенниками следователи собрали ключевые слова, свойственные скаму, отдали их алгоритму, и он через html-документы проверил сайты на их наличие. Искусственный интеллект, о котором написала пресса, здесь ни при чем. Немного статистики, базовой аналитики, словаря синонимов — и ура, следователям удалось вычислить криптонегодяев. Новость хорошая, но давайте не будем называть айяйем каждый алгоритм в 2019.
​​ИИ — теперь и дизайнер. Искусственный интеллект спроектировал стул — удобный и практичный одновременно

Поставщик программного обеспечения Autodesk вместе с дизайнером Филиппом Старком спроектировали мебель при помощи искусственного интеллекта. Разработанный компанией алгоритм создал удобный и прочный предмет мебели, задействуя как можно меньше материала. ИИ действовал в отрыве от культурных ценностей, истории и представлений человека о прекрасном.

Почему важно: Может ли искусственный интеллект творить как художник? Вполне. Проще всего это сделать так: ИИ учат генерировать контент при помощи Gan'ов (Generative adversarial network a.k.a генеративно-состязательная сеть). Создаются две нейросети: одна генерирует образы, а другая старается отличить образ из реального мира от образа, созданного генератором. В итоге получается контент, близкий к существующему, однако все равно уникальный в своем роде (вспомните генерацию несуществующих лиц).

Autodesk поставил ИИ другую задачу — не создать что-то уникальное, а только накреативить как можно больше вариантов мебели в рамках заданных условий (дизайн, комфорт, практичность и экономия материала). И все получилось: дизайнер задал базовые настройки, а дальше уже творил алгоритм. С нетерпением ждем столы, машины, мосты от ИИ, а пока опробуем стулья.
​​#news

Disney обучил алгоритм читать сценарии и снимать по ним видео

Исследователи из Disney Research разработали алгоритм, который создает анимационные ролики по предложенному сценарию. Генерация изображений происходит в Unreal Engine — это игровой движок, который также используют для создания компьютерной 3D графики в мультфильмах и кино.

Почему важно: тут Disney не первый, но пока лучший — алгоритмы, создающие ролики по текстам, уже существуют. У них есть недостаток — они плохо понимают естественный язык и справляются только с простыми короткими предложениями, да и оценить качество их работы сложно. Disney же решил большинство проблем.

Получилось это благодаря созданию системы из трех модулей. Первый, модуль обработки языка, разбивает сложные предложения на простые, заменяет слова на понятные синонимы. К примеру, из предложения «я бегаю по утрам и ем кашу на завтрак» получается «я бегаю по утрам & я ем кашу на завтрак». Второй, модуль синтаксического анализа текста, извлекает смысл из предложения для видео. И третий модуль генерации анимации, собственно, создает картинку.

Идея Disney в том, что можно написать сценарий, отрисовать героев, а за их движения пусть уже отвечает нейросеть. Пока технология отдает сыростью, но начало положено. Представьте студию, где вместо сотни аниматоров и сценаристов сидит один человек. В окружении компьютеров он лениво листает утреннюю газету, пока ИИ пишет свой очередной шедевр и претворяет его в жизнь.
​​Привет всем! Этот канал родился из обсуждений новостей об ИИ у офисного кулера. В какой-то момент нам стало этого мало — так появилась идея делиться инфоповодами не только друг с другом, но и со всеми желающими.

Перед запуском мы изучили разные медиа (Телеграм в том числе) и сегодня делимся с вами русскоязычными каналам об ИИ, которые с удовольствием читаем сами:

1. Если хотите стать дата-сайентистом, вам в data root labs

Зачем читать: канал ведет команда data root labs — курсов по изучению Data Science и Engineering. Помимо бесплатных обучающих материалов, доступных каждому, здесь собраны последние новости из мира ИИ. Как бонус: авторы часто разбавляют статьи локальными мемами, которые понятны и простым смертным.

2. Если вы не хотите тренировать нейросетки, но хотите о них читать, вам в Hey Machine Learning

Зачем читать: канал от инженеров Hey Machine Learning — компании, разрабатывающей решения в области ИИ. Ребята пишут не только об искусственном интеллекте, но и о технологиях в целом. Главное преимущество канала — еженедельные подборки новостей, короткие и информативные.

3. Если вы в поиске глубокой аналитики ИИ кейсов, вам в NeuroHive - Нейронные сети

Зачем читать: канал от разработчиков из NeuroHive. Здесь нет новостей с кричащими заголовками в стиле “ИИ вот-вот заберет работу у людей”, админы публикуют только реально работающие кейсы и последние исследования в области нейронных сетей.
​​#news

Google представил нейросеть, которая оптимизирует работу других нейросетей — делает их быстрее, легче и продуктивнее

Исследователи из Google представили модель MorphNet, которая способна оптимизировать работу любой нейросети благодаря циклу сокращающихся и расширяющихся фаз. Сначала MorphNet выявляет неэффективные нейроны и удаляет их из сети, затем перераспределяет вычислительные ресурсы из менее эффективных частей сети в более эффективные.

Почему важно: Бытует мнение, что чем больше размер нейросети, тем лучше будет решение на выходе. Но проблема в том, что подобные модели тяжело обучить — они требуют тонну данных и много вычислительных мощностей. Поэтому часто после того, как получен первый результат, запускается процесс дистилляции — передачи знаний от большой нейронной сети маленькой. Обычно это долгий кропотливый процесс. И, главное, не факт, что все получится.

Решение от Google — это попытка оптимизировать работу нейросети при помощи другой нейросети. Если верить статье, вполне удачная: MorphNet показала высокий процент успеха. К тому же радужный поисковик решил задачу, которую никто прежде не осилил. Он сделал возможным сохранение переобучаемости модели. Другими словами, после сжатия сети можно взять новые данные и интегрировать их в свежее решение.

Мы все ждали, когда робот начнет собирать других роботов, но, кажется, ИИ гораздо ближе — нейросеткам мы уже почти не нужны.
​​ИИ vs человек: кто лучше диагностирует рак?

Нейросеть и сотня радиологов проверили десятки тысяч маммограмм на наличие уплотнений и поражений мягких тканей. В среднем система оказалась эффективней в определении рака груди, но проиграла опытным врачам в некоторых кейсах.

Почему важно: Результаты исследования предсказуемы — нейросетка работает лучше, чем врач из районной поликлиники хотя бы потому, что за короткую жизнь увидела гораздо больше материала. Почему же тогда она уступила светилам медицины?

Во-первых, тестирование врачей выполнялось не на случайных снимках, а на конкретных кейсах из их практики. Это означает, что у людей больше контекста, чем у алгоритма, — они знали историю болезни.

Во-вторых, чтобы обучить нейросеть необходимы правильные ответы. Проблема в том, что в одной поликлинике вам скажут, что насморк — от простуды, в другой вас отправят на аллергопробы. Мнения врачей расходятся, и на многие болезни приходится десяток диагнозов. Порой узнать, какой из них правильный, поможет только вскрытие. Это отражается на точности алгоритма: его «верно/не верно» строится на расплывчатых ответах, полученных от врачей.

Даже если алгоритм можно дообучить, возникает вопрос — когда мы увидим ИИ в больницах? Если коротко — когда государство научится централизованно хранить данные в едином формате и анонимизировать их (клятву Гиппократа никто не отменял). Как только это произойдет, уровень доступности медицины вырастет, особенно в регионах, где катастрофически не хватает специалистов.
​​Краткость — сестра таланта. Как нейросеть от «Вконтакте» упростит жизнь пользователям?

Компания «Вконтакте» представила нейросеть, которая генерирует новостные заголовки на русском и английском языках. Для этого она читает текст новости, а дальше формулирует заголовок, соблюдая правила грамматики. Обучение проходило на материалах «РИА Новости» и «The New York Times».

Почему важно: Генератор заголовков от ВК получает семантический смысл крупных блоков текста и выносит из него главную мысль. Как всегда непростой этап в решении подобных задач — это оценить качество на выходе. Хороший получился заголовок или плохой? Чтобы ответить на этот вопрос «Вконтакте» проверил нейросеть на фокус-группе. Около 45% опрошенных отметили, что человеческий и машинный заголовки ничем не отличаются, 15% сказали, что алгоритм справился лучше. Оставшиеся 40% отметили, что нейросеть пока рано устраивать в штат Нью-Йорк Таймс. Вероятно, разработчики сделают работу над ошибками и дообучат алгоритм.

Эту pазработку нужно развивать не только из-за заголовков. Мы живем во времена, когда от количества нотификейшенов дергается глаз, и потоки информации — уже не потоки, а ураганы, сбивающие с ног. Алгоритм, который способен сократить простыню текста до пары строк, не потеряв смысл по дороге, сэкономит кучу времени — и журналистам и нам, читателям.