AI Happens
14.6K subscribers
84 photos
9 videos
193 links
Привет! Я Леша Хахунов, основатель Dbrain.io, и это мой канал про искусственный интеллект.
Download Telegram
Израильский стартап SeeTree собрал $11.5 млн на развитие сельского хозяйства

Компания помогает агрономам вычислить больные растения на полях и составить эффективный план по сбору урожая. В качестве источников данных предлагают использовать дронов.

Почему важно: Переход к аналитике на уровне отдельной единицы — это большой прорыв в аграрной культуре. Ребята делают крутое дело (закроем глаза на технические сложности сбора данных и маркетинговые рендеры апельсиновых деревьев на сайте компании).

Если SeeTree удастся определять цвет листвы каждого дерева — будет уже хороший продукт. Насчет сканирования урожайности — есть сомнения. Дроны на таких площадях могут стать проблемой, к тому же продавать без долгой интеграции у каждого клиента не получится. Технологически проект выглядит решаемо, но как это масштабировать и обеспечить клиентскую поддержку –– пока непонятно. В любом случае –– стартап интересный, будем следим за его апдейтами.
Искусственный интеллект впервые обыграл профессиональных игроков в StarCraft II

Нейросеть AlphaStar, разработанная подразделением Google по исследованию ИИ DeepMind, обыграла человека в популярной стратегии реального времени StarCraft II.

Почему важно: Этой новости уже несколько дней, но очень хочется вставить свои 5 копеек. Глядя, как робот обыгрывает лучших игроков StarCraft, становится страшно: отвлекаешься на секунду –– и уже не знаешь, где мышкой руководит человеческая рука, а где –– безжалостный ИИ. Предыдущее сражение в Dota, где ИИ управлял сразу 5 юнитами, показало, что его по-настоящему сильная сторона –– скорость реакций. В StarCraft II нейросетка выдавала в моменты боя фантастические 1500 действий в секунду, что далеко за пределами возможностей простых смертных.

Польский чемпион под ником MaNa проиграл со счетом 5:0 отчасти из-за того, что противник обнаружил необкатанные прежде стратегии. И это понятно –– AlphaStar обучался на записях полумиллиона игр между людьми, затем играл с постоянно улучшающимися клонами самого себя и, наконец, эволюционировал в то, что мы видим сейчас (#reinforcement_learning в действии).

А пока с нетерпением ждем летний финал чемпионата мира по Dota, где AI покажет, как справляется с пятью человеческими ролями одновременно во второй раз.
В Сан-Франциско хотят запретить отслеживание людей по лицам, а в Китае –– ловить коррупционеров с помощью ИИ

В Сан-Франциско внесли законопроект о запрете государственным органам использовать технологию распознавания лиц. В то же время в Китае приняли решение остановить работу системы, способной вычислить потенциальных коррупционеров из числа государственных служащих.

Почему важно: Две новости, появившиеся практически одновременно на разных концах земного шара, говорят о том, что вопрос использования AI актуален как для демократического, так и для тоталитарного государств (тема горячая, заслуживает отдельной рубрики). Пора сделать выбор –– либо мы доверяем системе, в которой живем, либо настаиваем на приватности персональных данных.

Применение #image_reсognition в качестве софта для обеспечения безопасности –– это, пожалуй, самое очевидное и логичное развитие технологии. Многие государственные структуры сейчас тестируют или пытаются внедрить распознавание лиц в городах для отслеживания криминальной активности. Например, в московском метро за прошлый год ИИ нашел в шесть раз больше преступников, чем полицейские.

Согласитесь: у нас давно нет личной жизни, хотя бы потому, что информацию о нас уже несколько лет успешно собирают мобильные операторы. Этого достаточно, чтобы устраивать тотальную слежку за человеком, но для поиска подозреваемого в толпе этого пока мало. Ближайший вопрос будущего –– будет ли ИИ следить за нами в открытую или останется тайным советником в руках разведки.
Нужна ли система распознавания лиц на улицах?
Anonymous Poll
53%
Да, так переловим всех преступников! 👍
47%
Нет, любую слежку надо пресекать! 👎
#computervision #cases

Tumblr учит ИИ банить порно –– пока получается плохо.

В конце прошлого года Tumblr запретил взрослый контент в микроблогах. 17 декабря, после того, как новые правила вступили в силу, стало очевидно, что искоренить порно –– задача непростая, и сделать это с помощью одних модераторов не получится. Специально обученный ИИ ошибочно удалил миллионы невинных картинок (досталось рыбкам, цветам, котятам), а, к примеру, хентай, не пострадал.

Почему важно: Удивительно, что Tumblr наступил на грабли новичка в области машинного обучения. В подобных задачах классификации самый важный шаг –– сбор не порноконтента, а данных, которые не являются NSFW (Not Safe For Work, другими словами –– nudity). Попытка обучить нейросеть на материале с Pornhub, очевидно провалилась. Без дополнительной фильтрации это бесполезно. Возьмем куриное яйцо –– ИИ будет упорно отправлять его в запрещенный контент, потому что для него все цвета человеческой кожи –– nudity.

Tumblr, скорее всего, уже осознал ошибку –– пока не сбалансируется обучающая выборка, котята будут улетать в бан. Как это сделать? #Active_learning хорошо справляется с подобными задачами: надо обучить нейросеть по обширной базе случайных картинок, допустим, с Flickr, где нет nudity, и отправить результаты разметчикам –– они отметят, где модель допустила ошибку. Таким образом обучающая выборка расширится максимально полезными данными, и хентай будет побежден. Учитесь на чужих ошибках, и не переживайте –– их допускает даже Tumblr.
#news

Google наняла разметчиков, обучающих ИИ для Пентагона

Компания “Google” наняла сотрудников для разметки данных через краудсорсинговую платформу Figure Eight. За $1 в час работники размечали символы на картинках — аналогах «капчи». Собранные данные должны были пойти на улучшение алгоритмов машинного зрения для военных дронов –– чтобы те эффективно распознавали объекты и людей на снимках. Позже поисковая компания заявила, что не будет продлевать контракт с американскими военными. Его действие закончится в этом году.

Почему важно: Государственные структуры добрались до разметки –– и понятно почему. Это крайне бюджетный способ натаскать ИИ с помощью людей, выполняющих простые задачи. Только представьте –– тысячи фрилансеров обводят объекты на терабайтах картинок квадратиками и получают всего 65 рублей в час по сегодняшнему курсу. И все это –– под радужной оберткой от Google.

С точки зрения технологий нет никакой новизны в поставленной задаче –– автопилоты и умные камеры в смартфонах уже давно используют похожие алгоритмы. Гораздо интересней тот факт, что, когда коллаборация Пентагона с Google была раскрыта, в главном офисе корпорации добра начались протесты: сотрудники выступили против совместной работы с военными. Досталось и сторонней платформе Figure Eight, которая занималась разметкой, –– журналисты ополчились на компанию, заявив, что сокрытие информации о пентагонском заказчике –– мягко сказать, неэтично. Прогнувшись под общественным гнетом, Google прикрыл проект.

Из всего этого следует вывод: пока в Сан-Франциско сворачивают фейс-рекогнишн, в Пентагоне обучают дронов. Правительство не собирается отказываться от программы, другой вопрос –– кто будет этим заниматься теперь.
#cases #cv

Робота научили играть в Дженгу –– объясняем, почему от этого выиграют все

Исследователи из Массачусетского технологического университета собрали робота, который умеет играть в Дженгу. Получив от создателей только способность к анализу и прогнозированию, робот научился самостоятельно перекладывать деревяшки, не разрушая башню.

Как это было: Вместо рук разработчики прикрутили робоигроку два подвижных блока –– их устойчивость даст фору самому аккуратному человеку. На роботизированных конечностях установили тактильный датчик и внешнюю камеру, благодаря чему компьютер получает визуальную и тактильную обратную связь и сравнивает эти измерения с движениями, которые уже делал. Делая предположения, робот корректирует поведение в режиме реального времени и стратегию в целом. К примеру, за несколько партий машина догадалась, что двигать деревяшку, плотно застрявшую между другими деталями, плохая идея, –– согласитесь, многие из нас шли к этой мысли годами, а некоторые и до сих пор не оставляют надежды.

Почему важно: Интересно не то, что робот научился играть в Дженгу, а сама технология, которую вскоре можно будет внедрить в производство. Например, запустить манипуляторы на конвейерных линиях и модули для сервисных роботов.

Многие крупные робототехнические корпорации пока не могут решить задачу качественной обработки продукции на конвейере, где каждый элемент отличается от другого. Робот может запросто собрать детали одного размера и веса, но нарезать овощи, которые по природе своей сильно отличаются по форме, он, увы, не сможет. ИИ, натренированный на Дженге, –– первый шажок к решению этой проблемы. Те же деревяшки, только за совсем другие деньги.
#news

В Финляндии пенсионеров подключили к изучению ИИ

Хельсинкский университет запустил курс по основам ИИ для пожилых людей. За 12 недель программа превращает пенсионеров в «евангелистов ИИ», которые помогают другим освоить базовые принципы работы машинного обучения и сферы его применения.

Почему важно: Вокруг ИИ сложилось множество мифов, главный из которых –– это сложная и недосягаемая для простого обывателя область. Правительство Финляндии придумало элегантный способ, как доказать, что ИИ –– ремесло, доступное даже бабушкам. Вместо того, чтобы вязать носки внукам, пожилые фины осваивают азы машинного обучения и роботехники.

Финляндия демонстрирует хороший пример работы с пожилыми людьми. После того, как американцы заявили, что компьютерные игры помогают в борьбе со старческой деменцией (другими словами, слабоумием), фины предложили пенсионерам добавить в досуг экшн-игры. Мало того, что в оздоровительных целях они уже рубятся в Starcraft, теперь еще продвигают ИИ в массы. Что ж, честь и хвала нашим северным братьям.
Сможем обучить наших пенсионеров основам ИИ?
Anonymous Poll
56%
Да, нашим бабушкам все по зубам 👍
44%
Нет, пока рано об этом говорить 😔
#cv #cases

Adobe добавил функцию улучшения фотографий на основе ИИ

Компания Adobe анонсировала новую фичу для редактирования фотографий под названием Enhance Details –– с помощью машинного обучения она улучшает разрешение и качество на увеличенных снимках до 30%.

Как это было: Adobe собрал миллиарды фотографий из интернета, ухудшил разрешение всех снимков и поставил перед нейросетью задачу –– вернуть исходное качество. В итоге алгоритм хорошо работает, например, на фотографиях со зданиями, но провернуть подобный фокус со снимком звезды с телескопа не выйдет –– просто потому, что в Сети нет столько исходных данных.

Почему важно: Помните, как в культовом сериале «CSI» сотрудники криминальной лаборатории приближали изображение на снимках без потери качества? Раньше зритель закатывал глаза от подобной небылицы, но теперь это почти реально. Почти –– потому что улучшить изображение можно, но пока только на 30%.

Технология по улучшению качества изображения (super-resolution imaging) существует уже несколько лет –– здесь ничего нового. Другое дело, что компания Adobe первая, кто интегрирует подобное решение в свои массовые продукты. На радость пользователям инструмент появится в Adobe Camera Raw, Lightroom Classic CC и Lightroom CC для Mac и Windows.
👍1
#cv #cases

Аэропорт Хитроу задействует ИИ для посадки самолетов в непогоду

Национальная служба воздушного движения Великобритании (NATS) запустила тестовую систему, работающую на основе искусственного интеллекта, которая поможет диспетчерам контролировать самолеты в условиях плохой видимости.

Почему важно: В плохую погоду видимость с 87-метровой вышки в Хитроу минимальная –– авиадиспетчеры вынуждены полагаться только на радар, дабы убедиться, что приземлившийся самолет успел очистить посадочную полосу для следующего рейса. Все это отнимает время –– вот здесь и пригодится AI. Англичане установили на вышке 20 камер и начали испытание системы машинного зрения Aimee, разработанной канадским поставщиком Searidge Technologies.

Натренированная Aimee должна отслеживать самолеты с момента их посадки через камеры и сообщать живым коллегам, когда полоса готова принимать следующее воздушное судно. Главное, алгоритм не принимает решение, а только подсказывает диспетчерам, как поступить. И это правильно –– ИИ по-прежнему очень тяжело использовать в задачах, где нужна стопроцентная точность. Как вы понимаете, посадить 95 из 100 самолетов –– не лучшая статистика. AI, вероятно, будет играть важную роль в управлении воздушным движением в будущем, а пока ждем результатов испытаний –– их объявят в марте следующего года.
#nlp #news

Опасный ИИ –– OpenAI создала генератор текстов, который работает слишком хорошо

Алгоритм GPT-2, натренированный на 40 гигабайтах текстов из интернета, научился писать осмысленные тексты. Он предсказывает каждое следующее слово, подходящее по стилю и содержанию. OpenAI решила не выкладывать в открытый доступ полноценный программный код, полагая, что алгоритм может быть опасным, что сильно расстроило сообщество, ведь компания создавалась именно на принципах полной открытости полученных результатов.

Почему важно: В 2015 году лаборатория, основанная Илоном Маском, зарядилась альтруистической целью –– создавать ИИ на благо человечества. Но это было 4 года назад, а сейчас OpenAI побоялась выкладывать свою разработку в открытый доступ. Уж слишком высока вероятность, что ИИ быстро переманят на сторону зла и будут использовать для генерации фейковых новостей и спама. OpenAI создали мощного противника человечества в Dota 2, теперь –– идеального писателя, которому не нужно вдохновение.

Эта новость –– отличный повод поговорить о NLP (направление ML по обработке текста) и его ключевых проблемах. Даже самые огромные бюджеты, которые компании тратят на попытки автоматизации службы поддержки и ответы в чатах пользователям, упираются в число 30%. Это средний объем автоматизации сообщений, выше которого прыгнуть сложно, даже внутри одного маленького домена тем. NLP ждет какого-то фундаментального открытия, которое позволит перейти от статистических методов к полноценному deep learning подходу. Возможно алгоритм GPT-2 поможет сдвинуть NLP с текущей мертвой точки.
​​​​​​Все пишут, что Сбербанк потерял миллиард рублей из-за ИИ. Что случилось и при чем здесь Dbrain?

Вчера глава Сбербанка Герман Греф посетил «Урок цифры» в одной из московских частных школ. В разговоре со школьниками банкир сказал –– когда мы доверяем ИИ управление платежами, ошибка в проценты на транзакциях в несколько миллиардов приводит к колоссальным убыткам. Как это часто бывает, в погоне за красивым заголовком СМИ исказили факты: на встрече Греф говорил немного о другом.

Так и при чем здесь мы? Справа от Грефа сидел одиннадцатиклассник Саша Мамаев. В свободное от встреч с бизнесменами время он работает в Dbrain на позиции Middle Data Scientist. Во время дискуссии на тему safety ML Саша сказал, что самое сложное в работе с данными –– это не построить «моральный компас» для беспилотника, а удачно собрать датасет и учесть в нем правильное распределение классов. В качестве аргумента, как истинный оратор, привел в пример тезис Грефа –– к чему могут привести ошибки и аварии. Очевидно, что в fintech –– к большим денежным потерям.

Как итог –– издания пишут о миллиардных потерях Сбербанка в ИИ из-за высказывания Грефа и одного школьника Саши.
#cv #cases

ИИ пока не в силах искоренить запрещённый контент в YouTube

СМИ рассказали, как алгоритм видеохостинга проворонил целое сообщество педофилов. Под детскими роликами с соревнований по гимнастике и плаванию пользователи оставляли таймкоды с «пикантными моментами» и комментарии с сексуальным подтекстом. На протяжении месяцев алгоритм не банил педофилов, а рекомендовал им похожий контент. После публикации в СМИ YouTube оперативно закрыл комментарии к видео с детьми.

Почему важно: Отойдем от социальной повестки и остановимся на технической –– почему YouTube допустил подобную ошибку, и что можно сделать, чтобы не повторить ее в будущем?

Не будем думать, что YouTube, как плохой маркетолог, привлекает пользователей запрещенным контентом. Да, задача алгоритма –– удержать зрителя на платформе, но точно не при помощи nudity –– она давно запрещена. Видя интерес пользователя, казалось бы, к невинным видео, он не задумываясь формирует рекомендации. В своей работе ИИ опирается не только на название и категории, а также разбирает каждый кадр и содержание. Танцы детей он блокировать не обучен.

Как это исправить: Сейчас YouTube просто закрыл комментарии ко всем видео с детьми –– это решение, принятое на скорую руку, чтобы охладить возмущение общественности.

В долгосрочной перспективе у YouTube есть несколько вариантов. Во-первых, помимо nudity распознавать кадры, хотя бы отчасти напоминающие детскую эротику, и создать для нее отдельные правила. Во-вторых, что более вероятно, –– собрать для алгоритма общий шаблон поведения педофилов и за пару просмотренных видео, перемоток и комментариев начать банить их на уровне устройства. Наше мнение –– давно пора.
#cv #cases

В мобильном приложении Excel появился ИИ –– он распознает таблицы по фото

Microsoft анонсировала функцию (пока доступна только на Android), с помощью которой пользователи могут фотографировать печатную таблицу и преобразовывать ее в цифровую версию в Excel. Пользоваться фичей могут только владельцы подписки Office 365.

Почему важно: Недавно мы рассказывали, как Adobe использует machine learning для улучшения качества снимков. Теперь настало время Microsoft: тут пока нет ML, но применить классический computer vision компания уже смогла –– в Excel. Отказавшись от нейросеток, разработчики тем самым обеспечили пользователям мгновенный результат.

Правда, говорить о глобальных победах рано: с таблицами сложнее 3х5 инструмент не справляется, превращая данные в кашу. Почему? Основная сложность –– сделать результат устойчивым к условиям съемки. Вероятно, в будущем, когда компания соберет многомиллионные примеры наших таблиц, алгоритм заработает лучше.

Увы, крупные корпорации редко думают о проблемах простых людей –– пользоваться продуктом будут и так. Но раз Microsoft озаботился созданием функционала для комфортной работы в Excel, от лица всех страждущих предложим пару идей для будущих разработок: добавить автоматическое форматирование текста (шрифты, размер, расположение) и научиться предсказывать наше следующее действие в таблице на базовом уровне. Мелочи, а приятно.
Опробовали новую функцию в таблицах?
Anonymous Poll
7%
Уже да
59%
Пока нет
34%
Пользуюсь другими ресурсами
#cases

Диетолог ИИ –– почему доверять здоровье ему пока рано

Компания DayTwo разработала алгоритм, который подбирает персонализированную диету на основе анализов микрофлоры кишечника. Для обучения алгоритма создатели провели двухнедельный эксперимент, в течение которого добровольцы носили датчики глюкозы и записывали все приемы пищи.

Почему важно: Диеты «для всех» –– зло. Они не учитывают наше состояние организма –– сидеть на них опасно для здоровья. Мы можем неделями ограничивать себя в каких-то продуктах, даже не догадываясь, что без них нам тяжело функционировать. Алгоритм от DayTwo должен решить эту проблему: собрав все необходимые данные, он вычислит индивидуальные особенности организма и предложит здоровое меню на каждый день. О революции пока рано говорить, но data driven подход –– это первый шаг к созданию системы питания, которая будет заточена под конкретного пользователя. Никаких эмпирических наблюдей, только конкретные данные.

Теперь к ложке дегтя: Как массово собирать данные для алгоритма? Окей, активность, сон и пульс выкачаем из эпл-вотчей или фитнес-браслетов, но как быть с информацией по кишечнику? Тут нужны не цифровые, а реальные данные, то есть анализы.

Тестовые результаты чересчур оптимистичные, выборка в тысячу человек и отсутствие детального описания тестирования и обучения алгоритма вызывают сомнения. Бесспорно –– наступят времена, когда вопрос «Siri, что взять на ужин?» будет звучать из каждого супермаркета, но когда это случится –– пока не ясно.
#news

OpenAI и Google создают инструмент для изучения работы нейросети под «микроскопом»

Группа исследователей разработала «микроскоп» для нейронных сетей –– это инструмент Activation Atlases. Он анализирует работу алгоритмов, определяет, по какому принципу ИИ принимает решение, тем самым позволив исследователям проникнуть в «сознание» нейросети.

Почему важно: Дешифровки обученной нейросети –– старая и действительно сложная задача, потому что никто точно не может сказать, как именно ИИ приходит к решению. Машины, работающие на основе сложных алгоритмов, хранят все не в блоках памяти, как обычные компьютеры, а в «черном ящике». Чем умнее алгоритм, там сложнее расшифровка «черного ящика», другими словами, его сложно понять.

Например, мы хотим научить ИИ отличать кошечку от собачки. Собрали датасет, алгоритм работает. Однако «заглянув под капот», мы выясняем, что нейросеть заметила, что собаки чаще всего изображены с поводками и на улице, и начала различать животных таким образом –– кто на привязи, тот и пес. Хотя понятно, что этот признак далеко не ключевой.

Вот здесь и пригодится Activation Atlases –– в контроле оверфита при обучении. Оверфит –– это переобучение модели, когда вместо того, чтобы найти общие признаки класса, алгоритм понимает признаки обучающей выборки.

Другое преимущество «микроскопа» от Google –– он поможет устранить уязвимости в нейронных сетях, связанных с неточной классификацией изображений. К примеру, ранние модели нейросетей ошибочно определяли чернокожих людей как горилл –– неприятная путаница, которую теперь будет проще избежать. К тому же, зная, как устроена система, ее будет сложнее обмануть. Был известный трюк: разработчики надели на людей желтые очки и тем самым сломали фейс-рекогнишн, который до этого справлялся хорошо. Так вот –– больше так не получится.
#news

Анонимность в интернете –– как ИИ сначала ее отнял, а теперь вернул

В прошлом месяце заработал сайт thispersondoesnotexist.com –– он генерирует лица несуществующих людей. За пару секунд нейросеть создает реалистичный портрет человека, которого сложно отличить от живого. Создавать цифровых людей можно бесконечно: лица ни разу не повторяются.

Почему важно: Многие уже успели оценить разработку, нагенерировав себе сотни несуществующих лиц. Другой вопрос –– зачем? На самом деле, эта технология –– не очередной хайп на ИИ, а одно из самых значимых событий 2019 года.

Анонимность в интернете давно на грани исчезновения. Соцсети собирают информацию, добавляя все новые и новые пометки в наши личные дела каждый день. Куда ходим, что едим, с кем общаемся –– уже нет смысла обновлять статус в Фейсбуке, алгоритмы и так поняли, что вы расстались с девушкой.

Любую фотографию, которую мы отправляем в интернет, распознают и проверяют –– нет ли где-то еще человека с такими же снимками. Спрятаться под чужими фотографиями и именами уже нельзя.

А если использовать уникальное лицо, которое выдает генератор, то можно создать профиль человека, которого никогда не было и не будет. Нейросеть может не только сгенерировать лицо, но и предположить, как бы человек выглядел и в 5, и в 70 лет –– материала хватит на три семейных альбома.

Разработка основана на генеративно-состязательных нейросетях –– когда между собой соперничают две нейросети. Та, что создает изображение ("генератор"), и вторая, которая пытается понять, реальная ли эта фотография или сгенерированная. Благодаря такому подходу другие нейросети не могут понять, что перед ними фейк.

Ждем, когда в Китае, где распознавание лиц внедрили на улицы, появятся подпольные фабрики по производству силиконовых масок с творениями нейросетки. Гай Фокс версия 2.0 –– теперь в киберпанке.
Разметчик в полосатой пижаме –– как финский стартап обучает ИИ с помощью заключенных

Финский стартап Vainu с помощью ИИ собирает базу данных компаний для облегчения поиска клиентов и подрядчиков. Чтобы искусственный интеллект не путал статьи о компании Apple со статьями про яблоки, людям нужно вручную размечать сотни текстов для обучения алгоритма. Статьи на английском языке можно перепоручить подрядчикам на краудсорсинговых платформах, но на финском таких сервисов нет. Так в Vainu придумали отдать эту задачу на аутсорс заключенным.

Компания поставила десять компьютеров в две тюрьмы в Хельсинки и Турку, на которых работает сто человек. Разметчики получают вознаграждение за каждую выполненную задачу, правда, большую часть забирает государство.

Почему важно: Мы уже писали, как финны приобщили пенсионеров к ИИ. Пришла очередь заключенных. Люди из «мест не столь отдаленных» дорого обходятся государству. Нарушил закон –– и вот ты уже сидишь в тюрьме с трехразовым питанием за счет налогоплательщиков. В России, к примеру, в год на одного заключенного уходит почти полмиллиона рублей.

Задача ведомства –– создание дополнительных рабочих мест для заключенных. Пока в России в тюрьмах шьют одежду, в Финляндии размечают данные. Такое сотрудничество выгодно обеим сторонам –– стартап обеспечил себя разметчиками, у которых по объективным причинам уйма свободного времени и сил, а тюрьме –– прибыль.