AI Happens
14.6K subscribers
84 photos
9 videos
193 links
Привет! Я Леша Хахунов, основатель Dbrain.io, и это мой канал про искусственный интеллект.
Download Telegram
#cv #cases

В мобильном приложении Excel появился ИИ –– он распознает таблицы по фото

Microsoft анонсировала функцию (пока доступна только на Android), с помощью которой пользователи могут фотографировать печатную таблицу и преобразовывать ее в цифровую версию в Excel. Пользоваться фичей могут только владельцы подписки Office 365.

Почему важно: Недавно мы рассказывали, как Adobe использует machine learning для улучшения качества снимков. Теперь настало время Microsoft: тут пока нет ML, но применить классический computer vision компания уже смогла –– в Excel. Отказавшись от нейросеток, разработчики тем самым обеспечили пользователям мгновенный результат.

Правда, говорить о глобальных победах рано: с таблицами сложнее 3х5 инструмент не справляется, превращая данные в кашу. Почему? Основная сложность –– сделать результат устойчивым к условиям съемки. Вероятно, в будущем, когда компания соберет многомиллионные примеры наших таблиц, алгоритм заработает лучше.

Увы, крупные корпорации редко думают о проблемах простых людей –– пользоваться продуктом будут и так. Но раз Microsoft озаботился созданием функционала для комфортной работы в Excel, от лица всех страждущих предложим пару идей для будущих разработок: добавить автоматическое форматирование текста (шрифты, размер, расположение) и научиться предсказывать наше следующее действие в таблице на базовом уровне. Мелочи, а приятно.
Опробовали новую функцию в таблицах?
Anonymous Poll
7%
Уже да
59%
Пока нет
34%
Пользуюсь другими ресурсами
#cases

Диетолог ИИ –– почему доверять здоровье ему пока рано

Компания DayTwo разработала алгоритм, который подбирает персонализированную диету на основе анализов микрофлоры кишечника. Для обучения алгоритма создатели провели двухнедельный эксперимент, в течение которого добровольцы носили датчики глюкозы и записывали все приемы пищи.

Почему важно: Диеты «для всех» –– зло. Они не учитывают наше состояние организма –– сидеть на них опасно для здоровья. Мы можем неделями ограничивать себя в каких-то продуктах, даже не догадываясь, что без них нам тяжело функционировать. Алгоритм от DayTwo должен решить эту проблему: собрав все необходимые данные, он вычислит индивидуальные особенности организма и предложит здоровое меню на каждый день. О революции пока рано говорить, но data driven подход –– это первый шаг к созданию системы питания, которая будет заточена под конкретного пользователя. Никаких эмпирических наблюдей, только конкретные данные.

Теперь к ложке дегтя: Как массово собирать данные для алгоритма? Окей, активность, сон и пульс выкачаем из эпл-вотчей или фитнес-браслетов, но как быть с информацией по кишечнику? Тут нужны не цифровые, а реальные данные, то есть анализы.

Тестовые результаты чересчур оптимистичные, выборка в тысячу человек и отсутствие детального описания тестирования и обучения алгоритма вызывают сомнения. Бесспорно –– наступят времена, когда вопрос «Siri, что взять на ужин?» будет звучать из каждого супермаркета, но когда это случится –– пока не ясно.
#news

OpenAI и Google создают инструмент для изучения работы нейросети под «микроскопом»

Группа исследователей разработала «микроскоп» для нейронных сетей –– это инструмент Activation Atlases. Он анализирует работу алгоритмов, определяет, по какому принципу ИИ принимает решение, тем самым позволив исследователям проникнуть в «сознание» нейросети.

Почему важно: Дешифровки обученной нейросети –– старая и действительно сложная задача, потому что никто точно не может сказать, как именно ИИ приходит к решению. Машины, работающие на основе сложных алгоритмов, хранят все не в блоках памяти, как обычные компьютеры, а в «черном ящике». Чем умнее алгоритм, там сложнее расшифровка «черного ящика», другими словами, его сложно понять.

Например, мы хотим научить ИИ отличать кошечку от собачки. Собрали датасет, алгоритм работает. Однако «заглянув под капот», мы выясняем, что нейросеть заметила, что собаки чаще всего изображены с поводками и на улице, и начала различать животных таким образом –– кто на привязи, тот и пес. Хотя понятно, что этот признак далеко не ключевой.

Вот здесь и пригодится Activation Atlases –– в контроле оверфита при обучении. Оверфит –– это переобучение модели, когда вместо того, чтобы найти общие признаки класса, алгоритм понимает признаки обучающей выборки.

Другое преимущество «микроскопа» от Google –– он поможет устранить уязвимости в нейронных сетях, связанных с неточной классификацией изображений. К примеру, ранние модели нейросетей ошибочно определяли чернокожих людей как горилл –– неприятная путаница, которую теперь будет проще избежать. К тому же, зная, как устроена система, ее будет сложнее обмануть. Был известный трюк: разработчики надели на людей желтые очки и тем самым сломали фейс-рекогнишн, который до этого справлялся хорошо. Так вот –– больше так не получится.
#news

Анонимность в интернете –– как ИИ сначала ее отнял, а теперь вернул

В прошлом месяце заработал сайт thispersondoesnotexist.com –– он генерирует лица несуществующих людей. За пару секунд нейросеть создает реалистичный портрет человека, которого сложно отличить от живого. Создавать цифровых людей можно бесконечно: лица ни разу не повторяются.

Почему важно: Многие уже успели оценить разработку, нагенерировав себе сотни несуществующих лиц. Другой вопрос –– зачем? На самом деле, эта технология –– не очередной хайп на ИИ, а одно из самых значимых событий 2019 года.

Анонимность в интернете давно на грани исчезновения. Соцсети собирают информацию, добавляя все новые и новые пометки в наши личные дела каждый день. Куда ходим, что едим, с кем общаемся –– уже нет смысла обновлять статус в Фейсбуке, алгоритмы и так поняли, что вы расстались с девушкой.

Любую фотографию, которую мы отправляем в интернет, распознают и проверяют –– нет ли где-то еще человека с такими же снимками. Спрятаться под чужими фотографиями и именами уже нельзя.

А если использовать уникальное лицо, которое выдает генератор, то можно создать профиль человека, которого никогда не было и не будет. Нейросеть может не только сгенерировать лицо, но и предположить, как бы человек выглядел и в 5, и в 70 лет –– материала хватит на три семейных альбома.

Разработка основана на генеративно-состязательных нейросетях –– когда между собой соперничают две нейросети. Та, что создает изображение ("генератор"), и вторая, которая пытается понять, реальная ли эта фотография или сгенерированная. Благодаря такому подходу другие нейросети не могут понять, что перед ними фейк.

Ждем, когда в Китае, где распознавание лиц внедрили на улицы, появятся подпольные фабрики по производству силиконовых масок с творениями нейросетки. Гай Фокс версия 2.0 –– теперь в киберпанке.
Разметчик в полосатой пижаме –– как финский стартап обучает ИИ с помощью заключенных

Финский стартап Vainu с помощью ИИ собирает базу данных компаний для облегчения поиска клиентов и подрядчиков. Чтобы искусственный интеллект не путал статьи о компании Apple со статьями про яблоки, людям нужно вручную размечать сотни текстов для обучения алгоритма. Статьи на английском языке можно перепоручить подрядчикам на краудсорсинговых платформах, но на финском таких сервисов нет. Так в Vainu придумали отдать эту задачу на аутсорс заключенным.

Компания поставила десять компьютеров в две тюрьмы в Хельсинки и Турку, на которых работает сто человек. Разметчики получают вознаграждение за каждую выполненную задачу, правда, большую часть забирает государство.

Почему важно: Мы уже писали, как финны приобщили пенсионеров к ИИ. Пришла очередь заключенных. Люди из «мест не столь отдаленных» дорого обходятся государству. Нарушил закон –– и вот ты уже сидишь в тюрьме с трехразовым питанием за счет налогоплательщиков. В России, к примеру, в год на одного заключенного уходит почти полмиллиона рублей.

Задача ведомства –– создание дополнительных рабочих мест для заключенных. Пока в России в тюрьмах шьют одежду, в Финляндии размечают данные. Такое сотрудничество выгодно обеим сторонам –– стартап обеспечил себя разметчиками, у которых по объективным причинам уйма свободного времени и сил, а тюрьме –– прибыль.
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня без новостей, но с просьбой

На Product Hunt запустился Handl — это наш сервис для разметки от Dbrain. Мы хотим, чтобы больше людей узнали о нашем проекте, для этого нужны ваши голоса. Потратьте меньше минуты — оставьте фидбек.

Вот ссылка и наше уважение: https://www.producthunt.com/posts/handl-3
Привет, с вами Леша — сооснователь Dbrain. У меня для вас две хорошие новости:

Первая — с вашей помощью вчерашний запуск нашего сервиса для разметки Handl на Product Hunt прошел успешно. Мы заняли второе место в лучших продуктах дня, собрали клиентов, получили фидбек от разметчиков и друзей. Жму руку каждому — без вас бы ничего не получилоcь.

Немного о Handl: частая проблема в разработке ИИ — подготовить данные. Мы упростили этот процесс и запустили платформу, которая объединяет удалённых работников и технологические компании для создания ИИ. Подробнее читайте в нашей статье на VC.ru

Вторая новость — журнал Forbes включил меня в список «30 до 30» в категории «Наука и технологии». Отдельно хочется сказать еще раз спасибо всей команде Dbrain, это наша общая победа.

На этом сегодня все. Скоро вернусь к вам со свежими постами.

AI happens!
#news

В Южной Корее следователи раскрыли криптовалютную пирамиду. СМИ говорят — при помощи ИИ. Объясняем, почему ИИ здесь ни при чем.

Корейские следователи научили алгоритм при помощи ключевых слов находить скамеров в интернете. Благодаря технологии стражи порядка уже задержали создателей крупной финансовой пирамиды на базе токена M-coin, который не представлен ни на одной крупной бирже. За платную подписку мошенники выдавали пользователями 600 токенов и предлагали столько же за привлечение друзей. Меньше чем за год преступники заработали $18 млн.

Почему важно: ИИ помогает спецслужбам и государственным банкам ловить финансовых преступников — в Южной Корее в том числе. Алгоритмы следят за тем, как вы совершаете покупки по карте, и, если видят признаки того, что у вас ее увели, бьют тревогу, — классический ML в действии.

Конкретно в этой истории для борьбы с мошенниками следователи собрали ключевые слова, свойственные скаму, отдали их алгоритму, и он через html-документы проверил сайты на их наличие. Искусственный интеллект, о котором написала пресса, здесь ни при чем. Немного статистики, базовой аналитики, словаря синонимов — и ура, следователям удалось вычислить криптонегодяев. Новость хорошая, но давайте не будем называть айяйем каждый алгоритм в 2019.
​​ИИ — теперь и дизайнер. Искусственный интеллект спроектировал стул — удобный и практичный одновременно

Поставщик программного обеспечения Autodesk вместе с дизайнером Филиппом Старком спроектировали мебель при помощи искусственного интеллекта. Разработанный компанией алгоритм создал удобный и прочный предмет мебели, задействуя как можно меньше материала. ИИ действовал в отрыве от культурных ценностей, истории и представлений человека о прекрасном.

Почему важно: Может ли искусственный интеллект творить как художник? Вполне. Проще всего это сделать так: ИИ учат генерировать контент при помощи Gan'ов (Generative adversarial network a.k.a генеративно-состязательная сеть). Создаются две нейросети: одна генерирует образы, а другая старается отличить образ из реального мира от образа, созданного генератором. В итоге получается контент, близкий к существующему, однако все равно уникальный в своем роде (вспомните генерацию несуществующих лиц).

Autodesk поставил ИИ другую задачу — не создать что-то уникальное, а только накреативить как можно больше вариантов мебели в рамках заданных условий (дизайн, комфорт, практичность и экономия материала). И все получилось: дизайнер задал базовые настройки, а дальше уже творил алгоритм. С нетерпением ждем столы, машины, мосты от ИИ, а пока опробуем стулья.
​​#news

Disney обучил алгоритм читать сценарии и снимать по ним видео

Исследователи из Disney Research разработали алгоритм, который создает анимационные ролики по предложенному сценарию. Генерация изображений происходит в Unreal Engine — это игровой движок, который также используют для создания компьютерной 3D графики в мультфильмах и кино.

Почему важно: тут Disney не первый, но пока лучший — алгоритмы, создающие ролики по текстам, уже существуют. У них есть недостаток — они плохо понимают естественный язык и справляются только с простыми короткими предложениями, да и оценить качество их работы сложно. Disney же решил большинство проблем.

Получилось это благодаря созданию системы из трех модулей. Первый, модуль обработки языка, разбивает сложные предложения на простые, заменяет слова на понятные синонимы. К примеру, из предложения «я бегаю по утрам и ем кашу на завтрак» получается «я бегаю по утрам & я ем кашу на завтрак». Второй, модуль синтаксического анализа текста, извлекает смысл из предложения для видео. И третий модуль генерации анимации, собственно, создает картинку.

Идея Disney в том, что можно написать сценарий, отрисовать героев, а за их движения пусть уже отвечает нейросеть. Пока технология отдает сыростью, но начало положено. Представьте студию, где вместо сотни аниматоров и сценаристов сидит один человек. В окружении компьютеров он лениво листает утреннюю газету, пока ИИ пишет свой очередной шедевр и претворяет его в жизнь.
​​Привет всем! Этот канал родился из обсуждений новостей об ИИ у офисного кулера. В какой-то момент нам стало этого мало — так появилась идея делиться инфоповодами не только друг с другом, но и со всеми желающими.

Перед запуском мы изучили разные медиа (Телеграм в том числе) и сегодня делимся с вами русскоязычными каналам об ИИ, которые с удовольствием читаем сами:

1. Если хотите стать дата-сайентистом, вам в data root labs

Зачем читать: канал ведет команда data root labs — курсов по изучению Data Science и Engineering. Помимо бесплатных обучающих материалов, доступных каждому, здесь собраны последние новости из мира ИИ. Как бонус: авторы часто разбавляют статьи локальными мемами, которые понятны и простым смертным.

2. Если вы не хотите тренировать нейросетки, но хотите о них читать, вам в Hey Machine Learning

Зачем читать: канал от инженеров Hey Machine Learning — компании, разрабатывающей решения в области ИИ. Ребята пишут не только об искусственном интеллекте, но и о технологиях в целом. Главное преимущество канала — еженедельные подборки новостей, короткие и информативные.

3. Если вы в поиске глубокой аналитики ИИ кейсов, вам в NeuroHive - Нейронные сети

Зачем читать: канал от разработчиков из NeuroHive. Здесь нет новостей с кричащими заголовками в стиле “ИИ вот-вот заберет работу у людей”, админы публикуют только реально работающие кейсы и последние исследования в области нейронных сетей.
​​#news

Google представил нейросеть, которая оптимизирует работу других нейросетей — делает их быстрее, легче и продуктивнее

Исследователи из Google представили модель MorphNet, которая способна оптимизировать работу любой нейросети благодаря циклу сокращающихся и расширяющихся фаз. Сначала MorphNet выявляет неэффективные нейроны и удаляет их из сети, затем перераспределяет вычислительные ресурсы из менее эффективных частей сети в более эффективные.

Почему важно: Бытует мнение, что чем больше размер нейросети, тем лучше будет решение на выходе. Но проблема в том, что подобные модели тяжело обучить — они требуют тонну данных и много вычислительных мощностей. Поэтому часто после того, как получен первый результат, запускается процесс дистилляции — передачи знаний от большой нейронной сети маленькой. Обычно это долгий кропотливый процесс. И, главное, не факт, что все получится.

Решение от Google — это попытка оптимизировать работу нейросети при помощи другой нейросети. Если верить статье, вполне удачная: MorphNet показала высокий процент успеха. К тому же радужный поисковик решил задачу, которую никто прежде не осилил. Он сделал возможным сохранение переобучаемости модели. Другими словами, после сжатия сети можно взять новые данные и интегрировать их в свежее решение.

Мы все ждали, когда робот начнет собирать других роботов, но, кажется, ИИ гораздо ближе — нейросеткам мы уже почти не нужны.
​​ИИ vs человек: кто лучше диагностирует рак?

Нейросеть и сотня радиологов проверили десятки тысяч маммограмм на наличие уплотнений и поражений мягких тканей. В среднем система оказалась эффективней в определении рака груди, но проиграла опытным врачам в некоторых кейсах.

Почему важно: Результаты исследования предсказуемы — нейросетка работает лучше, чем врач из районной поликлиники хотя бы потому, что за короткую жизнь увидела гораздо больше материала. Почему же тогда она уступила светилам медицины?

Во-первых, тестирование врачей выполнялось не на случайных снимках, а на конкретных кейсах из их практики. Это означает, что у людей больше контекста, чем у алгоритма, — они знали историю болезни.

Во-вторых, чтобы обучить нейросеть необходимы правильные ответы. Проблема в том, что в одной поликлинике вам скажут, что насморк — от простуды, в другой вас отправят на аллергопробы. Мнения врачей расходятся, и на многие болезни приходится десяток диагнозов. Порой узнать, какой из них правильный, поможет только вскрытие. Это отражается на точности алгоритма: его «верно/не верно» строится на расплывчатых ответах, полученных от врачей.

Даже если алгоритм можно дообучить, возникает вопрос — когда мы увидим ИИ в больницах? Если коротко — когда государство научится централизованно хранить данные в едином формате и анонимизировать их (клятву Гиппократа никто не отменял). Как только это произойдет, уровень доступности медицины вырастет, особенно в регионах, где катастрофически не хватает специалистов.
​​Краткость — сестра таланта. Как нейросеть от «Вконтакте» упростит жизнь пользователям?

Компания «Вконтакте» представила нейросеть, которая генерирует новостные заголовки на русском и английском языках. Для этого она читает текст новости, а дальше формулирует заголовок, соблюдая правила грамматики. Обучение проходило на материалах «РИА Новости» и «The New York Times».

Почему важно: Генератор заголовков от ВК получает семантический смысл крупных блоков текста и выносит из него главную мысль. Как всегда непростой этап в решении подобных задач — это оценить качество на выходе. Хороший получился заголовок или плохой? Чтобы ответить на этот вопрос «Вконтакте» проверил нейросеть на фокус-группе. Около 45% опрошенных отметили, что человеческий и машинный заголовки ничем не отличаются, 15% сказали, что алгоритм справился лучше. Оставшиеся 40% отметили, что нейросеть пока рано устраивать в штат Нью-Йорк Таймс. Вероятно, разработчики сделают работу над ошибками и дообучат алгоритм.

Эту pазработку нужно развивать не только из-за заголовков. Мы живем во времена, когда от количества нотификейшенов дергается глаз, и потоки информации — уже не потоки, а ураганы, сбивающие с ног. Алгоритм, который способен сократить простыню текста до пары строк, не потеряв смысл по дороге, сэкономит кучу времени — и журналистам и нам, читателям.
​​В открытом доступе: как страховые компании оценивают ваше благосостояние и надежность при помощи карт Google

Появилась нейросеть, которая предсказывает, с какой вероятностью будущий клиент страховой компании попадет в автомобильную аварию. Все, что ей нужно, — это фотография его дома в Google Street View.

Как это было: Исследователи собрали датасет из 20 тысяч страховых случаев, ввели адрес каждого страхователя в гугл-карты и загрузили изображение домов. Затем классифицировали их в соответствии с типом (отдельный дом, таунхаус, многоквартирное здание) и состоянием. Полученные результаты сравнили с уже существующей моделью риска, которая основана на более громоздком датасете (какой пол, возраст, банковские обращения) — новая система уступила всего на 8%.

Почему важно: Если вы хоть раз в жизни занимали деньги у банка, то знаете, что такое скоринг. На всякий случай напомню — это система, которую используют банки для проверки вашей платежеспособности. Другими словами, она решает, выдавать вам кредит или нет.

Скоринговые системы — это чуть ли не первая прибыльная история в машинном обучении. Для точного рейтинга в ход идут любые средства: ваши смс, банковские транзакции и даже приложения на вашем телефоне — это часть скоринга. Например, наличие Тиндера говорит о том, что вы готовы тратиться на рестораны и не только.

Создание нейронки, оценивающей вас по жилплощади, — следующий шаг. Сейчас банки и страховые знают по индексу, что вы живете в Хамовниках. Но скоро обученная на открытых данных нейронка проанализирует адрес и вычислит, что это пятиэтажка под снос, и понизит ваш рейтинг в системе, увеличив стоимость страховки.
Привет!
Новостей, про которые хочется рассказывать, много. А времени на то, чтобы их освещать, — мало. Но есть идея — делать короткий дайджест самых интересных новостей из мира ИИ и публиковать его раз в неделю. Допустим, по пятницам. Как вам?
​​Что происходило в мире ИИ на этой неделе:

1. Недавно мы писали, что в Сан-Франциско хотят запретить распознавание лиц на улицах. Так вот — запретили. Важная деталь: закон распространяется только на полицию. Частные компании могут и дальше использовать технологию.

2. Свежий выпуск журнала Esquire в Сингапуре частично написал ИИ: алгоритм сгенерировал 4 статьи и письмо редактора. Задача была ответить на вопрос, можно ли заменить журналистов на искусственный интеллект. Получилось или нет — решать читателям.

3. Nvidia научила нейросеть менять класс объекта на изображении. Казалось бы, ничего нового. Но отличие от других сеток в том, что алгоритму FUNIT нужен минимальный объем данных. Для того, чтобы сделать из кошечки собачку, нейросети понадобится лишь пару примеров — и никаких громоздких датасетов.

4. Google представил синхронный переводчик. Сейчас алгоритмы Google Translate распознают речь, генерируют текст, затем выполняют перевод и только потом — вновь преобразовывают в звук. Новая разработка пропускает этап транскрипции: она обрабатывает исходный голос и сразу синтезирует перевод голосом. Однако пока перевод хуже.

5. И, наконец, пример успешного кейса на базе ИИ: стартап применил глубокое обучение для поиска брака у деревянных досок. С помощью технологи удается за секунду выявить следы огня, наличие смолы и сколов. Все получилось — ИИ уже внедряют на лесопильных заводах.
​​Меткий манипулятор: как робот, точно бросающий предметы, упростит нам жизнь

Американские инженеры разработали алгоритм для манипулятора, который научил его точно захватывать и бросать предметы в заданную точку. Во время работы алгоритм рассчитывает параметры броска с помощью физического симулятора, а также нейросети, которая вносит свои корректировки. Как это работает — смотрите видео.

Почему важно: Научить манипулятора меткости — сложная задача. Даже человек со всеми его способностями вынужден стыдливо бежать до мусорки, подбирая бумажку, которую не получилось выбросить с первого раза. Что уж говорить о машине. Однако создатели робота применили к задаче нестандартный подход: научили его ловить предмет и кидать, чтобы попасть в заданную область. Другими словами, они решили объединить захват и бросок в единую задачу.

Система самообучаема. Это значит, что робота можно натренировать в новой среде. Дайте ему 10 тысяч попыток (что для него — ничего), и он сможет кидать нужные вам вещи, всегда попадая в цель. Представьте, что вы забираете посылку с Почты России, и она совсем не помята. Представьте чемодан, который выкатывается на багажную ленту, и его круглые бока не впали от удара об землю. Заботливые руки робота сохранят ваш груз лучше, чем человеческие.
​​Чем отличился ИИ на этой неделе?

1.
Нейросеть от Самсунга генерирует видео из пары снимков человека. Советую посмотреть ролик, демонстрирующий силу алгоритма. Хотя бы ради анимированного Достоевского — получилось пугающе реалистично.

2. Кстати, недавно с того света при помощи нейронок вернули Сальвадора Дали. В Америке он фотографируется с посетителями музея. Для создания образа создатели взяли 6 тысяч архивных кадров из интервью с Дали и алгоритм Deepfake. Движение модели обеспечивали актеры, чьи лица заменили на художника, а озвучку — артист с характерным испанским акцентом.

3. Помните пост о нейросети GPT-2, которая пишет фейковые новости слишком хорошо? Тогда лаборатория OpenAI отказалась выкладывать программный код в открытый доступ — побоялась, что разработкой будут пользоваться скамеры. На этой неделе создатели выложили более открытую версию (хотя по-прежнему не полную). Но даже она впечатляет: из пары строк алгоритм сочиняет меланхоличные стихотворения и пишет правдоподобные статьи. Кажется, не только люди способны творить.

4. Новости о Facebook. В компании есть ИИ-отдел, который создает и обучает роботов. На этой неделе разработчики представили нейросеть, которая учит шестилапого помощника Daisy ходьбе без предварительных данных. В робота встроены датчики, которые учитывают баланс и положение в пространстве при ходьбе. Говорят, Facebook не планирует внедрение разработок в сервисы. Кажется, главная соцсеть создает ИИ просто потому, что может.