В машинном обучении есть несколько направлений, в которых людям интересно и комфортно жить и развиваться. С одной стороны, можно делить всё по области применения ML (обработка текстов на естественном языке, компьютерное зрение, и так далее). Другой вариант - делить по целям. Например, у индустриального анализа данных, науки и «хайповых» применений машинного обучения цели заметно различаются. Ближайшие несколько постов будут как раз на эту тему.
Итак, сначала об индустриальном машинном обучении. Здесь речь идет не о ML на заводах (хотя этот случай тоже сюда входит), а о применении ML на пользу компаниям. Внутри индустриального ML тоже бывают разные предпочтения: одни предпочитают улучшать алгоритмы в массовом продукте (например, повышать качество ранжирования выдачи в поисковике), а других больше вдохновляет создавать новые модели, которые сэкономят или заработают много денег компании. Например: научиться прогнозировать эффект рекламной кампании и начать подбирать параметры кампании так, чтобы эффект проседал не больше чем на 2-3%, а денег на кампанию тратилось на 10% меньше (что при миллиардном бюджете будет регулярно экономить сотни миллионов - намного больше, чем потребуется на разработку модели). Или, стандартный пример - разработать для магазина рекомендательную систему, которая на несколько процентов увеличит доход с продаж (кстати, обязательно напишу в другой раз, в чем проблемы таких проектов).
Мне всегда больше всего нравились проекты именно про сэкономить/заработать денег с помощью машинного обучения. В основном потому, что при разработке продукта на основе ML играешь «в долгую» и год за годом делаешь улучшения, реальная польза которых не всегда очевидна, а когда у тебя есть понятный проект на полгода-год с понятно спланированным экспериментом для оценки качества в конце - все-таки сроки чуть поменьше и быстрее видишь результат работы. Впрочем, не все так радужно - проекты затягиваются, задачи изначально ставятся неверно, так что получить два года вместо 5 месяцев и не достигнуть результата - вполне возможная ситуация и переживается гораздо тяжелее, чем год за годом копаться в продукте и верить, что улучшение каких-то побочных метрик качества принесет пользу компании.
Еще одна вещь, которую важно понимать об индустриальном ML - это не единственное, что существует на свете. К сожалению, мы часто легко судим и оцениваем других людей, поэтому эксперты из индустрии иногда смотрят на ученых как на людей без конкретных прикладных результатов, тратящих время непонятно на что (я и сам высказывал такое мнение, когда меньше разбирался в вопросе). А ученые смотрят на специалистов из индустрии как на тех, кто не создает ничего нового (ведь индустриальный ML скорее про прикладное применение уже придуманного, чем про разработку новых алгоритмов)
Итак, сначала об индустриальном машинном обучении. Здесь речь идет не о ML на заводах (хотя этот случай тоже сюда входит), а о применении ML на пользу компаниям. Внутри индустриального ML тоже бывают разные предпочтения: одни предпочитают улучшать алгоритмы в массовом продукте (например, повышать качество ранжирования выдачи в поисковике), а других больше вдохновляет создавать новые модели, которые сэкономят или заработают много денег компании. Например: научиться прогнозировать эффект рекламной кампании и начать подбирать параметры кампании так, чтобы эффект проседал не больше чем на 2-3%, а денег на кампанию тратилось на 10% меньше (что при миллиардном бюджете будет регулярно экономить сотни миллионов - намного больше, чем потребуется на разработку модели). Или, стандартный пример - разработать для магазина рекомендательную систему, которая на несколько процентов увеличит доход с продаж (кстати, обязательно напишу в другой раз, в чем проблемы таких проектов).
Мне всегда больше всего нравились проекты именно про сэкономить/заработать денег с помощью машинного обучения. В основном потому, что при разработке продукта на основе ML играешь «в долгую» и год за годом делаешь улучшения, реальная польза которых не всегда очевидна, а когда у тебя есть понятный проект на полгода-год с понятно спланированным экспериментом для оценки качества в конце - все-таки сроки чуть поменьше и быстрее видишь результат работы. Впрочем, не все так радужно - проекты затягиваются, задачи изначально ставятся неверно, так что получить два года вместо 5 месяцев и не достигнуть результата - вполне возможная ситуация и переживается гораздо тяжелее, чем год за годом копаться в продукте и верить, что улучшение каких-то побочных метрик качества принесет пользу компании.
Еще одна вещь, которую важно понимать об индустриальном ML - это не единственное, что существует на свете. К сожалению, мы часто легко судим и оцениваем других людей, поэтому эксперты из индустрии иногда смотрят на ученых как на людей без конкретных прикладных результатов, тратящих время непонятно на что (я и сам высказывал такое мнение, когда меньше разбирался в вопросе). А ученые смотрят на специалистов из индустрии как на тех, кто не создает ничего нового (ведь индустриальный ML скорее про прикладное применение уже придуманного, чем про разработку новых алгоритмов)
👍10