Kantor.AI
11.6K subscribers
144 photos
12 videos
5 files
188 links
Канал Виктора Кантора про Data Science, образование и карьеру в сфере анализа данных. По вопросам сотрудничества: @mariekap

РКН: 5140322136
Download Telegram
Channel created
Channel name was changed to «Kantor.AI»
Channel photo updated
В машинном обучении есть несколько направлений, в которых людям интересно и комфортно жить и развиваться. С одной стороны, можно делить всё по области применения ML (обработка текстов на естественном языке, компьютерное зрение, и так далее). Другой вариант - делить по целям. Например, у индустриального анализа данных, науки и «хайповых» применений машинного обучения цели заметно различаются. Ближайшие несколько постов будут как раз на эту тему.

Итак, сначала об индустриальном машинном обучении. Здесь речь идет не о ML на заводах (хотя этот случай тоже сюда входит), а о применении ML на пользу компаниям. Внутри индустриального ML тоже бывают разные предпочтения: одни предпочитают улучшать алгоритмы в массовом продукте (например, повышать качество ранжирования выдачи в поисковике), а других больше вдохновляет создавать новые модели, которые сэкономят или заработают много денег компании. Например: научиться прогнозировать эффект рекламной кампании и начать подбирать параметры кампании так, чтобы эффект проседал не больше чем на 2-3%, а денег на кампанию тратилось на 10% меньше (что при миллиардном бюджете будет регулярно экономить сотни миллионов - намного больше, чем потребуется на разработку модели). Или, стандартный пример - разработать для магазина рекомендательную систему, которая на несколько процентов увеличит доход с продаж (кстати, обязательно напишу в другой раз, в чем проблемы таких проектов).

Мне всегда больше всего нравились проекты именно про сэкономить/заработать денег с помощью машинного обучения. В основном потому, что при разработке продукта на основе ML играешь «в долгую» и год за годом делаешь улучшения, реальная польза которых не всегда очевидна, а когда у тебя есть понятный проект на полгода-год с понятно спланированным экспериментом для оценки качества в конце - все-таки сроки чуть поменьше и быстрее видишь результат работы. Впрочем, не все так радужно - проекты затягиваются, задачи изначально ставятся неверно, так что получить два года вместо 5 месяцев и не достигнуть результата - вполне возможная ситуация и переживается гораздо тяжелее, чем год за годом копаться в продукте и верить, что улучшение каких-то побочных метрик качества принесет пользу компании.

Еще одна вещь, которую важно понимать об индустриальном ML - это не единственное, что существует на свете. К сожалению, мы часто легко судим и оцениваем других людей, поэтому эксперты из индустрии иногда смотрят на ученых как на людей без конкретных прикладных результатов, тратящих время непонятно на что (я и сам высказывал такое мнение, когда меньше разбирался в вопросе). А ученые смотрят на специалистов из индустрии как на тех, кто не создает ничего нового (ведь индустриальный ML скорее про прикладное применение уже придуманного, чем про разработку новых алгоритмов)
👍10