Kantor.AI
11.6K subscribers
144 photos
12 videos
5 files
188 links
Канал Виктора Кантора про Data Science, образование и карьеру в сфере анализа данных. По вопросам сотрудничества: @mariekap

РКН: 5140322136
Download Telegram
Про общение с руководством в большой компании

💬 Тема отношений с начальством в корпоративной среде всегда важна. С одной стороны, часто кажется, что выгодно будет просто соглашаться, всячески показывать лояльность и даже в некотором смысле выбирать заискивающее поведение. С другой стороны, интуитивно может казаться, что людям, наделенным какой-никакой властью, очень не хватает прямого и честного общения. И поэтому складывается впечатление, что, если вы будете взаимодействовать с ними так же, как вы взаимодействовали бы с человеком на одном с вами уровне, это будет некий эксклюзив.

💬 На самом деле и то и другое несколько далеко от здравого смысла. Потому что, во-первых, чрезмерные проявления лояльности и заискивания нормальных людей раздражают. А во-вторых, это дисконтирует стоимость ваших слов.

💬 Но и взаимодействовать с руководителем так, будто вы с ним на одном уровне, тоже неприемлемо. Будем объективны: босс отвечает за решение гораздо большего количества сложных вопросов, ему или ей необходимо учитывать гораздо больше информации. Поэтому проявление уважительного отношения к тем проблемам, которые решает руководитель, вполне уместно и даже необходимо.

💬 Правильный стиль общения с начальством, на мой взгляд, похож на стиль, которому нас учили в общении со старшими: в детстве нам говорили, что, если человек дожил до какого-то возраста, он уже заслуживает некоторого уважения. В случае же с руководителем речь идёт о том, что, если он уже достиг определённого уровня в компании и при этом справляется с определённого уровня проблемами и задачами, некоторые из которых вы даже не знаете, то можно было бы проявлять уважение в немного большем объёме.

💬 Конечно же, не нужно уважение к людям привязывать только к цвету штанов, количеству регалий или денег на счёте. Однако логично уважать тех, кто добился в вашей сфере достижений, которые вы считаете достойными. Ваш руководитель в идеале должен быть таким человеком. Если ваш босс не такой, крайне рекомендую поискать работу, где ваш руководитель будет вас вдохновлять, так жить будет намного проще :)
👍6019😁6💯4🫡3🙏2🔥1🤔1
Нужна ваша помощь💪🏻

Как вы помните, в феврале мы с партнером и командой проводили кастдев для определения основных образовательных потребностей аудитории канала, чтобы впоследствии понять, будет ли актуален запуск курсов.

Так вот, мы проанализировали полученную информацию и всё-таки решили запустить школу по машинному обучению.

Я хочу, чтобы вы приняли непосредственное участие в создании нашей школы, поэтому⬇️

Я решил провести небольшой интерактив:
В комментариях под этим постом пишите идеи для названия ML-школы💡
Возможно, именно ваше название в итоге станет официальным :)

Жду от вас интересных и креативных идей👇🏻👇🏻👇🏻
🔥27❤‍🔥64👍3💩3
Про рынок Big Data. Часть 2

💬 В прошлый раз мы закончили на монетизации ML-сервисов на основе данных, так что теперь немного о грустном. Если не брать амбициозные отчеты с оценками вроде «Около 1% от этой отрасли составляют вот такие алгоритмы», а брать конкретные примеры контрактов и заказов, которые делаются, и сформировать представление о размере рынка из этого, то мы выясним, что рынок скорингов, если туда не относить рекламу (а скоринг на склонность к какому-то действию клиента тоже можно назвать «скорингом», хотя на самом деле это таргетирование рекламы), находится в пределах ₽ 10 миллиардов. Рынок геоналитики тоже явно в этих же диапазонах, можно взять даже значительно меньшие размеры.

💬 Если речь о рекламном рынке, то уже несколько лет назад диджитал реклама составляла больше ₽ 240 миллиардов в год. К тому же, современная диджитал реклама в принципе не может существовать без таргетирования. Сейчас появляется все больше применений: генеративная реклама, генерация текстов, баннеров, оптимизация рекламы с помощью AI (например, когда речь идет об умном управлении ставками в аукционе) и многие другие вещи.

💬 Таким образом, мы приходим к очень интересному выводу. На самом деле человечество пока что придумало не так много способов заработать на машинлернинге, помимо рекламы. Я бы даже сказал, что доля всего, кроме рекламы, пренебрежительно мала. В будущем сравнимой вещью могут стать контентные сервисы, потому что они без рекомендаций не живут, и здесь применение машинлернинга действительно обоснованно. Оно в целом уместно везде, где нужно отфильтровать или проанализировать такое количество объектов, справиться с которым человеку за разумное время просто не под силу. Но в случае с контентными сервисами нужно думать, откуда собственно брать контент, как дифференцироваться и отсюда вытекает, что ML это небольшая добавка, а бизнес все равно в первую очередь медийный. Для примера, тот миллиард долларов, который в 2016 году по заявлениям Netflix зарабатывался ими в год с помощью рекомендательных систем, составлял всего 4% выручки (если мне не изменяет память, не делал сейчас фактчек)

💬 В итоге, наиболее денежное направление для построения бизнеса практически чисто на ML сейчас действительно реклама. Будут ли еще какие-то направления? Скорее всего, большим рынком (но состоящим по большей части из внутренних эффектов), будет управление ценами на основе данных. Будут ли компании готовы за такое решение платить сколько-нибудь большие деньги? Хороший вопрос, но он пока без ответа. Получить же многомиллиардную выручку на внешнем рынке пока можно только через рекламу.

💬 Что же делать в такой ситуации? На мой взгляд, поступать в этом случае нужно очень просто: переориентировать применение машинлернинга на внутреннее применение в вашей большой компании. Если же вы маленький стартап, то можно посмотреть на большие компании, выяснить, где у них больше всего денег можно сэкономить, и в эту сторону копать.
🔥13👍124
Как примазаться с опозданием и максимально дёшево

Вчера Иви радостно сообщил про премьеру «Слова пацана» у себя. По сути - трансляция НТВ, а там сериал в эфире.

Почему это дешево: смысл выражения «премьера в нашем кинотеатре», когда речь про чей-то originals - что купили на него права. В чем здесь подвох: онлайн кинотеатров сейчас очень много, основных факторов конкуренции у них буквально несколько:

1. Originals
2. Размер каталога
3. Удобство использования

И первый фактор - самый сильный, потому что из-за него люди смирятся и с неудобным приложением, и с отсутствием обширной базы. Но экономическая модель онлайн-кинотеатров в принципе не так шикарна, как хотелось бы, поэтому иногда лицензию на показ originals все-таки с запозданием, но продают конкурентам, чтобы подзаработать денег.

Так вот что сделали Иви - сделали из выхода чужого originals на ТВ дешевый инфоповод «теперь сериал появился у нас», т.к. у ребят есть трансляция ТВ. К чести команды Иви, они прямо в пуше написали, в чем подвох. Со стороны выглядит так: кто-то «умный» из менеджмента сложил А и Б и решил сделать пользователям рассылку, что «Слово пацана» появилось в Иви, кто-то честный из исполнителей написал в пуше как есть. Как говорится, респект таким пацанам 🫡
😁35🫡128👍2💩2🤔1
Оказывается, никакого шторма не было.
Такое вот интересное решение ситуации.
Так что будьте аккуратны с распространением фото и видео из Дубая
🫡37😁23💩3🔥1
Forwarded from The Экономист
Власти ОАЭ ввели штраф за распространение фото и видеоматериалов, связанных с последствиями наводнения в Дубае

Штраф зависит от количества материалов и может достигать 1 миллиона дирхам.

Департамент погоды ОАЭ зафиксировал самое большое количество осадков за последние 75 лет — ливни частично затопили метро и первые этажи, а также парализовали весь наземный транспорт. Многие автомобили оказались по крышу затоплены водой. Многие туристы оказались заперты в аэропорту и два дня не могли выехать из Дубая.

Также ливни прошли в Бахрейне, Катаре и Саудовской Аравии.

👍 The Economist
Please open Telegram to view this post
VIEW IN TELEGRAM
😁31👍11🤯93🔥1
Kantor.AI
🎲 Сегодня очередная пятница, а значит — время квиза. Картинка известная, просьба к тем, кто её уже видел целиком, подождать с ответом: интересно, угадает ли кто-то «по-честному» :) Свои варианты пишите в комментариях
Прошлый квиз остался без ответа, исправляю ситуацию. Но не спешите огорчаться, что вопрос был простой, и ответ сразу отгадали: это была разминка. В пятницу продолжим угадывать все, что скрыто :)
👍25
‼️Двухчасовая личная консультация от меня по любому вопросу, деньги пойдут на благотворительность ❤️

👋Сегодня рад поделиться с вами хорошей новостью: я принимаю участие в благотворительном проекте Meet For Charity в качестве «лота». Идея проекта проста — это благотворительный аукцион встреч с известными в своих областях людьми. Меня много раз звали поучаствовать, но не было «того самого» момента. И вот, он настал. Кто хочет пообщаться — ваш момент тоже настал :)

✌️С 2016 года Meet For Charity собрал на добрые дела более 337 миллионов рублей за счёт встреч более чем с 800 участниками. А помощь уходит более чем 160 фондам-партнёрам. Это, к примеру, «Дом с маяком», «Онкологика», «Линия жизни» и многие-многие другие. И я рад внести в это прекрасное дело и свой вклад.

🤖Буду рад поговорить с вами на встрече о внедрении Big Data и AI в вашем бизнесе либо карьере в этих сферах (или о чём угодно). Решать вам. Сама наша встреча может пройти как очно, так и онлайн. В общем, переходите по ссылке и давайте делать добрые дела вместе 🙂
35🔥16👍12❤‍🔥4🤔2
О полезности общения с коллегами

💼 Когда я устраивался в МТС (тогда еще Chief Data Scientist’ом), я не знал, сколько денег просить, чтобы и не продешевить, и не отказали. За плечами у меня был только опыт CDS в Яндексе, ну т.е. совсем не рыночные условия (в том смысле, что теплота, уютность и семейность Яндекса не бесплатны для сотрудника, но тогда оно того стоило).

💰Так вот попав в это неловкое положение, я обратился за советом к Валере Бабушкину, он тогда уже работал CDS в X5 Retail Group и как раз имел тоже яндексовый бэкграунд и возможность сопоставить два мира. Надо сказать, что совет Валеры залетел «на ура», за что я ему до сих пор очень благодарен, потому что при назначении в топ-менеджмент мой оклад не сильно скорректировался. Как устроена жизнь топов, я обязательно расскажу когда-нибудь потом, оклад там не главное, но все-таки так забавно получилось, что Валера своим советом определил мою зарплату на 4 года жизни :)

😁 Познакомились мы с Валерой вообще забавно - встретились как спикеры на Матемаркетинге у Леши Никушина, я подумал «опять этот Валера везде с одной презенташкой ходит и выпендривается», но Валера тут же улыбнулся мне самой широкой улыбкой на пределе человеческих возможностей, и мы настолько тепло и вежливо побеседовали, что мне стало стыдно за свою токсичность. В итоге мы в какой-то степени подружились, периодически друг-друга звали то попреподавать, то проконсультировать и вообще извлекли много хорошего из этого знакомства.

🥳 Ну а сегодня я с огромным удовольствием поздравляю Валеру с днем рождения и всем рекомендую подписаться на его канал в tg: https://t.iss.one/cryptovalerii
Персональный мем в качестве подарка прилагается
🎉11132👍10🔥8🤯1🤬1👌1🫡1🎅1
Кривые обучения и хобби

📈В канале собралось много тех, для кого кривая обучения имеет в основном контекст машинного обучения. Но на самом деле это более общее понятие. Кривая обучения — это в целом зависимость результатов обучения от затраченных усилий, попыток или времени. И для многих ваших новых занятий эта кривая будет выглядеть очень похоже на кривую обучения ML-модели: сначала быстрый рост экспертизы, а затем постепенный выход на плато.

Меня уже спрашивали в комментариях, как я отдыхаю и какие у меня хобби. Чуть меньше года назад у меня появился новый способ переключаться — плавание в зале с тренером. Добавлю контекст: в глубоком детстве мне совсем не понравилось тонуть, когда на мне лопнул надувной жилет. Моя двоюродная сестра (кстати, тоже закончила Физтех и как раз вдохновила меня туда поступать) довольно быстро меня вытащила, но на меня в том возрасте произвёл впечатление вид уходящего вдаль солнца по мере погружения на глубину. Закончилось это тем, что плавать я научился классе в десятом и только «сочинским брассом». В итоге плавание оставалось базовым навыком, которым я не владел, и прилично на этот счёт комплексовал.

🔥Прошлым летом один очень глубокий человек сказал мне интересные слова: «Иногда то, чего мы боимся, — это то, чего мы больше всего хотим». И я решил попробовать проверить это на практике. И действительно, плавать мне очень понравилось, с тренером мы хорошо сошлись характерами, и выяснилось, что все вещи, которые меня пугали, решаются количеством проплытых километров и постановкой техники. К чему я это всё — я на своём опыте узнал две вещи:

1️⃣Новые увлечения доставляют очень много удовольствия на «крутой» части кривой обучения, когда быстро нарабатываешь базовый опыт. Дальше — посмотрим, напишу ещё через год или два.

2️⃣Мы действительно иногда боимся стать счастливее. А вы не бойтесь, в процессе совсем не так страшно, как начать 🙂

#вопрос_подписчика
74👍29🔥12❤‍🔥3🤯2💯1🫡1🎅1
🎲 Предыдущая загадка, очевидно, оказалась для вас легкой. Тогда предлагаю усложнить задачу — держите еще один квиз с изображением.
Как обычно, жду ваши ответы в комментариях 💬
👍1711🔥4🎉3🥰1🤔1🤯1
👏 Ну что же, и с этим квизом вы справились легко :) Первый правильный ответ дал в комментариях Влад Кузнецов уже через минуту после публикации, сразу же собрав кучу реакций.

🤓 На самом деле таких примеров довольно много, и под многие из ваших ответов есть подходящая картинка. Чуть позже обязательно сделаю подборку
👍25🏆5🔥2
Kantor.AI
Как обучать крутых исследователей. Вопрос подписчика Честно? Не знаю. Дело в том, что у меня не было такого опыта. Да, я занимаюсь обучением, но более прикладным — для создания сильных кадров. Однако у меня есть на этот счёт наблюдения — спасибо Физтеху.…
Как готовить исследователей?

🤷‍♂️ Не так давно я рассказывал, что думаю про подготовку исследователей. Не то чтобы я считал себя экспертом именно в этой теме (это вам не преподавание Machine Learning в целом и не индустриальный ML), но раз уж был вопрос подписчика, ответил как чувствую :)

👩‍🔬 Но нас тут вообще-то несколько тысяч, и многие имеют отношение к ML. Так что настало время спросить вас: коллеги, а как по-вашему готовить топовых исследователей в ML? Можно даже две версии:

1) как готовить тех, кто публикует статьи на топовые конфы;

2) как готовить тех, кто прям правда науку двигает 😁

Самые лучшие идеи могут лечь в основу одного крутого проекта (через недели 3-4 мне уже можно будет про него рассказать здесь :)
Please open Telegram to view this post
VIEW IN TELEGRAM
26👍8🔥8
Про башни из слоновой кости и искусственную недоступность

💬 Знакомый рассказал историю. В одной компании были два очень больших руководителя (с огромными кабинетами, с кучей секретарей и регалий), которые хорошо общались, в целом, можно даже сказать приятельствовали, но никак не могли обсудить один вопрос. Однажды эти два руководителя встретились случайно в коридоре и один другого спросил: «Слушай, ну что мы никак не можем уже решить свой вопрос? Давай либо я к тебе приду в кабинет, либо ты ко мне в кабинет и обсудим». Оба они были первыми вице-президентами по чему-то очень важному, и второй ответил первому: «неее, дорогой, ты не понимаешь, первый к первому не ходит».

🙈 Ситуация анекдотичная, но сейчас она периодически возникает в AI. Сфера очень захайпованная, все стали большими экспертами со своими командами и помощниками, и когда зовут друг-друга в гости (например, в какой-нибудь подкаст), сразу возникает проблема, что сообщения неизвестно от кого в 90% случаев игнорируются. В итоге если вы сами большой босс или эксперт, добраться до другого большого эксперта вы зачастую можете только позвонив напрямую :)

🤔 С одной стороны, мне нравится этот стеклянный барьер для коммуникации: хочешь позвать человека, свяжись сам, а не выпендривайся и присылай всяких посредников. С другой стороны, некоторый снобизм в рассмотрении входящих это тоже высокомерно и плохо. Однако переполненные входящие сообщения никто не отменял, и никто конечно не обещал отвечать всем и на все.

🎬 В общем к чему я это. Готовим новый сезон подкаста ТехТок, теперь еще и с видео ❤️
Прошлый сезон, как и раньше, можно прослушать на большинстве подкастовых платформ, например тут
🔥27👍1211
Иллюзия, которая помогает нам учиться

🤔 Вот вы может думаете, что когда ведёшь курс по машинному обучению например, просто берёшь известные темы, рассказываешь их понятно, делаешь задания для закрепления материала и все тут. Как бы ни так.

Знаете, вот иногда выйдешь из дома и думаешь: а я точно дверь закрыл? Ну или там утюг не выключил может. Или для особо тревожных - свет в комнате оставил, теперь за день набежит на целых 50 копеек лишних. Вот есть один такой же тревожный вопрос, который мучает меня про базовый курс машинного обучения, который в разных вариациях и разных местах я преподаю уже 14 лет: порядок тем.

😐 Серьезно. Вот я каждый год несколько раз за год задаюсь вопросами: рассказывать сначала линейные модели или сначала деревья? Рассказать сначала введение во все основные методы supervised learning, а потом unsupervised или сделать нейросети прям отдельно в конце, чтобы сразу там и про всякие автоэнкодеры упомянуть, а не разделять?

🧶 Проблема в том, что наука развивается сама по себе, без оглядки на то, насколько стройная программа курса потом получится :) В итоге получается, что все темы друг с другом взаимосвязаны и расположить их линейно можно кучей способов. В рамках парадигмы «то что мы ещё не проходили, мы с вами пока не знаем» это приводит либо к потере, либо к откладыванию изучения части связей, и роль автора курса - выбрать, что слушателю дать раньше, а о чем рассказать потом или вовсе не рассказывать.

🌳 Ну например, про линейные модели и деревья. Деревья устроены проще в плане нужной для их понимания математики, но, рассказав про деревья, логично не тянуть и сразу переходить к ансамблям деревьев. А хочется сначала пройти какие-то базовые алгоритмы, а потом уже идти в ансамбли. Тогда линейные модели надо ставить до деревьев. Но линейные модели требуют от слушателя уже хоть немного не бояться математики - что такое градиент понимать, градиентный спуск. Если рассказываешь студентам технического ВУЗа - не беда, они все это знают. Если же разрабам или вовсе гуманитариям: создаётся некий барьер, который выше, чем у деревьев, но встретившись раньше, может помешать людям даже добраться до всяких лесов и бустингов, которые на самом деле очень просты. А если просто руками поводить и сказать «ну тут параметры подбираются автоматически из оптимизационной задачи», то будет уже совсем профанация какая-то.

🤹Так вот одна из скрытых (но очень важных) работ любого автора курса - из огромной и разнообразной области, не спрашивающей нас, как ей развиваться, чтобы было красивое оглавление в учебниках, сделать что-то стройное, логичное, систематизированное, уложенное в линейную последовательность тем и дающее слушателю приятную иллюзию порядка.

☝️Как только слушатель начнёт работать и нарабатывать практику, он поймёт, что это была иллюзия. Что нет такого четкого деления на типы алгоритмов, что можно спокойно и безнаказанно совмещать вещи из разных глав учебников, а какие-то методы и задачи можно было записать сразу в несколько глав. Но эта иллюзия порядка, созданная лектором, уже помогла изучить основы. И в этом и был ее смысл.
👍56🤔1713🫡7🔥5👌3
Последняя неделя набора в ШАД Яндекса

❗️На этой неделе завершается набор на учебную программу в Школе анализа данных Яндекса — заполнить анкету можно до 12 мая включительно.

❤️ В моей жизни ШАД занял большое место. В своё время я там учился, преподавал, а не так давно даже немного поучаствовал в написании ШАДовского учебника по ML. К себе в команды я тоже всегда с удовольствием нанимал выпускников и преподавателей ШАДа 🙂

🦾 Сейчас ШАД Яндекса по-прежнему одно из лучших мест, чтобы учиться Computer Science и Data Science, очень рекомендую это место самым смелым и сильным в математике.

🧑‍💻 После подачи заявки вы сможете пройти тестирование, которое уже стартовало и продлится до 13 мая, 19:00. Если вы готовы к тому, что следующие два года вам будет очень сложно, но очень интересно, — подавайтесь 🙂

P. S. Посмотреть примеры задач и узнать больше об обучении можно на сайте ШАДа, а ответы на вопросы по поступлению вы можете найти в записи дня открытых дверей в Москве или задать их в телеграм-чате «Все в ШАД».
🔥20👌1055👍3🤯1
🎲Пятница — день квизовый. А значит, самое время проверить ваши знания. Ну или интуицию. Посмотрите на эту картинку внимательно и помните: правильный ответ здесь только один ☝️

Пишите свои варианты в комментариях!
👍124💩1🎅1
💼 У кого-то выходные, а я пришел записывать ролики для YouTube :)

❗️Запросы, о чем рассказать, принимаются в комментариях
46👍15
Kantor.AI
🎲Пятница — день квизовый. А значит, самое время проверить ваши знания. Ну или интуицию. Посмотрите на эту картинку внимательно и помните: правильный ответ здесь только один ☝️ Пишите свои варианты в комментариях!
🤓Итоги квиза

Итак, лишним может быть любой ответ:

1️⃣ - единственный предмет из приведенных, который по-существу используют только для гадания (кофейную гущу добавляют в рассаду, на червях и гадают и используют как приманку, в обычные карты можно просто играть)

2️⃣ - выделяется по цветовой гамме из остальных

3️⃣ - если обратить внимание, что черви желатиновые, то на таких конечно никто не гадает :) Но тут зависит от «что хотел сказать автор», потому что в изначальной версии квиза были и желатиновые, и настоящие черви, из-за чего ответ был очевиден.

4️⃣ - как верно заметили в комментариях, единственная картинка с одним объектом, а не несколькими (на 2 - кофейные зерна)

Ну и, наконец, если следовать духу загадок вроде «В автобусе спали все пассажиры, но только водитель не спал, как звали водителя?», то правильный ответ 1, потому что «ответ только один». И это вы тоже отгадали 👏

Во-первых, вы молодцы и помогли показать, что обосновать можно как правило все что угодно (за это я и ненавижу с детства задания в тестовой форме с выбором вариантов ответа 😁).

🤔 Во-вторых зачем нам это все: то, чем мы сейчас занимались, было примером обучения без учителя (unsupervised learning). Когда вам не приведены в обучающей выборке примеры и правильные ответы, по которым можно понять, по какому принципу вы считаете объекты похожими и непохожими друг на друга, всегда есть куча способов поделить объекты выборки на группы. Именно поэтому задачи unsupervised learning на порядок сложнее решить удовлетворительно для человека, чем задачи supervised learning.

Вот делаете вы кластеризацию, например, отзывов на товары, и как вашему алгоритму понять, по товарам вы кластеризуете, по тональности, по лексике, по обнаруженным проблемам или еще по чему? Только по тому, как вы считаете признаки, и в каких признаках различия проявляются сильнее. Что при 100-1000-10000 признаках попробуй еще отследи.

Вы скажете: что же это за вранье было, что «ответ только один»? Ну так unsupervised алгоритмам тоже надо дать только один ответ, когда способов ответить логично целое множество. Это было полное погружение в жизнь алгоритмов обучения без учителя, почувствуйте изнутри, так сказать :)

💡Но в то же время если быть достаточно находчивым в построении unsupervised штук, они могут забустить целый набор supervised задач. И в следующий раз я расскажу вам, причем здесь word2vec и GPT - две казалось бы очень разнесенные по времени своей популярности вещи, но обе показывающие мощь правильно примененных unsupervised подходов.
🔥34💯15👍114🤯1💩1🍾1😈1