Kantor.AI
11.6K subscribers
144 photos
12 videos
5 files
188 links
Канал Виктора Кантора про Data Science, образование и карьеру в сфере анализа данных. По вопросам сотрудничества: @mariekap

РКН: 5140322136
Download Telegram
☺️ Выложили мой доклад на датафесте в офисе VK (секция Data Strategy). Никаких покровов не срываю, доношу очень простые мысли: зачем дата стратегия нужна, когда это бесполезная фигня, а когда хорошая тема. В комментариях можно задавать вопросы по докладу или просто так по теме.

❤️ Также рекомендую подписаться на канал Иры Голощаповой Reliable ML. Ира прекрасна тем, что всегда поднимает хорошие важные вопросы применения ML, не гонясь за сезонным хайпом. А такого в наше время, когда каждый суслик, потыкавший ChatGPT, уже сразу AI эксперт, всегда не хватает :)
15👍3👎1
Forwarded from Reliable ML
Дата-стратегия в крупной группе компаний - Секция Data Strategy - Data Fest 2024
Обсуждение доклада Виктора Кантора, ex-CDO MTS, founder MLinside

В этом году на Data Fest мы с Димой провели экспериментальную секцию - Data Strategy. Тем самым расширили охват тем, обсуждаемых на фесте, добавив к data science проблематике историю с построением и развитием команд данных.

Опыт считаем успешным - запрос стратегического взгляда на дата-офисы оказался большим. Секция собрала аншлаг участников и после каждого доклада были интереснейшие обсуждения, которые потом продолжились на афтепати. Поэтому предлагаем дообсуждать недообсужденное с каждым из наших прекрасных CDO - авторов докладов.

Первым на секции выступил Виктор Кантор, у которого есть замечательный тг-канал Kantor.AI, а также школа по ML - MLinside. Витя в своем докладе задал провокационный вопрос: а нужна ли вообще стратегия по данным компании? И далее, с помощью интересных кейсов и примеров раскрыл пользу наличия стратегии, а также наиболее важные аспекты, которые там должны быть продуманы.

Презентацию доклада можно найти здесь, видеозапись - тут.

Витя готов ответить в треде на ваши вопросы по теме доклада.

Есть ли в вашей команде/компании дата-стратегия? Насколько, на ваш взгляд, она полезна?

***

Полные материалы секций Reliable ML на Data Fest 2024 можно посмотреть на сайте ODS.ai:

- Career от 25.05
- Data Strategy от 25.05
- Reliable ML от 02.06

Ваш @Reliable ML

#tech #business #datafest2024 #career
👍125👎1
Что думаете про приватные каналы в тг? Что там может быть, чтобы был смысл подписываться? Ну кроме типичного онлифанс контента) (и то есть вопросы)

Вижу сейчас прямо какой-то бум популярности после свежего апдейта телеграмма, но остается вопрос, за чем именно туда идут подписчики.
🤔22💩6👍2
50😁62💯12😈71
Как я запускал и проводил курс DMIA. Часть вторая

⏭️ Продолжаю историю о том, как мы с командой единомышленников 9 лет обучали людей Data Science бесплатно :)

Постепенно вокруг меня появлялись другие участники.

🥇 В какой-то момент мы скооперировались с Сашей Гущиным, который был очень хорошим кагглером и доходил до топ-5 в мировом рейтинге на Kaggle. Так у нас появилось соревновательное направление.

🤿 С разными другими ребятами мы сделали направление deep learning. Это изначально Арсений Ашуха, который сейчас вовсю занимается наукой, а позже - Никита Селезнев из Яндекса и Таня Савельева, которая впоследствие стала серийным CEO как раз в теме ИИ.

⤴️ Знаковым стал момент, когда к нам присоединилась Эмели Драль и помогла вывести Data Mining in Action на новый уровень. В моём исполнении это всё-таки была немного местечковая, физтеховская тема. Мы познакомились с Эмели, работая вместе в Yandex Data Factory и записывая специализацию на Coursera, стали хорошими друзьями, и сделали намного больше крутых курсов, чем это получилось бы порознь.

🚌 Одним из важных факторов был перевоз курса из Долгопрудного. Это отчасти было задрайвлено тем, что в Долгопрудном было непросто находить аудиторию. В какой-то момент нас выручил ФизТех Парк. Он был недалеко от МФТИ, и там могло разместиться около 500 человек. Но потом стало понятно, что на курс ездят люди со всей Москвы (даже из МГУ доезжали) и как-то не очень правильно концентрировать всё на Физтехе — было бы здорово переместиться куда-то в Москву, чтобы всем было удобнее ездить.

🌍 Эмели, как выпускница РУДН, сразу нашла способы договориться с родным ВУЗом, мы переехали и пару лет пробыли там. К этому моменту у нас сформировались основное направление курса, трек «Индустриальный анализ данных», трек «Спортивный анализ данных» про соревнования по машинному обучению и трек «Глубокое обучение». И в таком качестве мы могли бы достаточно долго существовать, но позже мы познакомились с МИСИСом и переехали к ним.

🤝 Мы начали пытаться как-то дружить с компаниями, то есть договариваться, что они на какую-то небольшую сумму профинансируют курс. Идея была в том, что как минимум эти компании будут представлены, смогут прочитать гостевую лекцию, а как максимум — кого-то наймут на собеседованиях в конце курса.

За год через нас проходила где-то тысяча человек. Не всегда до конца, к концу курса было кратно меньше слушателей, все же у нас давались довольно содержательные знания. Но смысл для нас был в процессе, и в том, что из этого процесса пусть, условно, 25–30% студентов, но выходят, что-то узнав и как-то культурно обогатившись.

🔚 Эта история была бесплатная для студентов, просуществовала она 9 лет, но, к сожалению, уже к концу я не смог нормально её сочетать со своей работой в топ-менеджменте. Основной вывод, который я из этого всего сделал: даже на энтузиазме, при большом желании можно держать большой курс в течение аж 9 лет и привлекать людей. Ну а если под это ещё положить нормальную экономическую модель, будет совсем идеально.

Про экономическую сторону вопроса я немного расскажу в третьей, заключительной части.
55🔥319💩3👍1
#образование
Как я проводил курс DMIA:
часть третья, заключительная

💸 Если вы думаете, что, раз у нас были спонсоры, мы купались в деньгах, это абсолютно не так. То есть было обычной историей, что мы с Эмели скидывались сами, ещё сколько-то добавляли спонсоры (соотношение было условно 0,5х + 0,5х от нас и 0,15-0,45х от спонсоров). Мы фактически обучали за свой счёт других людей, а не зарабатывали на этом. Этим в частности объясняются переезды курса. Когда место, где нас принимали с нашей аудиторией, понимало, что мы ПРАВДА делаем это бесплатно и нам НЕЧЕМ с ними поделиться, энтузиазм от того, чтобы захостить курс на 500 человек в семестр внезапно резко падал 😂 Самыми доброжелательными оказались коллеги из МИСИСа - ничего, кроме пресс-релизов про то, что мы учим именно у них, у нас не просили. Но мы в любом случае очень благодарны всем, кто принимал наш курс в своих стенах.

📌 Со многими из ребят, которые у нас учились, мы впоследствии работали вместе. Кстати говоря, попал я в качестве Chief Data Scientist в Big Data МТС в своё время тоже благодаря своей образовательной деятельности. Люди, которые работали в МТС, назвали моё имя руководству в числе наиболее известных деятелей нашей сферы. Всё потому, что многие из них либо учились у нас, либо просто знали о существовании таких курсов. Поэтому, по большому счёту, хоть это и было благотворительностью, я думаю, что своими карьерными успехами я обязан этой деятельности и она себя оправдала.

📌 Но в будущем, учитывая полученный опыт, я бы предпочёл всё-таки запускать это как коммерческую историю, которая может сама себя поддерживать и не умрёт от того, что в какой-то момент просто не нашлось спонсоров или закончилось время у основателей. Либо с каким-то большим стратегическим партнером надолго и серьезным бюджетом. Кто знает, может какой-то большой корпорации это будет интересно, и однажды DMIA реинкарнирует в виде академии со своим зданием, крутыми преподавателями и нашими любимыми направлениями :)
188👍26❤‍🔥8👎2🤔1
🏁Первое мероприятие в рамках школы MLinside – онлайн-вебинар для тех, кто хочет погрузиться в Machine Learning!

Совсем недавно мы с командой анонсировали первый курс «Базовый ML» в рамках моей ML-школы и рассказали о том, кого мы ждем на потоке.

Я знаю, что большая часть моей аудитории – инженеры, программисты, аналитики, разработчики и даже проджект/продакт-менеджеры, которые хотят погрузиться в ML, чтобы применять эти знания в работе и повышать свою эффективность (многочисленные кастдевы и опросы не дадут соврать🙂). А также много тех, кто видит большие перспективы в машинном обучении, и кто хочет вкатиться в профессию ML-специалиста будучи новичком.

📌Специально для вас мы с командой организовали онлайн-вебинар, на котором поговорим о направлении ML, ваших перспективах развития в этой сфере, а также расскажем о том, какие навыки необходимы для старта погружения в ML.

Подробной информацией о вебинаре мы уже начали делиться в новой публикации канала MLinside.
Подписывайтесь, чтобы ничего не пропустить☝️

Ну а мы с командой будем ждать всех, кто готов погружаться в машинное обучение и расти в этом направлении!🤝
507🙏4🔥3😁1
Тем, кто уже начал думать, чем заменить в работе Notion и Miro
Forwarded from CodeCamp
This media is not supported in your browser
VIEW IN TELEGRAM
Забудьте про Notion: нашёл для вас open source альтернативу — AFFiNE.

Это ультимативная смесь Notion и Miro — тут собрали лучшее от обеих платформ. Базу знаний с досками можно развернуть локально (плюс к безопасности), а можно юзать на сайте — туда уже завезли мощные ИИ-фичечки.
51👍42🔥142🤬1
Как компании экономят миллиарды с помощью ML-специалистов?

🔔Именно такие кейсы, показывающие востребованность и интересность задач в ML, я разберу на вебинаре уже в эту среду (завтра!). Зарегистрироваться на вебинар можно по ссылке ниже⬇️

[ Зарегистрироваться ]

❗️Важно: доступ к регистрации на вебинар закроется 28.08 в 19:00 по Мск, поэтому не откладывайте!

На мероприятии мы:
▪️обсудим, что вы сможете делать с помощью ML, и какие реальные кейсы его применения нас окружают,
▪️поговорим о том, как найти работу начинающему ML-специалисту,
▪️разберемся, с чего начать изучение ML, и какие навыки для этого нужны.

Встречаемся 28.08 в 20:00 по мск

Вебинар – отличная возможность начать погружение в ML уже сейчас👍
👍136👌1
Вот мы и начинаем наш первый вебинар в рамках школы MLinside!

Кстати, сегодня на вебинаре мы откроем запись на первый курс, а значит, что деятельности MLinside официально дан старт🚀

Для тех, кто не успел зарегистрироваться на мероприятие, оставляю ссылку👇

[ Присоединиться к вебинару ]

Мы начинаем!
🔥147👍5👎1🤯1
Какие профессии заменит AI в ближайшие 5 лет?🤖

В последнем видео на нашем youtube-канале я рассказал, как на самом деле работают нейросети, и пообещал поделиться своим мнением по поводу того, какие профессии находятся на грани исчезновения или вовсе исчезнуть в ближайшие 5 лет.

Про кассиров, курьеров и водителей я рассказывать не буду. Думаю, об этом итак все знают, так как тенденция замены физических работников уже наблюдается. Итак, вот мой топ профессий, находящихся под угрозой замены искусственным интеллектом👇

1️⃣ Банковские работники. Алгоритмы машинного обучения уже хорошо справляются с анализом и составлением финансовой отчетности. Но пока это касается однотипных задач. В случае нестандартной ситуации понадобится человеческий взгляд и использование накопленного опыта. В зону риска попадают и кредитные эксперты, так как ИИ уже способен посчитать финансовые возможности заемщика, вероятность задержки платежа по кредиту и так далее.
2️⃣ Программист. ChatGPT уже имеет возможность самостоятельно писать и модифицировать код на различных языках программирования. Например, корпорация Microsoft относительно недавно заявляла о сокращении штата сотрудников и инвестировании 10 млрд бюджета в OpenAI. И ожидается, что в ближайшем будущем потребность в начинающих специалистах в программировании будет снижаться.
3️⃣ Учитель. Сейчас искусственный интеллект способен объяснить непростые вещи словами любого уровня сложности. Огромным плюсом является непоколебимость эмоционального состояния. Вы можете хоть 100 раз просить объяснить один и тот же вопрос, и чат-бот будет готов отвечать вам, не выходя из себя. Хочешь, чтобы тебе объяснили высшую математику простыми словами? Или хочешь вспомнить все правила русского языка? А может, хочешь выучить иностранный язык? ChatGPT вам в помощь:) Отсюда, кстати, вытекает следующая профессия
4️⃣ Переводчик. Сейчас совершенствование систем синхронного перевода идет ускоренными темпами. Это сильно скажется на рынке занятости по всему миру. Опытный переводчик, который годами учил иностранные языки и совершенствовал свой уровень, уже будет не так востребован.
5️⃣ Медработник. Сейчас искусственный интеллект не ставит итоговых диагнозов и не дает советы по поводу здоровья, чтобы не брать на себя ответственность. Но скорее всего в будущем ИИ будет, опираясь на состояние пациента, его жалобы и анализы, все чаще помогать врачам ставить диагнозы, и возможно даже в какой-то момент серьезные решения начнут приниматься без участия врача. Рутинные задачи, которым уже можно обучить ИИ: заполнение и обработка рецептов, предоставление информации пациентам о правильном применении медикаментов, побочных эффектах, взаимодействии с другими препаратами, рекомендации альтернативных лекарств, проверка сроков годности лекарств, диагностирование ряда болезней по симптомам и уже сделанным анализам.

☝️Подводя итоги, AI в будущем способен автоматизировать выполнение рутинных задач, не требующих критического и стратегического мышления. Однако это вряд ли будет прям полноценной заменой, просто изменятся требования к специалисту: если раньше нужно было все делать самому, то теперь нужно будет уметь комбинировать работу с ролью оператора AI-решений.
50😁3318👎10👍2🤔2😈1🫡1
Запись на курс «База ML» официально открыта!

🥳
На прошлой неделе мы с командой провели онлайн-вебинар школы MLinside и открыли запись на наш первый курс «База ML».

❤️ Признаюсь, я очень долго этого ждал, долго решался на запуск своей школы (несмотря на 15 лет преподавания ML в ВУЗах и компаниях и успех наших курсов на Coursera), долго готовил все необходимое, и наконец очень рад, что наш курс стартует.

☝️Цель курса - дать слушателям навыки, нужные для перехода в сферу машинного обучения. Для новичков это будет возможностью подготовиться к поиску работы и прохождению собеседований, а для специалистов в смежных областях - расширением экспертизы и возможностью дороже продать свои услуги на рынке труда. Подробнее о курсе можете узнать, прочитав прикрепленные к посту карточки.

💸Способы оплаты: карты РФ банков, иностранные карты, оплата от вашей организации.
Также доступна рассрочка на 3-6-12-18 месяцев.

По промокоду KANTOR вы получите скидку 5% на обучение.

Старт курса: 18 сентября
❗️На первый поток мы возьмем только 50 человек (осталось менее 15 мест).
Забронировать место на потоке можно здесь⬇️

https://mlinside.ru
17🍾7🔥4👎1
Как я чуть не продолбал свою фамилию

Пару месяцев назад у меня случилась крайне неприятная вещь: я увидел в почте, что у меня закончилось время регистрации домена kantor.ai, буквально на пару дней позже истечения всех сроков 😱

Оказалось, что его уже зарегистрировал кто-то во Владивостоке 🤯

Не то чтобы я активно пользовался доменом, но я успел к нему привязаться, плюс некоторые дальнейшие планы прям совсем не стыковались с его потерей.

Что же делать?

Мои коллеги по MLinside попробовали выручить меня и связаться с новым владельцем домена, а я приготовился отвалить кругленькую сумму за перекупку домена. Но человек нам так и не ответил.

В глубине души я продолжал надеяться, что домен просто станет доступен для регистрации. И вот сегодня чудо свершилось, а я на радостях продлил домен на 10 лет вперед 😂

Вот теперь думаю, уж не маркетинговая ли это уловка была, чтобы продлевали на по-дольше 🤔
👍32🤔20🔥8😁54❤‍🔥4🙏4
🌏Gen AI для генерации миров

🎮 Когда у меня в компании все обсуждали мета-вселенные и с экспертным видом размышляли, как оно будет, мне хотелось встать и закричать: «Все, кто не играл в Roblox, выйдите из чата» :)

👶 Для тех, у кого нет детей, детей друзей и детей родственников, и кто в танке: Roblox эта такая игра с играми. Ну уж про Minecraft, где весь мир кубический, и вы кубический (по-простому - квадратный))), вы уж точно все слышали. Так вот в Roblox вы такими же несложно выглядящими персонажами можете играть в кучу разных игр, а креаторы могут их создавать на движке роблокса.

🎉 Буквально в эту пятницу Roblox объявили о разработке Gen AI модельки, которая будет создавать игровой мир по текстовым промтам. В самой статье приводится замечательный пример: представьте, что баттл-рояль на 100 игроков сможет реализовать команда из 2-3 разработчиков.

Сама идея разработки игр с помощью Gen AI во всех своих проявлениях конечно не нова, да и концепция «игра по промту» тоже. Привязка к платформе Roblox несколько сужает многообразие вариантов, но зато становится проще натренировать что-то удобоваримое => юзабельный инструмент скорее всего случится быстрее чем для геймдева в целом.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥146👍4😁1😍1
Статзначимость в А/В тестах или немного о том, зачем нужна статистика (часть 1/3)

Сейчас я заканчиваю готовить математическую часть нашего курса «База ML» (в частности, модуль по теорверу) и очень плотно работаю с вопросом «а зачем оно надо?». Топ-1 ответом на вопрос, зачем нужны теорвер и статистика в ML (да и не только в нем) по-прежнему остается проверка статистической значимости. В современном мире мы чаще встречаемся с ней в контексте A/B тестов, когда части клиентов показывают одно, части другое, и из этого эксперимента пытаются сделать выводы. В этих постах вас ждет рассказ в трех частях: 1) введение, 2) непосредственно по теме и 3) некоторые интересные моменты, которые тоже полезно обсудить. Кто знает ответы на вопросы, выделенные жирным в этом посте, могут просто пролистать его и переходить сразу ко второму.

Зачем вообще нужны А/В тесты?

Потребность в А/В тестах возникает тогда, когда мы хотим что-то улучшить. Например, взамен какого-то существующего алгоритма персональных рекомендаций товаров или старого интерфейса мобильного приложения внедрить новую версию. А/В тесты как метод отвечают на вопрос: «Как понять, что это правда будет улучшать важные для нас показатели?»

Посмотреть «стало ли продаж больше» и удовлетвориться такой оценкой нововведения — это очень топорный подход, который сработает только когда бизнес-показатели не зависят от времени и нововведение лишь одно. Обычно это не так. Бизнес растет или угасает, бывает «сезон» и «не сезон». Бывает очень много изменений за месяц, и понять, какое именно из них вызвало эффект, невозможно. Однако многие вещи в коммерческих компаниях (даже самых технологичных) и в 2024 году делаются без А/В тестирования. А еще больше — без оценки статзначимости. К А/В тестам не нужно относиться теологически, но стоит понимать силу и возможности инструмента.

Что такое статистическая значимость и A/A тесты?

Допустим, нет пока никакого нововведения, которое вы будете оценивать в А/В тесте, есть пользователи вашего сайта или приложения, и вы просто делите их на две группы и смотрите на результат в каждой (например, на конверсию посещений в покупки на сайте). Такой тест называется А/А тестом, и, наверное, вас не удивит, что даже при хорошем разбиении на группы результаты в них будут немного отличаться.

Статистическая значимость эффекта в А/В тесте, грубо говоря, означает, что различие между группами заметно больше, чем было бы в А/А тесте, т.е. «есть реальный эффект», а не случайные отклонения. Что это значит для бизнеса? То, что хотя бы при сохранении тех же условий, что и во время проведения А/В теста, эффект от нововведения с большой вероятностью будет какое-то время сохраняться (важное уточнение: эффект может затухать со временем, никто не отменял «эффект новизны»).

#математика
👍218❤‍🔥2🙏1