Kantor.AI
12.1K subscribers
146 photos
13 videos
5 files
193 links
Канал Виктора Кантора про Data Science, образование и карьеру в сфере анализа данных. По вопросам сотрудничества: @mariekap

РКН: 5140322136
Download Telegram
Вопрос к тем, кто нанимает дата саентистов:

1. К вам на собеседование пришел человек без опыта работы в DS, что будете спрашивать?

2. Тот же вопрос про человека с опытом работы в DS

Во всех случаях речь не про синьорскую вакансию, а про рядового работягу.

Пишите в комментариях свои ответы, потом устроим голосование
🔥176
Никита тут опять выдал базу, как всегда с огоньком :) Подтверждаю, что ровно так и устроена работа в компаниях, причем тупо во всех поголовно без исключений. От студенческого стартапа до fortune500, причем не только между коллегами, но и в ролях исполнитель-подрядчик и в партнерских проектах. И конечно же к этому добавляются постоянные обвинения в неэффективности.

Например, был в одном месте товарищ, который больше всех обвинял моих ребят в том, что на работу потратили кучу денег и мало что сделали. Куча денег в том случае были 2 миллиона, мало что - прототип, который работал корректно, но не на том принципе, который чел хотел видеть внутри как большой знаток AI. На словах товарищ раздувал траты до 30 млн. Недавно же услышал байку, как его команда навыдавала промо-скидок на лярд и забыла их отключить.

История про «мы вам дадим показать эффект на задаче, где три копейки, а сами будем делать там, где лярд» тоже классика, когда внедряешь AI в чей-то процесс или когда кто-то пришел внедрять первым.

Еще есть другой распространенный корпоративный ритуал: принять какие-то решения про чужую задачу и чужую область ответственности без собственно человека, который за это отвечает. Это тоже прям классика-классика, так что нужно уметь вовремя оказаться на том совещании, куда вас не звали, и насовать аргументов против. Или наоборот сознательно не пойти на такую встречу, чтобы слить агрессору тухлую задачу😁

Надо ли удивляться, как же все стремно в компаниях организовано? Да конечно нет. Все перечисленное - свойство людей и их поведения в принципе, а в компаниях обычно работает более одного человека, вот и начинается неизбежное безобразие.
🔥24😁1910👎1🤔1
Про внутреннюю конкуренцию пост

Иногда канальи развлекаются тем что одну и ту же задачу решают 2 команды из разных бизнес-вертикалей — ну-ка посоревнуйтесь, и в результате конкурса поймем кто круче хитрее

Но есть нюанс, канал же про каналий 🤡

В одной далекой-далекой компании стояла задача по фото товара (которое делает сотрудник склада) определять номенклатуру.
Делалось это так:
1) на фото детектилась этикетка
2) OCR (а судя по тому что в 2025 выходят статьи про альтернативы Tesseract — побить его по сочетанию бесплатность-производительность-качество все же сложно)
3) матчинг изображения и текста на каталог
Никаких Visual Transformers, сложных моделей — но работает, качество хорошее, ну и ладно. Назовем эту команду П (первая, без отсылок к Пелевину или нездоровых корпоративных ассоциаций)

Но в недрах бизнес-вертикалей всегда находятся люди, которые прослышав про зп в ML внезапно вспоминают что кончали КБГТУ (как бы где-то там учился) по специальности «подставка арифмометра» -- она же связана с математикой, верно?, назовем эту команду С (самозванцы 😄). Как в корпорациях доказывают свою ценность? Два варианта — делать что-то полезное (редко) либо объявив коллег дураками (часто). Здесь же сходу не прокатило -- биг босс сказал «а докажите».

Не мудрствуя лукаво вторая команда стала отправлять запросы в gpt 4o и намеряла в офлайне точность в 85%+. Первая команда закономерно на разборе получила люлей 🤕 (потому как текущее решение было в районе 80%) и отправилась готовиться ко второму периоду.

Покрутили-поучили, добили до 90%, и вот уже во втором периоде гнев босса обрушился на команду самозванцев. Что было дальше?

Следите за руками словами лидера самозванцев:
1) Уважаемый Иван Иванович, А/Б провести не можем (да и зачем компании терять деньги тратясь на заведомо проигрышный вариант), давайте сравниваться оффлайн
2) Тестовую выборку разделим на 2 — по одной прогоним одну модель, по второй другую (ловкость рук)
3) Этот тяжкий труд по сплиту теста берем на себя, заодно и результат посчитаем 🤣🤣🤣👏

По итогам следующего теста у команды С точность 99%, у команды П — в районе 20%. Счет на табло стал уж совсем разгромный 😰

Вот сейчас не стоит сразу кликать на спойлер, не лишайте себя удовольствия подумать что могло пойти не так 🤔🤫

Парням из первой команды подсунули фото, где либо товара либо этикетки в кадре не было.
Мораль истории как в избиркоме — не важно как работает ваше решение, важно кто считает результат.
А вообще если вы видите 8 команд в компании, которые занимаются одним и тем же — я бы советовал выбрать либо другое направление либо другую компанию.
1🎉3812🔥5🤯1
В продолжение предыдущей истории — у тимлида первой команды были все основания ждать подвоха, ведь тимлид второй разошелся на цитаты:
мы сделали прогнозную модель с точностью 75% которая достигается тем что модель анализирует 800+ признаков

по факту -- one-hot на всем что было 🤦‍♂️

а вообще усреднять тема вот у нас в прогнозной модели 36 бустингов и точность высокая поэтому

🤦‍♂️
а зачем ты разбиваешь на train val test по времени? Можно же рандомно

😁
-обучать llm через lora неправильно
-а как правильно?
- ну там данных много надо, а вот мы сделали ии агента с рагом

👏🙌
построение эмбеддингов через tf-idf не является интеллектуальным анализом данных

👏
tf-idf - это не эмбеддинги это численное представление

🤦‍♂️

tf-idf - это низкоуровневные эмбеддинги

🤦‍♂️

Ну мы твой проект для задачи 1 внедрим, а для управления промо как пойдет

Возможный эффект задачи 1 - три копейки
Возможные эффект управления промо - сотни миллионов 😆💡

а зачем ты логарифмируешь цену? так хуже качество будет

🤔
😁21🔥156
🎧 Спарсили плейлисты в Spotify Альтмана, Суцкевера, Карпаты, Ле Куна, Ванга и других интересных личностей. Мы с вами это все категорически осуждаем как вопиющее нарушение личных границ и ни в коем случае не переходим по ссылке, чтобы послушать
Please open Telegram to view this post
VIEW IN TELEGRAM
1💯22😁20🔥6🫡51
🚀 Запускаю новый поток «Базы ML»

Всем привет!

Сегодня запускаю третий поток «Базы ML» — курса, в который я вложил опыт 15 лет работы в индустрии, преподавания в МФТИ, ВШЭ и топ-компаниях, сотен собеседований и главный принцип обучения ML: разумный баланс теории и практики.

Что внутри?

🧠 Не edutainment с пустыми обещаниями, а системное погружение — все формулы, все «почему» и «как работает внутри».

👨‍🏫 Гибкий формат — можно идти в своем темпе, но с живыми вебинарами и поддержкой.

🔥Программа-концентрат — только то, что реально спросят на собеседовании в ML.

😎 Команда мечты — это единственный базовый курс ML, который я знаю, где целых три автора с опытом работы Chief Data Scientist и Chief Data Officer у каждого, еще и в топ-1 компаниях в своих сферах (Яндекс, Сбер, МТС) объединили свой опыт, чтобы достичь оптимального сочетания строгости и наглядности в курсе.


Почему для меня это важно?

Каждая тема выверена до атома, потому что ML — это не «повтори за мной», а понимание на уровне интуиции и математики.

Этот курс — моя личная ставка на будущее индустрии. Если вы хотите не просто сертификат, а фундамент — добро пожаловать.

🔗 Программа и запись на курс: mlinside.ru
По промокоду KANTOR10 сегодня скидка 10%

📌 Старт: уже сегодня в 19:00
‼️На первый вебинар могут присоединиться все желающие, подключайтесь сегодня вечером: https://us06web.zoom.us/j/81515908205?pwd=QgXyirb5ZQ6G3eW7tIabHWT5FXgVMO.1


#MLinside #База_ML
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19💩87👍5
Товарищи физики, давайте поможем человеку в комментах 😁
😁136💯8🥰2
Вопрос к тем, кто пробовал перейти в Data Science / AI, но пока этого не сделал (может какие-то курсы не пошли, или руки почему-то не доходят): что было преградами на этом пути?

Напишите только пожалуйста, откуда у вас переход: из аналитики, разработки, менеджмента, не-айти, либо свой вариант.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔10🔥2
АI-агенты в проде, AI-помощник в облаке — что дальше 🧠

Узнайте 3 сентября на IT-конференция про облака и AI — GoCloud Tech.

В этом году целый трек будет посвящен трендам в AI&ML:
➡️ Как AI-помощник может управлять инфраструктурой за вас
➡️ Валидация RAG с помощью RAGAS
➡️ SWE-Agents in Developer Tools
➡️ Как собирать мультиагентную систему для любых задач
➡️ Эволюция AI-агентов

Также будут отдельные треки про работу с данными, облачную инфраструктуру и сервисы для разработки. А еще — демо, воркшопы, карьерные консультации, мерч и яркое afterparty.

Регистрируйтесь🖱
Please open Telegram to view this post
VIEW IN TELEGRAM
8🔥2💩2
Даша крутая, подписывайтесь на её канал: https://t.iss.one/redrecsys (подробности кто Даша и чем занимается - ниже)

Кстати в итоге на RecSys их статью взяли 🎉
👌6🔥53
Меня часто спрашивают сколько займет по времени вырасти от джуна до синьора / лида.

Обычно я в пример привожу Дашу
В начале 22го она пришла к нам джуном (кстати взяв 4е место в нашей сореве)

Несколько месяцев она уже лидит RnD-группу нейросетевых рекомендаций в МТС \ MWS.

Но на этом она не останавливается — не так уж и сложно было ее убедить опубликовать свои идеи в статье на RecSys’25, что стоило не только новогодних и майских праздников, а еще и много нервов 🙃.

А на днях Даша еще и канал завела — не стесняйтесь подписываться!

PS
ссылочка любителям сюжетов про быстрый рост 😃
16👍6💩4🔥3👌3
This media is not supported in your browser
VIEW IN TELEGRAM
Я знаю, что у многих из нас уже выработалась лёгкая аллергия на «конференции по ML» — круг одних и тех же лиц, всё больше похоже на встречу выпускников, чем на поиск новых идей.

Practical ML Conf приятно выбивается из этого ряда. Во-первых, состав спикеров действительно разнообразный — в программе не только яндексоиды, но и коллеги из Sber AI, Т-Банка, Avito Tech, Wildberries и других компаний. Все — практики, которые делятся тем, что реально работает, а не красивыми слайдами ради слайдов.

Во-вторых, доклады начинаются не с рассветом (коллеги-совы поймут ❤️), а сама программа не перегружена — есть время выдохнуть, переварить услышанное и пообщаться.

Лично я люблю треки про рекомендательные системы и LLM. В этом году, например, Николай Савушкин расскажет, как генеративные модели реально работают в рексистемах Яндекса, а Павел Гуляев из Sber AI поделится опытом создания памяти для LLM на примере GigaChat. Эти темы важны не только потому, что «хайп», но и потому, что они меняют то, как мы строим продукты — от поиска до образования.

Есть ещё одна вещь, которая делает Practical ML Conf для меня особенным. С давних времен существует внутренний митап Яндекса — PML — мы собирались, чтобы делиться рабочими решениями и привозить доклады с топовых мировых конференций. Я и сам в прошлой жизни там выступал. Сейчас Practical ML Conf стал открытой конференцией, и это классно — любой может поучаствовать и услышать рассказ про практические решения от тех, кто их реализовывал.

📍 PML пройдёт 27 сентября в Москве и онлайн.
Регистрация обязательна, а количество мест ограничено: pmlconf.yandex.ru/2025

Реклама ООО «ЯНДЕКС» ИНН 7736207543
👍141
Зачем нам работа

Зачем нам работа? Ну что за глупый вопрос. На ней нам платят зарплату и на неё мы вкусно (или не очень) кушаем, покупаем себе всякий хлам, транспортные средства, недвигу, кружки для детей, подарки жене и так далее и так далее.

Но все чаще я вижу состоятельных друзей, которые уже прекрасно могут жить с капитала, либо имеют надежное сочитание хорошей финансовой подушки и уже работающего бизнеса, которые зачем-то идут... на работу! Спрашиваю "Зачем?", отвечают, что стало скучно.

Даже откинув тех, кто держит хорошую мину при плохой игре и банально поиздержался, мы все равно найдем много людей, которым не нужно работать ради зарплаты. При этом не все они (!) даже достаточно богаты (ну, например, не все High-Net-Worth или Ultra-High-Net-Worth). Разработчик в условном Яндексе или Авито так-то тоже может работать не ради зарплаты и иметь возможность несколько лет посидеть дома или заниматься своими делами.

Зачем же еще работать? Например, просто интересно. Работа нравится. Но если тебе она нравится, может тогда сделать свою компанию в той же сфере и работать на себя, еще и денег больше получать? Ну а вот как быть, если правда работа нравится, а не компанию делать, где будет куча других неприкольных задач 🙂 Плюс не факт, что денег будет больше, может наоборот самостоятельно организуешь все хуже.

Другая причина - жажда достижений. Чтобы было что потом рассказать, да и драйв был от достигаторства. Третья - социальный статус. Мне тут в прошлом году предлагали пойти в один институт ректором. Печальным открытием для меня было, что госслужба по сравнению с работой биг боссом в корпорации в принципе крайне неприбыльное дело (всякую схемотехнику разумеется осуждаем и не рассматриваем). Но ведь есть какие-то люди, которые идут в ректоры, мэры, губернаторы, потому что это в их системе координат круто. А есть те, кто идут туда же, чтобы сделать жизнь других людей лучше, идейные товарищи.

Так получается финансовая мотивация работать вообще далеко не всегда самая главная. Если с голоду не помираешь, то может лучше быть счастливым, чем состоятельным? Сложный и коварный вопрос, особенно с учетом того, что люди разные.

Давайте немного помечтаем. Где бы вы работали с удовольствием (или уже работаете)? Что в этом месте должно быть, чтобы чувствовать себя счастливым, занимаясь этой работой?
💯2816🤔5🤡2👍1
Мощь R&D Т-Банка заставляет плакать кровавыми слезами) Дайте пацану премию Тьюринга Дарвина
😁17💯3👎2🤔2🤡2
Forwarded from AI.Insaf
Не знал, что bag-of-words это новые технологии 😁

А так конечно коммерсант еще не готов давать ссылки на гитхаб, где бустинги и обучаемые косинусные расстояние
😁58🔥9🤡6💯4👎2
К слову. Помню вакансии с офигительным пунктом в описании требований: "владение технологией Tf-Idf". Кому какая еще кринжатина засела в памяти? :)
😁33
Как оно бывает, когда биг босс говорит, что у компании миллионы клиентов

Лет 10 назад одна компания, продававшая и подключавшая (в числе прочих услуг) iptv приставки, захотела потеснить Mediascope на рынке измерения телевизионной рекламы. Медиаскоп, на секундочку, это многолетний монополист, по которому в мире тв-рекламы меряют всех: от завалящих региональных канальчиков до «Первого канала».

Гендиректор этого продавца iptv серьезно заявлял: «у нас есть 2 миллиона приставок, а у Медиаскопа всего десяток тысяч панелистов, мы сделаем инструмент намного лучше». Для реализации амбициозного проекта позвали умных программистов из топовой Российской айти компании, потому что ГД компании-продавца iptv дружил с ГД айтишников и заранее ударил с ним по рукам, что делать будут вместе.

Когда два биг босса договорились, подчиненным остается брать под козырек и приступать к неохотному, но неизбежному исполнению. Но стоило дискуссии спуститься на один уровень иерархии ниже, оказалось, что приставок все же 200 тысяч. Ну напутал босс, бывает. Однако подчиненные ГД это тоже не тот уровень, чтобы данные отгрузить, поэтому диалог делегировали и еще ниже. Оказалось, что там все в шоке, что приставок 200к, ведь 20к было всего! В конечном счете до айтишников вместо обещанных миллионов дошло 12 тысяч (даже с зарплатой и то разрыв обещаний и факта не так драматичен), но самое веселое выяснилось в конце. Оказалось, что из 12 тысяч приставок только по 2 тысячам есть данные о составе домохозяйства (кто живет-то в квартире), причем в некоторых случаях в одну квартиру были записаны 50 и более человек.

Когда вы станете биг боссом (если еще не), обязательно помните, что числа, принесенные вам менеджером в отчете, могут быть реально на порядок выше чисел, которые он сам получил от своих подчиненных. И чем выше вы в иерархии, тем более беспросветное вранье к вам иногда приносят. Это очень грустный эффект, потому что как следствие он приводит к инфляции реальных достижений - в них тоже перестают верить, а разбираться становится лень, когда 9 из 10 утверждений об успехах сформулированы с большой натяжкой, творческим додумыванием, "правильным" способом подсчета и умелым стоянием рядом в нужное время в нужном месте.

P.S.: Медиаскоп по-прежнему стандарт измерения тв-рекламы, а ГД из истории по слухам успешно устроил свою жизнь в счастье вдали от Родины. Еще и до того, как его объявили в розыск. Как-никак матёрый был менеджер.
28👍17😁9🔥7🤯2
Не жили хорошо, нечего и начинать?

Когда в вашей жизни происходит что-то хорошее (в любом масштабе, например, выросла зп, купили увлажнитель воздуха, начали ходить на тренировки, переехали в район с воздухом почище или еще что-то такое совсем обычное и понятное), очень часто ожидаешь, что качество жизни тоже чуточку улучшится. Первое время так даже и есть. На новую зп можешь себе позволить чуть больше, чем на старую, с воздухом почище и повлажнее лучше высыпаешься, после тренировок становишься бодрее, и так далее.

Но после недолгого периода радости приходит час расплаты. Оказывается, быть бодрым после тренировки уже не приносит радости. Все наоборот: это быть унылым сонным чмоней вас теперь бесит. Новая зп не делает вас счастливее, это мысль о зп ниже нее заставляет нервничать и бояться ее потерять.

Все это очень легко делает зависимым от появляющихся в жизни удобств. Надо ли с этим бороться и не привыкать к хорошему? Не знаю, для себя я не решил, как правильно. Жизнь у нас одна и до пенсии действовать по принципу «не жили хорошо, нечего и начинать» это верный способ кинуть себя же.

Единственное, я очень хорошо запоминаю моменты, когда было тяжело - когда болел я или близкие, когда не было денег, когда проваливалось то, во что вложил несколько лет работы. Вспоминаю эти моменты, когда все в порядке, и просто радуюсь, если сегодня этих проблем нет. Это мой искусственно выработанный способ сохранять радость в жизни, когда все нормально, и помогает он очень даже хорошо.

А как вы поступаете с тем, что к хорошему быстро привыкаешь? Принимаете как данность или тоже придумываете как обмануть мозг и радоваться почаще и подольше?
173👍23🔥11🤡1
Теневой бан в компаниях

Помню году эдак в 2014 мне нужно было от одной компании взаимодействовать со студентом с её кафедры в универе. Парень был очень талантливый и помогал провести образовательную программу на старте проектов с другими студентами. И вот каждый раз мой босс просил очень деликатно решать все вопросы со студентом, потому что у того была хренова туча подписчиков в VK.

Когда я говорю «хренова туча», это значит, что топ-1 университетское СМИ (нормально раскрученное) давало охват лишь в два-три раза больше, чем личная страничка студента, и постил он очень активно.

То, как корпораты переживали, что студент напишет про них что-то плохое (ну там назовет эйджистами или гомофобами, например, т.к. в те времена это считалось плохо для бизнеса) годами позже побудило меня самого завести канал в тг. Если точно, было одной из причин, но не последней по важности.

Однако также с годами я понял другой секрет: сила студента была не только в публичности, но и в том, что он был вне системы. Когда ты сам корпорат, можно не опасаться, что ты что-то там напишешь. Не напишешь. Первое, что учит любой, кто хочет промоушен - будешь неправильно болтать или болтать лишнее, получишь теневой бан. Бан на повышения, на найм в какие-то компании, на внутренние переходы в текущей. Студент тот кстати так и остался мега-талантливым, но биг боссом не стал. Может потому что и не хотел, а может потому что слишком часто прыгал по разным местам, не дожидаясь роста. А может потому что кому он такой социально активный нужен.

Что интересно, через несколько лет я встретил пример обратного эффекта. Товарищ с большим тг каналом обосрал у себя в канале компанию X за то, что не пустили в офис без документов, в итоге компании Y и Z с ним не стали даже начинать работать по причине «нафиг нам этот скандалист нужен» :)

Можно с пеной у рта возмущаться, что «так нельзя» или «это ущемление прав» или «эти биг боссы в корпах получат, совсем офигели», но ведь никто не заставляет нанимать или повышать тех, кого не хочется лишний раз трогать. Это в суде заслушивают обе стороны, а в жизни часто вас никто спрашивать не будет.
45💯29🤡17👍13🤔5
Про возможности и их реализацию

Недавно виделся с другом, у которого стоимость его доли в AI стартапе только за прошлый год выросла на 10+ млн долларов (причем не с нуля). Все это конечно на бумаге, но шансы обкэшиться на мой взгляд у него хорошие.

Еще некоторое время назад узнал, что у другого знакомого капитализация его AI активов перевалила за лярд.

А еще общался за последний год с очень многими корпоратами из AI, жалующимися, что работы сейчас на рынке нет, возможностей мало, чем заниматься непонятно.
🫡33😁23😭9