Forwarded from Дата канальи — про «специалистов» в данных / ML / AI
Переслали мне корпоративную методику по управлению продуктовым портфелем
Итак, если бы пожарную команду создавали по этой методичке:
1. Ideation (оценка идеи)
Варианты:
За месяц не произошло ни одного пожара, потенциальных клиентов нет — закрываем продукт (KILL)
или
Один пожар был, но с погорельцев особо ничего взять — MERGE с водовозами, водовозы — жизнеспособный продукт с устойчивой клиентской базой и выраженной сезонностью.
Но перед тушением пожара необходимо будет производить расчет эффекта от тушения и сравнение с прямыми продажами воды клиентам
Или
Было несколько пожаров — когда пришли опрашивать клиентов получили люлей как поджигатели, глаз подбит 🤕, но зерно есть — PIVOT. Будем дистанционно (чтобы снова не получить) продавать палатки жертвам пожаров
2. Concept Validation — подтвердить жизнеспособность концепции
Продуктовый комитет затребовал дорожную карту по тушению пожаров на следующий год
Необходимо рассчитать точное время и место пожаров, затраты на тушение, экономический эффект
Ок, провернули фокус из финала The Incredible Burt Wonderstone и прошли дальше
3. Prototype Development
Сделали пожарную машину на деньги, выделенные на этапе 2.
Машиной сложно назвать — поэтому скорее получилась пожарная тачка.
Комитет отправил нас на Technical Pivot, без доп финансирования конечно же
На остатки финансирования получилось сделать лейку-поливалку
А дальше пришла летняя жара , и пол-города сгорело вместе с продуктовым комитетом 😂😂😂
PS: для тех кто не в курсе — частная пожарная охрана есть и вполне благополучно работает (например) и в нашей стране и в других
PPS: у любого инструмента есть своя область применения, даже у продуктовых методичек, и вот уж методички неплохо бы начинать с описания к чему их следует применять
Итак, если бы пожарную команду создавали по этой методичке:
1. Ideation (оценка идеи)
Варианты:
За месяц не произошло ни одного пожара, потенциальных клиентов нет — закрываем продукт (KILL)
или
Один пожар был, но с погорельцев особо ничего взять — MERGE с водовозами, водовозы — жизнеспособный продукт с устойчивой клиентской базой и выраженной сезонностью.
Но перед тушением пожара необходимо будет производить расчет эффекта от тушения и сравнение с прямыми продажами воды клиентам
Или
Было несколько пожаров — когда пришли опрашивать клиентов получили люлей как поджигатели, глаз подбит 🤕, но зерно есть — PIVOT. Будем дистанционно (чтобы снова не получить) продавать палатки жертвам пожаров
2. Concept Validation — подтвердить жизнеспособность концепции
Продуктовый комитет затребовал дорожную карту по тушению пожаров на следующий год
Необходимо рассчитать точное время и место пожаров, затраты на тушение, экономический эффект
Ок, провернули фокус из финала The Incredible Burt Wonderstone и прошли дальше
3. Prototype Development
Сделали пожарную машину на деньги, выделенные на этапе 2.
Машиной сложно назвать — поэтому скорее получилась пожарная тачка.
Комитет отправил нас на Technical Pivot, без доп финансирования конечно же
На остатки финансирования получилось сделать лейку-поливалку
А дальше пришла летняя жара , и пол-города сгорело вместе с продуктовым комитетом 😂😂😂
PS: для тех кто не в курсе — частная пожарная охрана есть и вполне благополучно работает (например) и в нашей стране и в других
PPS: у любого инструмента есть своя область применения, даже у продуктовых методичек, и вот уж методички неплохо бы начинать с описания к чему их следует применять
🔥19😁9❤5👍3🤯1💯1
https://vlmsarebiased.github.io/
Проблемы нейросеток со счетом это такой же мем как проблемы с количеством пальцев сколько-то поколений сеток назад. Однако сейчас в стандартных задачах сетки на ряд "счетных" вопросов отвечать все же могут. В примерах показано, насколько сильно эти ответы могут быть обоснованы априорным знанием из обучающей выборки, а не самим изображением.
Для оценки этого тестировали вопросы в духе "сколько ног у животного" на картинках с дорисованной лишней ногой или "сколько шахматных фигур на доске" на изображении без одной фигуры. Нейросеть отвечает то же, что и человек при очень беглом взгляде - не то что видит, а то, что знает про животное, про число шахматных фигур и т.д. Объект на изображении действительно идентифицируется, но ответы на счетные вопросы даются уже из общих знаний.
На всякий случай, если кто-то, посмотрев иллюстрацию, уже побежал искать супер-нейросетку GT: это Ground Truth 😁
Проблемы нейросеток со счетом это такой же мем как проблемы с количеством пальцев сколько-то поколений сеток назад. Однако сейчас в стандартных задачах сетки на ряд "счетных" вопросов отвечать все же могут. В примерах показано, насколько сильно эти ответы могут быть обоснованы априорным знанием из обучающей выборки, а не самим изображением.
Для оценки этого тестировали вопросы в духе "сколько ног у животного" на картинках с дорисованной лишней ногой или "сколько шахматных фигур на доске" на изображении без одной фигуры. Нейросеть отвечает то же, что и человек при очень беглом взгляде - не то что видит, а то, что знает про животное, про число шахматных фигур и т.д. Объект на изображении действительно идентифицируется, но ответы на счетные вопросы даются уже из общих знаний.
На всякий случай, если кто-то, посмотрев иллюстрацию, уже побежал искать супер-нейросетку GT: это Ground Truth 😁
😁30🔥10❤3👍3
Forwarded from Сметнёв, uForce и рок-н-ролл
— Как узнать, что человек с Физтеха?
— Никак, он сам об этом скажет в первые 5 минут общения 😂
Принял приглашение Даши Гриц стать академическим директором магистратуры Бизнес-школы МФТИ. Моя задача — не просто курировать процесс обучения, а формировать и внедрять целостное видение программы, которая готовит лидеров технологического предпринимательства (как звучит-то, ух!) 😎
Здесь магистратура — больше, чем просто образование. Студенты учатся на практике: дипломная работа — это запуск стартапа в партнёрстве с крупнейшими игроками рынка.
Вот крутые проекты, которые создали студенты в Бизнес-школе:
1. Платформа для автоматической проверки письменной части ЕГЭ с оценкой по критериям. С этим проектом студенты неделю назад выступали в Сбере среди образовательных программ. В итоге, разработка получила самые высокие оценки!
2. Краудлендинговая платформа для прямого онлайн финансирования бизнеса физлицами. Студенты выиграли бизнес-акселератор от ВТБ и уже создали прототип ИИ-платформы.
3. И мой любимый проект: система диспетчеризации БЕЛАЗов для угольных карьеров на базе ИИ. За год команда сэкономила 1,5 млрд для заказчика на настоящем карьере😳
Сейчас в Бизнес-школе идёт конкурс грантов TechLead Battle — это возможность бесплатно учиться на бизнес-программе «Запуск высокотехнологичных продуктов» и начать карьеру в технологическом бизнесе. Ищут самостоятельных, открытых и инициативных ;)
Победители по итогам финального мероприятия получают статус претендентов на грантовую поддержку от Сбера.
Этап I — онлайн-отбор
Приём заявок до 20 июня
Проверка soft skills:
- видео-заявка с рассказом о мотивации и опыте;
- onepager с описанием проекта.
Проверка hard skills:
- решение кейсов и тестов.
Этап II — очный финал: 11 июля
Деловые игры и групповые задания.
Заполняй форму в ТГ боте, чтобы принять участие: https://t.iss.one/bsmipt_bot
ВАЖНО: верхнего порога по возрасту участия в программе нет. Если вы знаете тех, кому нужна глубокая поддержка в запуске своего проекта, - поделитесь с ними ссылкой. Им полезно, а мне приятно 🥳
P.S. В комментариях можете задавать любые вопросы, оч постараюсь на них ответить.
— Никак, он сам об этом скажет в первые 5 минут общения 😂
Принял приглашение Даши Гриц стать академическим директором магистратуры Бизнес-школы МФТИ. Моя задача — не просто курировать процесс обучения, а формировать и внедрять целостное видение программы, которая готовит лидеров технологического предпринимательства (как звучит-то, ух!) 😎
Здесь магистратура — больше, чем просто образование. Студенты учатся на практике: дипломная работа — это запуск стартапа в партнёрстве с крупнейшими игроками рынка.
Вот крутые проекты, которые создали студенты в Бизнес-школе:
1. Платформа для автоматической проверки письменной части ЕГЭ с оценкой по критериям. С этим проектом студенты неделю назад выступали в Сбере среди образовательных программ. В итоге, разработка получила самые высокие оценки!
2. Краудлендинговая платформа для прямого онлайн финансирования бизнеса физлицами. Студенты выиграли бизнес-акселератор от ВТБ и уже создали прототип ИИ-платформы.
3. И мой любимый проект: система диспетчеризации БЕЛАЗов для угольных карьеров на базе ИИ. За год команда сэкономила 1,5 млрд для заказчика на настоящем карьере😳
Сейчас в Бизнес-школе идёт конкурс грантов TechLead Battle — это возможность бесплатно учиться на бизнес-программе «Запуск высокотехнологичных продуктов» и начать карьеру в технологическом бизнесе. Ищут самостоятельных, открытых и инициативных ;)
Победители по итогам финального мероприятия получают статус претендентов на грантовую поддержку от Сбера.
Этап I — онлайн-отбор
Приём заявок до 20 июня
Проверка soft skills:
- видео-заявка с рассказом о мотивации и опыте;
- onepager с описанием проекта.
Проверка hard skills:
- решение кейсов и тестов.
Этап II — очный финал: 11 июля
Деловые игры и групповые задания.
Заполняй форму в ТГ боте, чтобы принять участие: https://t.iss.one/bsmipt_bot
ВАЖНО: верхнего порога по возрасту участия в программе нет. Если вы знаете тех, кому нужна глубокая поддержка в запуске своего проекта, - поделитесь с ними ссылкой. Им полезно, а мне приятно 🥳
P.S. В комментариях можете задавать любые вопросы, оч постараюсь на них ответить.
😁19👍16❤8
У Vert Dider вышел ролик о самой красивой (на мой взгляд) теореме из физики 20-го века - теореме Эмми Нётер. Это удивительно простой рассказ о довольно сложной идее. Очень рекомендую всем, кто с любовью и трепетом относится к математике ❤️🔥
YouTube
Энергия не сохраняется [Veritasium]
По вопросам рекламы: [email protected]
Поддержать проект можно по ссылкам:
Если вы в России: https://boosty.to/vertdider
Если вы не в России: https://www.patreon.com/VertDider
Почему в общей теории относительности не работает закон сохранения…
Поддержать проект можно по ссылкам:
Если вы в России: https://boosty.to/vertdider
Если вы не в России: https://www.patreon.com/VertDider
Почему в общей теории относительности не работает закон сохранения…
👍34🔥12❤🔥11❤3
Anonymous Poll
23%
Преподавание AI: как за 15-20 лет менялся подход к этому процессу и что вижу сейчас
14%
Олимпиады школьников по ИИ: что сейчас происходит со всероссом и межнаром, и что будет дальше
32%
Как мы прошли путь от обычной статистики до ChatGPT: понятно об эволюции того что под капотом
19%
Как работают текстовые и картиночные Gen AI модели простыми словами
35%
Как устроено внедрение и эволюция AI & Big Data в больших компаниях и какие там сложности и развилки
67%
Темная сторона построения карьеры: с кем пить пиво, чтобы вас повысили
47%
Какие хардовые знания не из AI помогают техническому специалисту быстрее преуспеть в AI
1%
Свой вариант в комментариях
2😁9🔥8❤2🍾1
Если вы тоже уже проснулись и хотите что-нибудь послушать на фоне, у нас на ютьюб канале вышло новое интервью: https://www.youtube.com/watch?v=LIy1V2h8oZI
Существует два диаметрально противоположных подхода к карьере: есть люди, которые 5, 10, 15 лет сидят на одном месте, пока всех не пересидят, и пока их не повысят, а есть люди, которые не успеешь оглянуться, а уже за 5-7 лет пробежались по всем ступенькам до топа или СЕО, а может уже и в своей бизнес ушли и там чувствуют себя отлично. Смотришь на таких быстрых и думаешь: в чем секрет? Один из таких не сидящих на месте людей - Таня Савельева, многим в AI известная по каналу @tldr_tany , и именно её я предлагаю вам послушать :)
Существует два диаметрально противоположных подхода к карьере: есть люди, которые 5, 10, 15 лет сидят на одном месте, пока всех не пересидят, и пока их не повысят, а есть люди, которые не успеешь оглянуться, а уже за 5-7 лет пробежались по всем ступенькам до топа или СЕО, а может уже и в своей бизнес ушли и там чувствуют себя отлично. Смотришь на таких быстрых и думаешь: в чем секрет? Один из таких не сидящих на месте людей - Таня Савельева, многим в AI известная по каналу @tldr_tany , и именно её я предлагаю вам послушать :)
YouTube
От разработчика до CEO AI-проекта | Татьяна Савельева
Татьяна Савельева — лидер рейтинга Forbes «30 до 30» в категории «Наука и технологии» (2022), предприниматель сервисов InfluAI и Flatsharing community и экс-CEO Yandex SupportAI ex cofounding CEO EVA AI.
В интервью Татьяна рассказывает о своем карьерном пути…
В интервью Татьяна рассказывает о своем карьерном пути…
🔥15🙏6👎1
Forwarded from MLinside - школа ML
Media is too big
VIEW IN TELEGRAM
На YouTube-канале MLinside вышло интервью с Татьяной Савельевой — лидером рейтинга Forbes «30 до 30» в категории «Наука и технологии» (2022), предпринимателем, создателем сервисов InfluAI и Flatsharing community, экс-CEO Yandex SupportAI и соосновательницей EVA AI.
Обсудили:
🔹Карьерный путь от МФТИ до работы в Сбере, Яндексе и стартапах
🔹Как осознать, что готов(а) к предпринимательству — и запустить свой продукт
🔹Что на самом деле делает CEO в крупной технологической компании
🔹Как трижды стать CEO до 30 лет и при этом справляться с синдромом самозванца
🔹 Советы начинающим в AI: как расти, не бояться перемен и добиваться повышения
Откровенный и вдохновляющий разговор о росте, выборе пути, стартапах и технологиях. Обязательно к просмотру всем, кто хочет расти в ML/AI и строить свой бизнес.
Обсудили:
🔹Карьерный путь от МФТИ до работы в Сбере, Яндексе и стартапах
🔹Как осознать, что готов(а) к предпринимательству — и запустить свой продукт
🔹Что на самом деле делает CEO в крупной технологической компании
🔹Как трижды стать CEO до 30 лет и при этом справляться с синдромом самозванца
🔹 Советы начинающим в AI: как расти, не бояться перемен и добиваться повышения
Откровенный и вдохновляющий разговор о росте, выборе пути, стартапах и технологиях. Обязательно к просмотру всем, кто хочет расти в ML/AI и строить свой бизнес.
❤22🔥15👎7
Время выглянуть за рамки мониторов и взять в руки удочку
Сделайте паузу от тасков и митов на летнем IT-фестивале от Selectel против выгорания!
🗓 27 июля
📍 Флагшток, Санкт-Петербург или онлайн
В программе:
- доклады и воркшопы о том, как встроить отдых в свой плотный график,
- жизненные выступления на IT-стендапе,
- возможность попробовать разные активности, чтобы найти новое хобби: скалолазание, бокс, кастом вещей, рыбалка
Участие бесплатное, нужно просто зарегистрироваться: https://slc.tl/11bkc
А чтобы посмотреть полную программу, заглянуть за кулисы подготовки и поучаствовать в розыгрыше лимитированного тирекса, подписывайтесь на @Selectel_Events
Сделайте паузу от тасков и митов на летнем IT-фестивале от Selectel против выгорания!
🗓 27 июля
📍 Флагшток, Санкт-Петербург или онлайн
В программе:
- доклады и воркшопы о том, как встроить отдых в свой плотный график,
- жизненные выступления на IT-стендапе,
- возможность попробовать разные активности, чтобы найти новое хобби: скалолазание, бокс, кастом вещей, рыбалка
Участие бесплатное, нужно просто зарегистрироваться: https://slc.tl/11bkc
А чтобы посмотреть полную программу, заглянуть за кулисы подготовки и поучаствовать в розыгрыше лимитированного тирекса, подписывайтесь на @Selectel_Events
💩9👍7❤3👎3🔥3
Вопрос к тем, кто нанимает дата саентистов:
1. К вам на собеседование пришел человек без опыта работы в DS, что будете спрашивать?
2. Тот же вопрос про человека с опытом работы в DS
Во всех случаях речь не про синьорскую вакансию, а про рядового работягу.
Пишите в комментариях свои ответы, потом устроим голосование
1. К вам на собеседование пришел человек без опыта работы в DS, что будете спрашивать?
2. Тот же вопрос про человека с опытом работы в DS
Во всех случаях речь не про синьорскую вакансию, а про рядового работягу.
Пишите в комментариях свои ответы, потом устроим голосование
🔥15❤6
Никита тут опять выдал базу, как всегда с огоньком :) Подтверждаю, что ровно так и устроена работа в компаниях, причем тупо во всех поголовно без исключений. От студенческого стартапа до fortune500, причем не только между коллегами, но и в ролях исполнитель-подрядчик и в партнерских проектах. И конечно же к этому добавляются постоянные обвинения в неэффективности.
Например, был в одном месте товарищ, который больше всех обвинял моих ребят в том, что на работу потратили кучу денег и мало что сделали. Куча денег в том случае были 2 миллиона, мало что - прототип, который работал корректно, но не на том принципе, который чел хотел видеть внутри как большой знаток AI. На словах товарищ раздувал траты до 30 млн. Недавно же услышал байку, как его команда навыдавала промо-скидок на лярд и забыла их отключить.
История про «мы вам дадим показать эффект на задаче, где три копейки, а сами будем делать там, где лярд» тоже классика, когда внедряешь AI в чей-то процесс или когда кто-то пришел внедрять первым.
Еще есть другой распространенный корпоративный ритуал: принять какие-то решения про чужую задачу и чужую область ответственности без собственно человека, который за это отвечает. Это тоже прям классика-классика, так что нужно уметь вовремя оказаться на том совещании, куда вас не звали, и насовать аргументов против. Или наоборот сознательно не пойти на такую встречу, чтобы слить агрессору тухлую задачу😁
Надо ли удивляться, как же все стремно в компаниях организовано? Да конечно нет. Все перечисленное - свойство людей и их поведения в принципе, а в компаниях обычно работает более одного человека, вот и начинается неизбежное безобразие.
Например, был в одном месте товарищ, который больше всех обвинял моих ребят в том, что на работу потратили кучу денег и мало что сделали. Куча денег в том случае были 2 миллиона, мало что - прототип, который работал корректно, но не на том принципе, который чел хотел видеть внутри как большой знаток AI. На словах товарищ раздувал траты до 30 млн. Недавно же услышал байку, как его команда навыдавала промо-скидок на лярд и забыла их отключить.
История про «мы вам дадим показать эффект на задаче, где три копейки, а сами будем делать там, где лярд» тоже классика, когда внедряешь AI в чей-то процесс или когда кто-то пришел внедрять первым.
Еще есть другой распространенный корпоративный ритуал: принять какие-то решения про чужую задачу и чужую область ответственности без собственно человека, который за это отвечает. Это тоже прям классика-классика, так что нужно уметь вовремя оказаться на том совещании, куда вас не звали, и насовать аргументов против. Или наоборот сознательно не пойти на такую встречу, чтобы слить агрессору тухлую задачу😁
Надо ли удивляться, как же все стремно в компаниях организовано? Да конечно нет. Все перечисленное - свойство людей и их поведения в принципе, а в компаниях обычно работает более одного человека, вот и начинается неизбежное безобразие.
🔥12😁9❤5
Forwarded from Дата канальи — про «специалистов» в данных / ML / AI
Про внутреннюю конкуренцию пост
Иногда канальи развлекаются тем что одну и ту же задачу решают 2 команды из разных бизнес-вертикалей — ну-ка посоревнуйтесь, и в результате конкурса поймем ктокруче хитрее
Но есть нюанс, канал же про каналий 🤡
В одной далекой-далекой компании стояла задача по фото товара (которое делает сотрудник склада) определять номенклатуру.
Делалось это так:
1) на фото детектилась этикетка
2) OCR (а судя по тому что в 2025 выходят статьи про альтернативы Tesseract — побить его по сочетанию бесплатность-производительность-качество все же сложно)
3) матчинг изображения и текста на каталог
Никаких Visual Transformers, сложных моделей — но работает, качество хорошее, ну и ладно. Назовем эту команду П (первая, без отсылок к Пелевину или нездоровых корпоративных ассоциаций)
Но в недрах бизнес-вертикалей всегда находятся люди, которые прослышав про зп в ML внезапно вспоминают что кончали КБГТУ (как бы где-то там учился) по специальности «подставка арифмометра» -- она же связана с математикой, верно?, назовем эту команду С (самозванцы 😄). Как в корпорациях доказывают свою ценность? Два варианта — делать что-то полезное (редко) либо объявив коллег дураками (часто). Здесь же сходу не прокатило -- биг босс сказал «а докажите».
Не мудрствуя лукаво вторая команда стала отправлять запросы в gpt 4o и намеряла в офлайне точность в 85%+. Первая команда закономерно на разборе получила люлей 🤕 (потому как текущее решение было в районе 80%) и отправилась готовиться ко второму периоду.
Покрутили-поучили, добили до 90%, и вот уже во втором периоде гнев босса обрушился на команду самозванцев. Что было дальше?
Следите заруками словами лидера самозванцев:
1) Уважаемый Иван Иванович, А/Б провести не можем (да и зачем компании терять деньги тратясь на заведомо проигрышный вариант), давайте сравниваться оффлайн
2) Тестовую выборку разделим на 2 — по одной прогоним одну модель, по второй другую (ловкость рук)
3) Этот тяжкий труд по сплиту теста берем на себя, заодно и результат посчитаем 🤣🤣🤣👏
По итогам следующего теста у команды С точность 99%, у команды П — в районе 20%. Счет на табло стал уж совсем разгромный 😰
Вот сейчас не стоит сразу кликать на спойлер, не лишайте себя удовольствия подумать что могло пойти не так 🤔🤫
Парням из первой команды подсунули фото, где либо товара либо этикетки в кадре не было.
Мораль истории как в избиркоме — не важно как работает ваше решение, важно кто считает результат.
А вообще если вы видите 8 команд в компании, которые занимаются одним и тем же — я бы советовал выбрать либо другое направление либо другую компанию.
Иногда канальи развлекаются тем что одну и ту же задачу решают 2 команды из разных бизнес-вертикалей — ну-ка посоревнуйтесь, и в результате конкурса поймем кто
Но есть нюанс, канал же про каналий 🤡
В одной далекой-далекой компании стояла задача по фото товара (которое делает сотрудник склада) определять номенклатуру.
Делалось это так:
1) на фото детектилась этикетка
2) OCR (а судя по тому что в 2025 выходят статьи про альтернативы Tesseract — побить его по сочетанию бесплатность-производительность-качество все же сложно)
3) матчинг изображения и текста на каталог
Никаких Visual Transformers, сложных моделей — но работает, качество хорошее, ну и ладно. Назовем эту команду П (первая, без отсылок к Пелевину или нездоровых корпоративных ассоциаций)
Но в недрах бизнес-вертикалей всегда находятся люди, которые прослышав про зп в ML внезапно вспоминают что кончали КБГТУ (как бы где-то там учился) по специальности «подставка арифмометра» -- она же связана с математикой, верно?, назовем эту команду С (самозванцы 😄). Как в корпорациях доказывают свою ценность? Два варианта — делать что-то полезное (редко) либо объявив коллег дураками (часто). Здесь же сходу не прокатило -- биг босс сказал «а докажите».
Не мудрствуя лукаво вторая команда стала отправлять запросы в gpt 4o и намеряла в офлайне точность в 85%+. Первая команда закономерно на разборе получила люлей 🤕 (потому как текущее решение было в районе 80%) и отправилась готовиться ко второму периоду.
Покрутили-поучили, добили до 90%, и вот уже во втором периоде гнев босса обрушился на команду самозванцев. Что было дальше?
Следите за
1) Уважаемый Иван Иванович, А/Б провести не можем (да и зачем компании терять деньги тратясь на заведомо проигрышный вариант), давайте сравниваться оффлайн
2) Тестовую выборку разделим на 2 — по одной прогоним одну модель, по второй другую (ловкость рук)
3) Этот тяжкий труд по сплиту теста берем на себя, заодно и результат посчитаем 🤣🤣🤣👏
По итогам следующего теста у команды С точность 99%, у команды П — в районе 20%. Счет на табло стал уж совсем разгромный 😰
Вот сейчас не стоит сразу кликать на спойлер, не лишайте себя удовольствия подумать что могло пойти не так 🤔🤫
Мораль истории как в избиркоме — не важно как работает ваше решение, важно кто считает результат.
А вообще если вы видите 8 команд в компании, которые занимаются одним и тем же — я бы советовал выбрать либо другое направление либо другую компанию.
1🎉25❤1
Forwarded from Дата канальи — про «специалистов» в данных / ML / AI
В продолжение предыдущей истории — у тимлида первой команды были все основания ждать подвоха, ведь тимлид второй разошелся на цитаты:
по факту -- one-hot на всем что было 🤦♂️
🤦♂️
😁
👏🙌
👏
🤦♂️
🤦♂️
Возможный эффект задачи 1 - три копейки
Возможные эффект управления промо - сотни миллионов 😆💡
🤔
мы сделали прогнозную модель с точностью 75% которая достигается тем что модель анализирует 800+ признаков
по факту -- one-hot на всем что было 🤦♂️
а вообще усреднять тема вот у нас в прогнозной модели 36 бустингов и точность высокая поэтому
🤦♂️
а зачем ты разбиваешь на train val test по времени? Можно же рандомно
😁
-обучать llm через lora неправильно
-а как правильно?
- ну там данных много надо, а вот мы сделали ии агента с рагом
👏🙌
построение эмбеддингов через tf-idf не является интеллектуальным анализом данных
👏
tf-idf - это не эмбеддинги это численное представление
🤦♂️
tf-idf - это низкоуровневные эмбеддинги
🤦♂️
Ну мы твой проект для задачи 1 внедрим, а для управления промо как пойдет
Возможный эффект задачи 1 - три копейки
Возможные эффект управления промо - сотни миллионов 😆💡
а зачем ты логарифмируешь цену? так хуже качество будет
🤔
😁12🔥11❤6