Время Валеры
Запись стрима
До чего меня довел Игорь. Позвали судить хакатон по вайб-кодингу!
2😁276🔥29🤣24🤮8🙉5👍3👏3😱2🥴2❤1
Не прошло и года с момента покупки 4-й версии мегапростыни, как вышла 5-я.
Новая версия, помимо простыни, теперь включает мегаодеяло (греет/холодит), генератор «правильного» шума, специальную базу под матрас, снимающую напряжение со спины и борющуюся с храпом, а также новые датчики для отслеживания здоровья.
Непростая дилемма конечно, брать или нет
https://www.eightsleep.com/uk/product/pod-cover/
Новая версия, помимо простыни, теперь включает мегаодеяло (греет/холодит), генератор «правильного» шума, специальную базу под матрас, снимающую напряжение со спины и борющуюся с храпом, а также новые датчики для отслеживания здоровья.
Непростая дилемма конечно, брать или нет
https://www.eightsleep.com/uk/product/pod-cover/
😁138💅40❤28🔥13👍6😱4💩3🤡3👎1🤔1
Искренне рекомендую прочитать про stage gate для AI проектов
https://t.iss.one/c3po_notes/317
Давал как пример студентам в рамках курса по МЛ Систем Дизайну
https://t.iss.one/c3po_notes/317
Давал как пример студентам в рамках курса по МЛ Систем Дизайну
Telegram
Записки C3PO
Привет, я Адам 👋
Пару месяцев назад я вышел в AI-центр Т-Банка продуктовым директором развивать пользовательские продукты. В этом посте расскажу, в чем ключевые отличия разработки AI-продуктов от традиционных, и как мы адаптировали классический Stage-Gate…
Пару месяцев назад я вышел в AI-центр Т-Банка продуктовым директором развивать пользовательские продукты. В этом посте расскажу, в чем ключевые отличия разработки AI-продуктов от традиционных, и как мы адаптировали классический Stage-Gate…
👍44❤11🔥8🤡3😁1
Удивился второй раз в жизни при работе над инфрой. Первый раз был, когда переезд с Postgres на BigQuery в Blockchain com ускорил (на самом деле!) запросы в 100 раз и снизил стоимость в 10.
Тестировали Iceberg поверх Parquet
AWS Glue + Iceberg: стоимость ↓2.3x, скорость ↑3x
AWS EMR Serverless + Iceberg: стоимость ↓31x, скорость ↑6x
Databricks Serverless on Delta Lake: стоимость ↓3.5x, скорость ↑12x
Полез разбираться, как алгоритмически работает Iceberg поверх Parquet, и в очередной раз убедился, как же приятно читать/смотреть такие инженерные вещи, когда ребята садятся решать человеческие проблемы и находят простые решения.
Умные метаданные: знает статистики каждого файла без его чтения
Убирает дорогие LIST операции в S3 (экономия I/O)
Predicate pushdown: исключает файлы еще на этапе планирования
Hidden partitioning: автоматически находит нужные данные по любым колонкам ( У паркета тоже есть, но не так хорошо)
Snapshot isolation: читает консистентное состояние без блокировок
Главное - важность проверки разных платформ под конкретные бенчмарки. То, что работает для одного типа нагрузок, может быть неоптимально для другого.
P.S. Databricks показал отличные результаты с Delta Lake, но это уже другая история
Тестировали Iceberg поверх Parquet
AWS Glue + Iceberg: стоимость ↓2.3x, скорость ↑3x
AWS EMR Serverless + Iceberg: стоимость ↓31x, скорость ↑6x
Databricks Serverless on Delta Lake: стоимость ↓3.5x, скорость ↑12x
Полез разбираться, как алгоритмически работает Iceberg поверх Parquet, и в очередной раз убедился, как же приятно читать/смотреть такие инженерные вещи, когда ребята садятся решать человеческие проблемы и находят простые решения.
Умные метаданные: знает статистики каждого файла без его чтения
Убирает дорогие LIST операции в S3 (экономия I/O)
Predicate pushdown: исключает файлы еще на этапе планирования
Hidden partitioning: автоматически находит нужные данные по любым колонкам ( У паркета тоже есть, но не так хорошо)
Snapshot isolation: читает консистентное состояние без блокировок
Главное - важность проверки разных платформ под конкретные бенчмарки. То, что работает для одного типа нагрузок, может быть неоптимально для другого.
P.S. Databricks показал отличные результаты с Delta Lake, но это уже другая история
6🔥235❤38👍26💯12🕊1🤡1
Ходил по краю два года назад. Одним из вариантов работы в 2023 был VP of AI в buidr
Ранний аналог lovable
Ранний аналог lovable
Ft
Microsoft-backed UK tech unicorn Builder.ai collapses into insolvency
Once high-flying group founded by Sachin Dev Duggal says its was unable to recover from ‘past decisions’
❤28🙏20😨9👍1
Анонимусы (без шуток, так и написано в статье) из неуказанной компании (но дальше честно говорится, что это Яндекс) выпустили статью — Yambda-5B: A Large-Scale Multi-modal Dataset for Ranking and Retrieval.
Собирать и раздавать датасеты — дело богоугодное. Помню, как Женя Макаров на Датафесте в 2018 году ходил и фотографировал эмоции людей, чтобы собрать уникальный датасет (Женя, где датасеты!). А тут сразу:
1 миллион пользователей,
9.39 миллиона треков,
4.78 миллиарда взаимодействий из Яндекс Музыки.
Для каждого трека прилагается эмбеддинг, полученный свёрточной сетью по спектрограмме. Почему не Vision Transformer — вопрос интересный, но идея понятна.
По типу фидбэка:
– Implicit — прослушивания
– Explicit — лайки и прочие действия
Из уникальных штук — флаг is_organic. У каждого события указано, было ли оно органическим или вызвано рекомендацией. Это редкость: можно отдельно изучать, как алгоритмы влияют на поведение и как выглядит "чистое" прослушивание.
Датасет выдают в Parquet (но без Iceberg, увы) — что уже хорошо.
И ещё одна редкость — реалистичная схема сплита (Где то радуется один Information Retrieval) :
• Train — 300 дней
• Gap — 30 минут
• Test — 1 день
Сначала делают Global Temporal Split по таймстемпам, но корректируют его, чтобы в тесте были только те пользователи, что есть в трейне — ближе к продакшену.
В общем, выглядит мощно. Ждём, когда Саша Петров наложит на это свои руки.
Перезалил, с ссылкой на датасет
Собирать и раздавать датасеты — дело богоугодное. Помню, как Женя Макаров на Датафесте в 2018 году ходил и фотографировал эмоции людей, чтобы собрать уникальный датасет (Женя, где датасеты!). А тут сразу:
1 миллион пользователей,
9.39 миллиона треков,
4.78 миллиарда взаимодействий из Яндекс Музыки.
Для каждого трека прилагается эмбеддинг, полученный свёрточной сетью по спектрограмме. Почему не Vision Transformer — вопрос интересный, но идея понятна.
По типу фидбэка:
– Implicit — прослушивания
– Explicit — лайки и прочие действия
Из уникальных штук — флаг is_organic. У каждого события указано, было ли оно органическим или вызвано рекомендацией. Это редкость: можно отдельно изучать, как алгоритмы влияют на поведение и как выглядит "чистое" прослушивание.
Датасет выдают в Parquet (но без Iceberg, увы) — что уже хорошо.
И ещё одна редкость — реалистичная схема сплита (Где то радуется один Information Retrieval) :
• Train — 300 дней
• Gap — 30 минут
• Test — 1 день
Сначала делают Global Temporal Split по таймстемпам, но корректируют его, чтобы в тесте были только те пользователи, что есть в трейне — ближе к продакшену.
В общем, выглядит мощно. Ждём, когда Саша Петров наложит на это свои руки.
Перезалил, с ссылкой на датасет
🔥134👍28❤21🤣4💩3
Появилась первая часть моего разговора с Виктором Кантором
5🔥165❤43👍30🤩10🤡9💅7💩3
Будущее наступило. 2025 Ark's Big Ideas на 140+ страниц
AI Agents – the new UX layer
Bitcoin – maturing macro asset (Привет Игорю)
Stablecoins – the dollar’s stealth rails (а ведь и правда!)
Scaling Blockchains – cheaper smart-contracts
Robotaxis – autonomy’s first consumer win
Autonomous Logistics – drones, bots & driver-out trucks
Robotics – from washing machines to humanoids
Energy – powering the AI century
Reusable Rockets & Hypersonic Flight
Multiomics – data-driven biology
The thread that ties it all together - Neural networks are the prime catalyst: ARK maps them as the only technology that lifts six others by ≥ 10× value, so every other platform’s upside is keyed to continued gains in AI compute and architecture .
pdf в комментах
AI Agents – the new UX layer
Bitcoin – maturing macro asset (Привет Игорю)
Stablecoins – the dollar’s stealth rails (а ведь и правда!)
Scaling Blockchains – cheaper smart-contracts
Robotaxis – autonomy’s first consumer win
Autonomous Logistics – drones, bots & driver-out trucks
Robotics – from washing machines to humanoids
Energy – powering the AI century
Reusable Rockets & Hypersonic Flight
Multiomics – data-driven biology
The thread that ties it all together - Neural networks are the prime catalyst: ARK maps them as the only technology that lifts six others by ≥ 10× value, so every other platform’s upside is keyed to continued gains in AI compute and architecture .
pdf в комментах
👍61❤22🤔14💊9🔥8🥴2😨1
Появилась вторая часть моего разговора с Виктором Кантором
YouTube
"Никогда на Руси джуны хорошо не жили" | Валерий Бабушкин 2 часть
Валерий Бабушкин — один из ведущих экспертов в области машинного обучения, Senior Director по Data & AI в BP (British Petroleum), Kaggle Competitions Grandmaster, автор книги Machine Learning System Design. Валерий возглавлял направление машинного обучения…
23🔥136👍20❤13😱12👎5🤡4💩2
После запрета со стороны Игоря писать Тагиру комментарии от лица своего канала в моем канале, я решил помочь, конечно же, себе! Заодно им и еще паре ребят. Собрали папку.
В папке — каналы инженеров и специалистов по ML и Data Science, которые стоит читать
Вся папка тут: https://t.iss.one/addlist/Hy-LPGleDlY4MGRi
Жду Тагира в первом комментарии!
В папке — каналы инженеров и специалистов по ML и Data Science, которые стоит читать
Вся папка тут: https://t.iss.one/addlist/Hy-LPGleDlY4MGRi
Жду Тагира в первом комментарии!
👍60😁30🤮17🔥14👎9❤7🍌5🤯2🙉2🍓1
Первый запуск курса по ML-систем дизайну оказался успешным, если верить отзывам и моим впечатлениям (правда он ещё не закончился)
Пока у меня есть силы, я планирую провести ещё один . Сейчас есть примерно 25 заявок от тех, кого мы не приняли в первый раз, поэтому примерно ещё 25 человек готовы принять сверху
Курс проходит вживую, по выходным, по 2 часа два раза в неделю в течение 3 месяцев.
Запись здесь
Пока у меня есть силы, я планирую провести ещё один . Сейчас есть примерно 25 заявок от тех, кого мы не приняли в первый раз, поэтому примерно ещё 25 человек готовы принять сверху
Курс проходит вживую, по выходным, по 2 часа два раза в неделю в течение 3 месяцев.
Запись здесь
❤96👎22👌8🎉5👍3🔥3
Хороший пост от фаундера и СЕО Klarna. Во-первых, признали, что не удалось им заменить весь саппорт на агентов и откатились частично обратно, что имеет смысл, но более интересно про организационную структуру.
А именно, правильная организационная структура приводит к тому, что команде требуется минимальное количество согласований.
Это, кстати, полностью соответствует моей собственной модели руководителя как точки решения эскалацииюй, и, соответственно, общий руководитель должен находиться как можно ближе к местами их возникновения , пока их можно решить малой кровью.
А именно, правильная организационная структура приводит к тому, что команде требуется минимальное количество согласований.
Это, кстати, полностью соответствует моей собственной модели руководителя как точки решения эскалацииюй, и, соответственно, общий руководитель должен находиться как можно ближе к местами их возникновения , пока их можно решить малой кровью.
What makes an insight "Actionable" at Klarna?
Clear visuals/screenshots, specific problem definition, suggested fix, simple financial impact estimation, effort needed, and clear ownership.
The actionable insights coming out of this blew us away. Many were million dollar opportunities that required days of work. But had been overseen due to lack of clarity of ownership, "nobody thought of them" and so forth. Fix things on website, fix some copy etc
Some were more complex and harder to fix. As we expanded our datamodel for actionable insight we started listing number of teams necessary to resolve tickets. And this has now started guiding us on organization structure and system structure. If a simple fix requires too many...
teams OR requires sign off from too many places that is a bad sign in of itself.
1❤71👍19🔥13💯2🥰1
Интересный пример аналитики сигналов второго рода
Pentagon Pizza Report
Например, вчера, перед ударами Израиля по Ирану, о которых, вроде как, никто не знал, заказали аномально большое количество пиццы.
Pentagon Pizza Report
The Pentagon Pizza Index has been a surprisingly reliable predictor of seismic global events—from coups to wars—since the 1980s. On the night of August 1st 1990 for example, the CIA ordered 21 pizzas in a single night just before the Iraqi invasion of Kuwait (a new record). Who says pie charts aren't useful?
Например, вчера, перед ударами Израиля по Ирану, о которых, вроде как, никто не знал, заказали аномально большое количество пиццы.
🤯137❤43😁24🔥15✍9👍4😢3🌚3💯2😐2💘2
Время Валеры pinned «Оглавление С приходом новых людей в канал, пришла пора разместить нечто вроде путеводителя Остается вопрос, как его сделать доступным всем, ведь несмотря на то, что в описании канала указано что я работаю в blockchain.com - в комментариях писали, Валерий…»
Просто история про человека, который из-за проблем с наркотиками наломал дров и сел в тюрьму. Там он научился кодить и нашёл удалённую работу по разработке новой базы данных.
turso.tech
Working on databases from prison: How I got here, part 2.
👀120🔥42💊33❤17😁17👍10🍌4🦄4🌭2🆒2🍓1
Семь лет назад я пришел в Х5, посмотрел на результаты оценки различных инициатив и понял, что нужно это срочно менять. Срочно заняло примерно два года, когда со стороны СЕО, CFO, CTO, меня и еще ряда людей был подписан обязательный регламент прохождения всех инвест инициатив через команду Саши Сахнова, которая в тот момент уже была человек в 50 и из которой выделялась уже даже не команда, но платформа А/Б тестирования.
Еще пять лет спустя, корректность и полное соответствие Платформы А/В тестирования современным научным практикам подтвердили эксперты Международной лаборатории стохастических алгоритмов и анализа многомерных данных факультета компьютерных наук НИУ ВШЭ.
Что это за платформа, которую X5 строил все эти годы?
Инструмент, который позволяет бизнесу принимать решения не на основе интуиции, а на основе реальных данных. За это время через платформу прошло более 500 экспериментов. Она может быстро и точно оценить эффект от чего угодно: внедрения новой технологии, изменения бизнес-процессов в магазинах, запуска маркетинговой акции или ротации поставщиков.
Принцип классический: сравниваем две группы магазинов – в одной изменения внедряем (тестовая), в другой оставляем всё как есть (контрольная). Это позволяет с высокой точностью оценивать влияние на ключевые финансовые метрики: РТО, средний чек, фронт-маржу, списания и многое другое. Но поверх этого куча методов повышения чувствительности, матчинга, синтетического контроля и тп
Сейчас у платформы два ключевых сервиса:
Дизайн эксперимента: помогает бизнесу правильно спланировать тест еще на старте.
Оценка эксперимента: анализирует результаты и выдает вердикт об эффективности инициативы.
Есть как полностью автоматический режим для стандартных задач, так и возможность тонкой настройки с аналитиком, когда нужно учесть специфику конкретной бизнес-инициативы или исключить из расчетов определенные магазины.
Путь от «ребята, так делать нельзя» до научно верифицированной платформы, которой пользуется весь бизнес, занял семь лет. Это огромная работа и большая гордость. И главное – это пример того, как data-driven подход из модной фразы превращается в обязательный и фундаментальный инструмент для принятия решений в одной из крупнейших компаний страны.
Еще пять лет спустя, корректность и полное соответствие Платформы А/В тестирования современным научным практикам подтвердили эксперты Международной лаборатории стохастических алгоритмов и анализа многомерных данных факультета компьютерных наук НИУ ВШЭ.
Что это за платформа, которую X5 строил все эти годы?
Инструмент, который позволяет бизнесу принимать решения не на основе интуиции, а на основе реальных данных. За это время через платформу прошло более 500 экспериментов. Она может быстро и точно оценить эффект от чего угодно: внедрения новой технологии, изменения бизнес-процессов в магазинах, запуска маркетинговой акции или ротации поставщиков.
Принцип классический: сравниваем две группы магазинов – в одной изменения внедряем (тестовая), в другой оставляем всё как есть (контрольная). Это позволяет с высокой точностью оценивать влияние на ключевые финансовые метрики: РТО, средний чек, фронт-маржу, списания и многое другое. Но поверх этого куча методов повышения чувствительности, матчинга, синтетического контроля и тп
Сейчас у платформы два ключевых сервиса:
Дизайн эксперимента: помогает бизнесу правильно спланировать тест еще на старте.
Оценка эксперимента: анализирует результаты и выдает вердикт об эффективности инициативы.
Есть как полностью автоматический режим для стандартных задач, так и возможность тонкой настройки с аналитиком, когда нужно учесть специфику конкретной бизнес-инициативы или исключить из расчетов определенные магазины.
Путь от «ребята, так делать нельзя» до научно верифицированной платформы, которой пользуется весь бизнес, занял семь лет. Это огромная работа и большая гордость. И главное – это пример того, как data-driven подход из модной фразы превращается в обязательный и фундаментальный инструмент для принятия решений в одной из крупнейших компаний страны.
13❤421🔥193👍109🥱18🤮14👏13🥰7✍4👌2🤡1💅1