Заскуль питона (Аналитика данных)
Кто такие синьоры? Те, кто просто получают много денег и сидят, чилят, попивают смузи, сидя на пляже Те, кто долго работают в компании Те, кто (узнаете на вебинаре). Да, я мастер спойлеров 😁 😁 😁 ⌚ В четверг 26 февраля в 19:00 по МСК стану гостем вебинара…
Уже сегодня состоится вебинар в 19:00 про синьорство.
Если вы хотите понимать, куда расти — приходите, будет полезно🥺
Буду рад всех видеть, так как тема актуальная и зачастую непонятно, а что нужно делать, чтобы им стать. Вроде бы кажется, что и делаешь много, закрываешь задачи в срок, находишь импакт на бизнес, но все равно не растешь...
И непонятно — а что вообще нужно, чтобы перейти на следующий уровень?
Сегодня разберём:
🥳 кто такой синьор на самом деле
🥳 какие задачи отличают его от мидла
🥳 какие решения нужно уметь принимать
🥳 сколько это стоит на рынке
Говорим с @roma_protiv_fomo и другими ребятами сегодня.
Если вы в точке "делаю много, но не двигаюсь дальше" — вам точно стоит подключиться.
Если вы хотите понимать, куда расти — приходите, будет полезно
Буду рад всех видеть, так как тема актуальная и зачастую непонятно, а что нужно делать, чтобы им стать. Вроде бы кажется, что и делаешь много, закрываешь задачи в срок, находишь импакт на бизнес, но все равно не растешь...
И непонятно — а что вообще нужно, чтобы перейти на следующий уровень?
Сегодня разберём:
Говорим с @roma_protiv_fomo и другими ребятами сегодня.
Если вы в точке "делаю много, но не двигаюсь дальше" — вам точно стоит подключиться.
Please open Telegram to view this post
VIEW IN TELEGRAM
1🐳14 6 4
Сижу с Obsidian 💎 , закидываю конспект по временным рядам, планирую через какое-то время дропнуть в формате PDF. От базы до более продвинутых методов. Будут формулки, код, простые примеры.
В качестве основы беру лекции, папиры, статьи на хабре, конечно же, с помощью NotebookLM + ChatGPT.
Сделаю ревью конспекта, дополню необходимым и выложу).
Есть ещё идея: выложить всё на сайт в виде графа знаний — чтобы удобно переходить между темами. Потом так же итеративно собрать A/B, ML, Causal Inference и другое.
@zasql_python
В качестве основы беру лекции, папиры, статьи на хабре, конечно же, с помощью NotebookLM + ChatGPT.
Сделаю ревью конспекта, дополню необходимым и выложу).
Есть ещё идея: выложить всё на сайт в виде графа знаний — чтобы удобно переходить между темами. Потом так же итеративно собрать A/B, ML, Causal Inference и другое.
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
2 96❤39👍16🐳9 6
однажды одному сотруднику поручили навайбкодить сервис авторизации для приложения по доставке хорошего настроения в понедельник...
был использован самый продвинутый ии-агент современности, который уступает только лишь Staff инженерам в FAANG.
мне кажется, что получилось неплохо для первого раза. Да, ведь?👨🦳
@zasql_python
был использован самый продвинутый ии-агент современности, который уступает только лишь Staff инженерам в FAANG.
мне кажется, что получилось неплохо для первого раза. Да, ведь?
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
1 75 8 5❤3
Возможно, у вас возникало чувство того, что хочется сделать что-то классное с точки зрения аналитики, но непонятно, с чего начать.
На практике идеи для исследований чаще всего лежат прямо рядом.
1. Посмотреть, что происходит в продукте
Сделали один раз, а дальше просто закрываем задачи в спринте. Хотя именно там часто появляются первые сигналы для исследований.
Об этом я писал здесь
2. Общение с пользователями
Есть ли в компании продуктовые исследователи, которые проводят интервью или опросы?
Через такие исследования часто подсвечиваются точечные проблемы на определенной выборке пользователей.
Это хороший источник гипотез для аналитики, потому что можно:
3. Посмотреть на бенчмарки рынка
Иногда полезно просто понять, как устроены похожие продукты.
Мне в этом хорошо помогает:
Можно задать конкретную сферу и посмотреть:
4. Посмотреть на продуктовый беклог
Все новое — хорошо забытое старое. Или не сделанное... Иногда в беклоге уже лежат идеи, которые когда-то не дошли до реализации ИЛИ были реализованы, но не проанализированы ИЛИ их можно докрутить для отдельного сегмента пользователей
Иногда такой анализ может сам по себе стать полноценным продуктовым ресерчем.
1. Конверсия падает без очевидной причины
2. Метрика растет только в одном сегменте
3. Пользователи используют фичу не так, как ожидалось
4. Retention новой когорты сильно отличается
5. Конкуренты делают иначе
6. В данных появляется аномальный сегмент и др.
Будет также круто, если вы пользуетесь продуктом, который анализируете. Так поймете основные проблемы, ботлнеки и тд. Об этом я писал пост здесь.
А у вас как дела с продуктовыми исследованиями? Делитесь в комментариях!
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳15❤5 4 1
Сегодня знаменательный день
😃 Во-первых, поздравляю всех девушек с 8 марта! Оставайтесь такими же клевыми. Успехов, радости и гармонии 🌷
☺️ Во-вторых, я добавил новую вкладку на сайт — КОНСПЕКТЫ. Теперь там есть теория по временным рядам (пока что только по ним).
В дальнейшем, этот блок будет расширяться (по вашим запросам пойму, что действительно важно).
Из тем были добавлены различные блоки, которые касаются базовой теории:
📈 сезонность, тренд, ACF, декомпозиции, можете потыкаться, найдете для себя что-то интересное.
Самая большая боль была валидировать и заносить LaTeX формулы...
У меня будет еще для вас несколько прикольных штук, которые в ближайшем времени буду анонсировать. Не переключайтесь!
@zasql_python
В дальнейшем, этот блок будет расширяться (по вашим запросам пойму, что действительно важно).
Из тем были добавлены различные блоки, которые касаются базовой теории:
У меня будет еще для вас несколько прикольных штук, которые в ближайшем времени буду анонсировать. Не переключайтесь!
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳46❤32 14🔥6
не, ну а чего расслабились, давайте переходить на другие ИИ.
взять тот же дипсик или гигачат, чем не решение, правда, ведь?
была у меня история, как я попробовал сгенерировать под задачу простенький график, так у меня дипсик 3/3 случаев убивал ядро...
но, ничего и это стерпим, главное поработать, а дальше все будет хорошо
к тому же короткая рабочая неделя...
А если без шуток, что сейчас используете и сколько тратите денег на все ИИ-сервисы? Пишите в комменты
Сам использую Codex, Claude Code, Perplexity, NotebookLM и в скором времени еще возьму себе. Использовал еще Gamma, Figma AI и много других
Если интересна тема вайбкодинга и как я использую инструменты, поставьте
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳111❤11 10 3 2
Сделал свой первый курс по pandas.
Курсов таких очень много, но гештальт определенный для себя закрыл. Смотрел на несколько курсов, которые есть в доступе, проблема в том, что там в формате: "Выбери правильный вариант ответа", а хотелось дропнуть полноценный. КУРС ДЛЯ НОВИЧКОВ👦
Намучился с тестами и составлением заданий, а также с валидацией всего что есть. Ну ничего страшного, все заработало, по крайнем мере я так думаю👦
Из интересного, тесты в pandas делаются неочевидно, поэтому в каждое задание вставляется следующий кусок
Дальше решение пишется после служебного блока как угодно, главное result вывести. И все.
Я еще готовлю несколько курсов, один из которых будет посвящен SQL, другой будет гибридный.
Ах да, ну еще и сайт пилиться продолжает, скоро сделаю анонс
Поддержите реакциями плиз!🐳
@zasql_python
Курсов таких очень много, но гештальт определенный для себя закрыл. Смотрел на несколько курсов, которые есть в доступе, проблема в том, что там в формате: "Выбери правильный вариант ответа", а хотелось дропнуть полноценный. КУРС ДЛЯ НОВИЧКОВ
Намучился с тестами и составлением заданий, а также с валидацией всего что есть. Ну ничего страшного, все заработало, по крайнем мере я так думаю
Из интересного, тесты в pandas делаются неочевидно, поэтому в каждое задание вставляется следующий кусок
import json
import sys
import pandas as pd
raw = sys.stdin.read().strip()
payload = json.loads(raw) if raw else {'df': { ... }}
df = pd.DataFrame(payload.get('df', {}))
# ===== Пиши решение ниже =====
result = ...
print(result)
Дальше решение пишется после служебного блока как угодно, главное result вывести. И все.
Я еще готовлю несколько курсов, один из которых будет посвящен SQL, другой будет гибридный.
Ах да, ну еще и сайт пилиться продолжает, скоро сделаю анонс
Поддержите реакциями плиз!
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
1🐳156🔥71 19 11 5
За последние месяцы я полностью переработал свой тренажёр: переписал интерфейс, пересобрал структуру и улучшил логику использования.
Изначально это был просто набор материалов. Теперь это уже полноценный продукт, которым удобно пользоваться каждый день.
1. Новый UI. Адаптивный интерфейс, одинаково удобный на телефоне и десктопе.
2. Обновлённый хедер и футер для мобильных устройств и планшетов. Навигация стала быстрее и интуитивнее.
3. Полностью переработана структура тем. Стало проще ориентироваться и повторять материал.
4. Быстрый поиск по всем разделам. Нужный вопрос теперь находится за секунды.
5. Много новых фичей и улучшений UX. Мелкие детали, которые сильно упрощают ежедневную практику.
6. Высокая скорость работы. Никаких тяжёлых фреймворков, всё написано на чистом JavaScript, кстати Claude позволил оптимизировать работу приложения и убрать много легаси-кода.
Теперь тренажёр стал гораздо быстрее, удобнее и ближе к тому, каким я изначально хотел его видеть
Но впереди ещё много планов: авторизация, сохранение прогресса и ИИ-инструменты. Кстати, пишите, что ещё стоит добавить
Скоро подниму БД и начну добавлять ещё больше функционала.
Интересно дальнейшее развитие? Ставьте
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
1🐳86🔥30 7 2
Claude врёт. И жрёт токены.
Я нашёл способ это пофиксить. Уже прошло несколько недель, как я начал экспериментировать с ним. От фронтенда до написания архитектуры, но сейчас расскажу про одну киллер-фичу, которая вам точно понравится.
Я уже не раз упоминал про NotebookLM и его шикарным дип-ресерчем и поиском, по которому можно учиться, но пост не о том, как пользоваться функционалом внутри и заполнять конспекты.
У Claude, как и у любой модели есть проблемы:
1. Наличие галлюцинаций. Claude этому подвержен, но в меньшей степени, как мне показалось.
2. Додумывание того, что не знает. Любая LLM сейчас это по сути вероятностные модели, которые определяют следующие слова (если можно упростить), есть вероятность того, что занесет не в то русло. В очередной раз для составления конспектов мне пихали нерелевантную инфу, например, для сравнения средний с помощью Mann-Whitney, что является уже неправильным и нужно опираться на более надежные источники или понимать предметную область.
3. Большое количество токенов на поиск информации. После того, как я слез с Codex, понял, что токены нужно тратить с умом, особенно, в контексте Claude, а еще лучше, когда он у тебя за 20 баксов. Поэтому сейчас отдаю 100🚘
А что если попытаться убить двух зайцев сразу? Меньше додумывать и тратить меньше токенов? Как будто сложно, не правда ли?
💸 Есть решение связать по MCP Claude с NotebookLM.
Один человек написал (кстати, с помощью Claude) самописный MCP, лежит в открытом доступе. Можете ради интереса развернуть такой же, либо сделать все по инструкции, предварительно принимая все риски и вуаля, MCP готов. Ставится очень просто.
Если вы в РФ, нужно прокинуть прокси на использование в настройки, чтобы Claude обращался напрямую.
А дальше остается дело за малым: прописать инструкцию в агента или вынести отдельный скилл, чтобы Claude общался по источникам и забирал нужную инфу, если этого не нашел, то переключался в формат ресерча. С Pro версией можно вообще создать несколько ноутбуков и загрузить до 300 источников, каждый из которых может содержать до 500к слов. Более подробно сравнение контекстных окон с другими модельками можно посмотреть тут.
Что получаем?
1. Ресерч становится быстрее и качественнее
2. Claude ест меньше токенов
3. Меньше ошибок
4. Можно быстрее построить базу знаний (например, для того же Obsidian)
И все, пользуемся. За наводку спасибо @strangethemrgrench. Уверен, что еще можно найти полезных тулзов, которые упрощают жизнь при использовании агентов.
Если тема зашла, ставьте🐳 , продолжу и дальше искать интересные темы, которые упростят разработку. Кстати, на сайте будут скоро большие изменения, не переключайтесь!
@zasql_python
Я нашёл способ это пофиксить. Уже прошло несколько недель, как я начал экспериментировать с ним. От фронтенда до написания архитектуры, но сейчас расскажу про одну киллер-фичу, которая вам точно понравится.
Я уже не раз упоминал про NotebookLM и его шикарным дип-ресерчем и поиском, по которому можно учиться, но пост не о том, как пользоваться функционалом внутри и заполнять конспекты.
У Claude, как и у любой модели есть проблемы:
1. Наличие галлюцинаций. Claude этому подвержен, но в меньшей степени, как мне показалось.
2. Додумывание того, что не знает. Любая LLM сейчас это по сути вероятностные модели, которые определяют следующие слова (если можно упростить), есть вероятность того, что занесет не в то русло. В очередной раз для составления конспектов мне пихали нерелевантную инфу, например, для сравнения средний с помощью Mann-Whitney, что является уже неправильным и нужно опираться на более надежные источники или понимать предметную область.
3. Большое количество токенов на поиск информации. После того, как я слез с Codex, понял, что токены нужно тратить с умом, особенно, в контексте Claude, а еще лучше, когда он у тебя за 20 баксов. Поэтому сейчас отдаю 100
А что если попытаться убить двух зайцев сразу? Меньше додумывать и тратить меньше токенов? Как будто сложно, не правда ли?
Один человек написал (кстати, с помощью Claude) самописный MCP, лежит в открытом доступе. Можете ради интереса развернуть такой же, либо сделать все по инструкции, предварительно принимая все риски и вуаля, MCP готов. Ставится очень просто.
А дальше остается дело за малым: прописать инструкцию в агента или вынести отдельный скилл, чтобы Claude общался по источникам и забирал нужную инфу, если этого не нашел, то переключался в формат ресерча. С Pro версией можно вообще создать несколько ноутбуков и загрузить до 300 источников, каждый из которых может содержать до 500к слов. Более подробно сравнение контекстных окон с другими модельками можно посмотреть тут.
Что получаем?
1. Ресерч становится быстрее и качественнее
2. Claude ест меньше токенов
3. Меньше ошибок
4. Можно быстрее построить базу знаний (например, для того же Obsidian)
И все, пользуемся. За наводку спасибо @strangethemrgrench. Уверен, что еще можно найти полезных тулзов, которые упрощают жизнь при использовании агентов.
Если тема зашла, ставьте
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳60 13❤8 3
Открыта регистрация на главную конференцию этой весны по технологиям ИИ и анализу данных — Data Fusion* 2026! 💙
Шестая ежегодная конференция Data Fusion пройдет 8–9 апреля в Москве в инновационном кластере «Ломоносов».
60+ актуальных сессий, докладов, примеров, дискуссий по теме анализа данных/ науки о данных/ машинного обучения. Среди тем – ИИ-агенты, «обучение с подкреплением», компьютерное зрение, обработка естественного языка, открытый исходный код, воплощенный ИИ и робототехника, рекомендательные системы, применение ИИ в кибербезопасности, ИИ+ естественные науки, AgentOps и многое другое! Всю программу ищите на сайте.
Конференция объединит лидеров команд по машинному обучению, специалистов по обработке данных, молодых ученых, инженеров, аналитиков и руководителей, принимающих решения о внедрении технологий в бизнес и государственные сервисы.
Среди спикеров конференции: Суржко Денис (ВТБ), Оселедец Иван (AIRI), Райгородский Андрей (МФТИ), Бурнаев Евгений (Сколтех,AIRI), Саркисов Тигран (Х5), Крайнов Александр (Яндекс), Зима Андрей (Ростелеком) и другие эксперты из науки и индустрии.
Все мы любим конференции не только ради знаний, но и, конечно, ради живого общения и новых знакомств, а это важная часть Data Fusion!
➡ Не пропустите, регистрируйтесь.
*Интеграция данных
Информация о рекламодателе
Шестая ежегодная конференция Data Fusion пройдет 8–9 апреля в Москве в инновационном кластере «Ломоносов».
60+ актуальных сессий, докладов, примеров, дискуссий по теме анализа данных/ науки о данных/ машинного обучения. Среди тем – ИИ-агенты, «обучение с подкреплением», компьютерное зрение, обработка естественного языка, открытый исходный код, воплощенный ИИ и робототехника, рекомендательные системы, применение ИИ в кибербезопасности, ИИ+ естественные науки, AgentOps и многое другое! Всю программу ищите на сайте.
Конференция объединит лидеров команд по машинному обучению, специалистов по обработке данных, молодых ученых, инженеров, аналитиков и руководителей, принимающих решения о внедрении технологий в бизнес и государственные сервисы.
Среди спикеров конференции: Суржко Денис (ВТБ), Оселедец Иван (AIRI), Райгородский Андрей (МФТИ), Бурнаев Евгений (Сколтех,AIRI), Саркисов Тигран (Х5), Крайнов Александр (Яндекс), Зима Андрей (Ростелеком) и другие эксперты из науки и индустрии.
Все мы любим конференции не только ради знаний, но и, конечно, ради живого общения и новых знакомств, а это важная часть Data Fusion!
*Интеграция данных
Информация о рекламодателе
Please open Telegram to view this post
VIEW IN TELEGRAM
AI сильнее всего изменит работу аналитиков (на основе ресерча по рынку США)
Нашел интересную визуализацию насколько сильно AI изменит работу на рынке США
Сначала была у Андрея Карпатого в Github, но вскоре репозиторий был удален, на YCombinator также засветился. Андрюха всех напугал, а потом удалил, но интернет все помнит.
Шкала 0-10 оценивает, насколько AI изменит профессию, причём не только через прямую автоматизацию, но и через рост продуктивности, из-за которого людей может понадобиться меньше.
Аналитики (8-9 exposure), так как легко в диджитал и проще масштабируется => можно ИИ легче привязать.
Мое мнение, что увеличится количество задач на аналитика, повысится планка. У РФ, например, в этом плане все достаточно мягко проходит пока что.
Чур я становлюсь барменом...
👀 Напряглись? Что думаете по этому поводу? Пишите в комментариях
@zasql_python
Нашел интересную визуализацию насколько сильно AI изменит работу на рынке США
Сначала была у Андрея Карпатого в Github, но вскоре репозиторий был удален, на YCombinator также засветился. Андрюха всех напугал, а потом удалил, но интернет все помнит.
Шкала 0-10 оценивает, насколько AI изменит профессию, причём не только через прямую автоматизацию, но и через рост продуктивности, из-за которого людей может понадобиться меньше.
Аналитики (8-9 exposure), так как легко в диджитал и проще масштабируется => можно ИИ легче привязать.
Мое мнение, что увеличится количество задач на аналитика, повысится планка. У РФ, например, в этом плане все достаточно мягко проходит пока что.
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM