Заскуль питона (Аналитика данных)
8.72K subscribers
202 photos
17 videos
4 files
202 links
Канал про Python, аналитику, Data Science, SQL и многое другое

По вопросам сотрудничества и рекламе: @m459n9

Сайт: zasqlpython.ru
Бот для тренировки: @zasql_python_train_bot
Download Telegram
Как сократить время обучения в 3–5 раз без увеличения часов

Недавно откопал для себя NotebookLM. Суть в том, что туда закидывается определенный контекст и моделька только из этого контекста формирует материалы.

Киллер-фича: так как у Google большая экосистема (в т.ч. Youtube), можно взять такой плагин и выкачать весь ютуб (на бесплатной версии до 50 источников, спокойно проваливается один большой плейлист или курс).

Какие кейсы применения?

1️⃣ Обучение новым направлениям на основе ограниченного контекста

Загрузка конкретных источников (книг, лекций, плейлистов, статей) и построение базы знаний строго внутри них.

Подходит для:
🟢освоения новой области (ML, A/B-тесты, математика)
🟢подготовки к собеседованиям по определённому стеку
🟢быстрого входа в новую роль

2️⃣ Радикальное сокращение времени на потребление видео

Можно загрузить YouTube-плейлист и:
🟢получить структурированный конспект
🟢выделить ключевые идеи
🟢сформировать mind map
🟢сделать карточки для повторения
🟢получить краткую выжимку вместо 10–15 часов просмотра

Так как субтитры обрабатываются корректно, качество выжимки получается высоким. Еще бы все видео были с голосом и понятными субтитрами ✏️

3️⃣ Формирование структуры строго по заданным источникам

Важно для ситуаций, когда нужно:
🟢учиться по конкретному учебнику
🟢готовиться к экзамену по утверждённой программе
🟢писать работу с опорой только на определённый перечень литературы

Можно еще сюда придумать: поиск пробелов в знаниях (про это чуть подробней ниже), подготовка к выступлениям и лекциям, работа с исследовательскими материалами, быстрое погружение в домен.

Есть проблема с доступами в сервисы Google, но сюда ставится прокси (благо они стоят очень дешево и можно себе их позволить), прокидываем через любой плагин в Chrome и у вуаля, все готово.

Теперь самое интересное применение

Вести с этим делом Obsidian и закидывать свою базу знаний в контекст. Все просто, моделька поймет, нужно ли изучать / читать книгу / смотреть видео или уже в базе знаний все есть и тратить на это время не нужно ИЛИ подсветит, что есть определенный пробел в знаниях и на этом нужно сосредточиться. Я считаю, что это топ, учитывая количество бесконечного материала благодаря ИИ, интернету.

Итого пайплайн выглядит так:

NotebookLM -> ChatGPT (структура / оформление / дополнение с поиском) -> (Python -> Obsidian)


Вот здесь интересное видео, можно также запихнуть в контекст NotebookLM и проверить...

А вы уже пользовались? Как вам? Какой сейчас используете пайплайн для пополнения базы знаний? Делитесь в комментариях 🐳

@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
160👍209🐳32
Заскуль питона (Аналитика данных)
Кто такие синьоры? Те, кто просто получают много денег и сидят, чилят, попивают смузи, сидя на пляже Те, кто долго работают в компании Те, кто (узнаете на вебинаре). Да, я мастер спойлеров 😁😁😁 В четверг 26 февраля в 19:00 по МСК стану гостем вебинара…
Уже сегодня состоится вебинар в 19:00 про синьорство.
Если вы хотите понимать, куда расти — приходите, будет полезно 🥺

Буду рад всех видеть, так как тема актуальная и зачастую непонятно, а что нужно делать, чтобы им стать. Вроде бы кажется, что и делаешь много, закрываешь задачи в срок, находишь импакт на бизнес, но все равно не растешь...

И непонятно — а что вообще нужно, чтобы перейти на следующий уровень?

Сегодня разберём:
🥳 кто такой синьор на самом деле
🥳 какие задачи отличают его от мидла
🥳 какие решения нужно уметь принимать
🥳 сколько это стоит на рынке

Говорим с @roma_protiv_fomo и другими ребятами сегодня.

Если вы в точке "делаю много, но не двигаюсь дальше" — вам точно стоит подключиться.
Please open Telegram to view this post
VIEW IN TELEGRAM
1🐳1464
Сижу с Obsidian 💎, закидываю конспект по временным рядам, планирую через какое-то время дропнуть в формате PDF. От базы до более продвинутых методов. Будут формулки, код, простые примеры.

В качестве основы беру лекции, папиры, статьи на хабре, конечно же, с помощью NotebookLM + ChatGPT.

Сделаю ревью конспекта, дополню необходимым и выложу).

Есть ещё идея: выложить всё на сайт в виде графа знаний — чтобы удобно переходить между темами. Потом так же итеративно собрать A/B, ML, Causal Inference и другое.

@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
29539👍16🐳96
однажды одному сотруднику поручили навайбкодить сервис авторизации для приложения по доставке хорошего настроения в понедельник...

был использован самый продвинутый ии-агент современности, который уступает только лишь Staff инженерам в FAANG.

мне кажется, что получилось неплохо для первого раза. Да, ведь? 👨‍🦳

@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
173743
🥺 Как придумывать идеи для продуктовых ресерчей?

Возможно, у вас возникало чувство того, что хочется сделать что-то классное с точки зрения аналитики, но непонятно, с чего начать.

На практике идеи для исследований чаще всего лежат прямо рядом.

1. Посмотреть, что происходит в продукте


😮 По своему опыт скажу, что не так много аналитиков регулярно прокликивают дашборды или системно формируют отчетность.

Сделали один раз, а дальше просто закрываем задачи в спринте. Хотя именно там часто появляются первые сигналы для исследований.

Об этом я писал здесь

Иногда достаточно задать простой вопрос: "Почему эта метрика ведет себя именно так? Можем ли мы ответить на этот вопрос прямо? Или нужно искать специфичный срез?"

2. Общение с пользователями


Есть ли в компании продуктовые исследователи, которые проводят интервью или опросы?

Через такие исследования часто подсвечиваются точечные проблемы на определенной выборке пользователей.

Это хороший источник гипотез для аналитики, потому что можно:

🟢проверить масштаб проблемы
🟢посмотреть сегменты пользователей
🟢понять реальный импакт

3. Посмотреть на бенчмарки рынка


Иногда полезно просто понять, как устроены похожие продукты.

Мне в этом хорошо помогает:

🟢 NotebookLM (с недавнего времени активно использую)
🟢 Deep Research в ChatGPT (раньше использовал Perplexity для поиска)

Можно задать конкретную сферу и посмотреть:

🟢какие метрики считают
🟢какие механики используют
🟢как компании растут в этом направлении

4. Посмотреть на продуктовый беклог


Все новое — хорошо забытое старое. Или не сделанное... Иногда в беклоге уже лежат идеи, которые когда-то не дошли до реализации ИЛИ были реализованы, но не проанализированы ИЛИ их можно докрутить для отдельного сегмента пользователей

Иногда такой анализ может сам по себе стать полноценным продуктовым ресерчем.

🔽 Обычно паттерны для исследований появляются в похожих ситуациях:

1. Конверсия падает без очевидной причины
2. Метрика растет только в одном сегменте
3. Пользователи используют фичу не так, как ожидалось
4. Retention новой когорты сильно отличается
5. Конкуренты делают иначе
6. В данных появляется аномальный сегмент и др.

Будет также круто, если вы пользуетесь продуктом, который анализируете. Так поймете основные проблемы, ботлнеки и тд. Об этом я писал пост здесь.


👀 Также важно, чтобы реализация идеи было не супер сложной, так как высока вероятность, что такую идею зарубят

А у вас как дела с продуктовыми исследованиями? Делитесь в комментариях!
🐳

@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳15541
Сегодня знаменательный день

😃 Во-первых, поздравляю всех девушек с 8 марта! Оставайтесь такими же клевыми. Успехов, радости и гармонии 🌷

☺️ Во-вторых, я добавил новую вкладку на сайт — КОНСПЕКТЫ. Теперь там есть теория по временным рядам (пока что только по ним).

В дальнейшем, этот блок будет расширяться (по вашим запросам пойму, что действительно важно).

Из тем были добавлены различные блоки, которые касаются базовой теории:

📈 сезонность, тренд, ACF, декомпозиции, можете потыкаться, найдете для себя что-то интересное.
Самая большая боль была валидировать и заносить LaTeX формулы...

У меня будет еще для вас несколько прикольных штук, которые в ближайшем времени буду анонсировать. Не переключайтесь!

@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳463214🔥6
осталось 10 минут до конца рабочего дня

не, ну а чего расслабились, давайте переходить на другие ИИ.

взять тот же дипсик или гигачат, чем не решение, правда, ведь? 👀

была у меня история, как я попробовал сгенерировать под задачу простенький график, так у меня дипсик 3/3 случаев убивал ядро...

но, ничего и это стерпим, главное поработать, а дальше все будет хорошо 😁

к тому же короткая рабочая неделя...


А если без шуток, что сейчас используете и сколько тратите денег на все ИИ-сервисы? Пишите в комменты 🔽

Сам использую Codex, Claude Code, Perplexity, NotebookLM и в скором времени еще возьму себе. Использовал еще Gamma, Figma AI и много других

Если интересна тема вайбкодинга и как я использую инструменты, поставьте 🐳

@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳111111032
Как безопасно и без боли встраивать ИИ в прод ↗️

Если вы пишете на Python и хотите использовать ИИ в повседневных задачах, то GoCloud 2026 — точно для вас.

9 апреля провайдер Cloud.ru проведет большую ИТ-конференцию про ИИ и облака. Главная тема в этом году — ИИ как сервис, а именно простые, управляемые и безопасные инструменты для работы с ИИ, которые можно использовать уже сейчас.

Что будет особенно интересно:
▶️Автоматизация: готовые и доступные ИИ-инструменты, RAG без боли, AI-workflows и DevOps-агент в облаке.

▶️Проектирование ИИ-систем: мультиагентная архитектура и кейсы компаний.

▶️Работа с данными: обработка real-time данных, управляемые базы данных, интеграция Spark и ИИ.

▶️Разработка приложений в облаке: автоматизация рутины, DevOps-инструменты и защита приложений.


А еще в программе есть воркшопы: берите ноутбук и решайте прикладные задачи под руководством экспертов Cloud.ru.

Конференция бесплатная, но места ограничены.

👉Успейте зарегистрироваться👈
Please open Telegram to view this post
VIEW IN TELEGRAM
8521
Сделал свой первый курс по pandas.

Курсов таких очень много, но гештальт определенный для себя закрыл. Смотрел на несколько курсов, которые есть в доступе, проблема в том, что там в формате: "Выбери правильный вариант ответа", а хотелось дропнуть полноценный. КУРС ДЛЯ НОВИЧКОВ 👦

Намучился с тестами и составлением заданий, а также с валидацией всего что есть. Ну ничего страшного, все заработало, по крайнем мере я так думаю 👦

Из интересного, тесты в pandas делаются неочевидно, поэтому в каждое задание вставляется следующий кусок

import json
import sys
import pandas as pd

raw = sys.stdin.read().strip()
payload = json.loads(raw) if raw else {'df': { ... }}
df = pd.DataFrame(payload.get('df', {}))

# ===== Пиши решение ниже =====
result = ...
print(result)


Дальше решение пишется после служебного блока как угодно, главное result вывести. И все.

Я еще готовлю несколько курсов, один из которых будет посвящен SQL, другой будет гибридный.

Ах да, ну еще и сайт пилиться продолжает, скоро сделаю анонс

Поддержите реакциями плиз! 🐳

@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
1🐳154🔥6919115
🚀 Большое обновление тренажёра для подготовки аналитиков к собеседованиям

За последние месяцы я полностью переработал свой тренажёр: переписал интерфейс, пересобрал структуру и улучшил логику использования.

Изначально это был просто набор материалов. Теперь это уже полноценный продукт, которым удобно пользоваться каждый день.

🍪🍪 Что изменилось в новой версии

1. Новый UI. Адаптивный интерфейс, одинаково удобный на телефоне и десктопе.

2. Обновлённый хедер и футер для мобильных устройств и планшетов. Навигация стала быстрее и интуитивнее.

3. Полностью переработана структура тем. Стало проще ориентироваться и повторять материал.

4. Быстрый поиск по всем разделам. Нужный вопрос теперь находится за секунды.

5. Много новых фичей и улучшений UX. Мелкие детали, которые сильно упрощают ежедневную практику.

6. Высокая скорость работы. Никаких тяжёлых фреймворков, всё написано на чистом JavaScript, кстати Claude позволил оптимизировать работу приложения и убрать много легаси-кода.

Теперь тренажёр стал гораздо быстрее, удобнее и ближе к тому, каким я изначально хотел его видеть
🔥

Но впереди ещё много планов: авторизация, сохранение прогресса и ИИ-инструменты. Кстати, пишите, что ещё стоит добавить ✏️

Скоро подниму БД и начну добавлять ещё больше функционала.

А тут гляди и 🆎 не за горами для сайта.

Интересно дальнейшее развитие? Ставьте 🐳 для поддержки. Скину скрин, как это выглядит в веб-апке в комментах

@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
1🐳83🔥2972
ИТ-специалисты Москвы, хотите поделиться опытом?

Есть возможность рассказать студентам о том, что вы не услышали в свое время. Центральный университет как раз проводит интенсив для будущих преподавателей ИТ-специальностей — это возможность попробовать себя в роли наставника и понять, подходит вам эта деятельность или нет.

Там вы сможете:
— Связать преподавание с личными и карьерными целями.
— Отработать техники презентаций и вовлечения аудитории.
— Спроектировать и провести пару на площадке Центрального университета.
— Заручиться поддержкой экспертов с опытом в крупных ИТ-компаниях.
— Получить шанс попасть в команду преподавателей Центрального университета.

Интенсив пройдет с 22 марта по 5 апреля. Будут онлайн-встречи и очные занятия. Еще успеваете зарегистрироваться.
64🐳32👍1
Claude врёт. И жрёт токены.

Я нашёл способ это пофиксить. Уже прошло несколько недель, как я начал экспериментировать с ним. От фронтенда до написания архитектуры, но сейчас расскажу про одну киллер-фичу, которая вам точно понравится.

Я уже не раз упоминал про NotebookLM и его шикарным дип-ресерчем и поиском, по которому можно учиться, но пост не о том, как пользоваться функционалом внутри и заполнять конспекты.

У Claude, как и у любой модели есть проблемы:

1. Наличие галлюцинаций. Claude этому подвержен, но в меньшей степени, как мне показалось.

2. Додумывание того, что не знает. Любая LLM сейчас это по сути вероятностные модели, которые определяют следующие слова (если можно упростить), есть вероятность того, что занесет не в то русло. В очередной раз для составления конспектов мне пихали нерелевантную инфу, например, для сравнения средний с помощью Mann-Whitney, что является уже неправильным и нужно опираться на более надежные источники или понимать предметную область.

3. Большое количество токенов на поиск информации. После того, как я слез с Codex, понял, что токены нужно тратить с умом, особенно, в контексте Claude, а еще лучше, когда он у тебя за 20 баксов. Поэтому сейчас отдаю 100 🚘

А что если попытаться убить двух зайцев сразу? Меньше додумывать и тратить меньше токенов? Как будто сложно, не правда ли?

💸 Есть решение связать по MCP Claude с NotebookLM.

Один человек написал (кстати, с помощью Claude) самописный MCP, лежит в открытом доступе. Можете ради интереса развернуть такой же, либо сделать все по инструкции, предварительно принимая все риски и вуаля, MCP готов. Ставится очень просто.
Если вы в РФ, нужно прокинуть прокси на использование в настройки, чтобы Claude обращался напрямую.

А дальше остается дело за малым: прописать инструкцию в агента или вынести отдельный скилл, чтобы Claude общался по источникам и забирал нужную инфу, если этого не нашел, то переключался в формат ресерча. С Pro версией можно вообще создать несколько ноутбуков и загрузить до 300 источников, каждый из которых может содержать до 500к слов. Более подробно сравнение контекстных окон с другими модельками можно посмотреть тут.

Что получаем?

1. Ресерч становится быстрее и качественнее
2. Claude ест меньше токенов
3. Меньше ошибок
4. Можно быстрее построить базу знаний (например, для того же Obsidian)

И все, пользуемся. За наводку спасибо @strangethemrgrench. Уверен, что еще можно найти полезных тулзов, которые упрощают жизнь при использовании агентов.

Если тема зашла, ставьте 🐳, продолжу и дальше искать интересные темы, которые упростят разработку. Кстати, на сайте будут скоро большие изменения, не переключайтесь!

@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳531163