Заскуль питона (Data Science) – Telegram

Заскуль питона (Data Science)

7.04K subscribers

146 photos

16 videos

4 files

166 links

Канал про Python, аналитику, Data Science, SQL и многое другое

По вопросам сотрудничества и рекламе: @m459n9

Сайт: zasqlpython.ru
Бот для тренировки: @zasql_python_train_bot

Download Telegram

About

Blog

Apps

Platform

Заскуль питона (Data Science)

7.04K subscribers

Заскуль питона (Data Science)

☺️ Всех с наступлением выходных!

Делитесь мемами, которые характеризуют ваше состояние после рабочих будней 👇

Please open Telegram to view this post

VIEW IN TELEGRAM

❤15🔥7😁5🐳3

3.27K views08:50

Заскуль питона (Data Science)

🆎 ЦПТ, скосы распределений, логарифмирование

В Google Colab приложил симуляции, которые показывают, как интуитивно работают методы + прикрепил разбор статьи с описанием работы различных методов, сходимости и прочее.

🔗

👉

Ссылочка тут

+ за выходные ознакомился с парочкой статей, которые описывают то, как работать с тяжелыми хвостами.

Если наберется много 🐳, разберу подробней парочку из них. Где-то планируется завышать значение t-критическое, где-то отсекать хвосты и моделировать их через определенный алгоритм, а где-то их обрезать, например, как тут выкинуть топ n% выбросов, ну и существуют методы, когда заменяют выбросы значением квантилей.

В общем, кажется, идеального решения нет и всё зависит от:
1. формы распределения (логнормальное, экспоненциальное, скошенное)
2. доли активных пользователей
3. цели теста (чувствительность vs устойчивость).

🐍

Дополнительно дублирую ссылочку на Google Colab

🐸

Please open Telegram to view this post

VIEW IN TELEGRAM

🐳63❤9🔥7

3.5K views08:40

Заскуль питона (Data Science)

Заскуль питона (Data Science)

🆎 ЦПТ, скосы распределений, логарифмирование В Google Colab приложил симуляции, которые показывают, как интуитивно работают методы + прикрепил разбор статьи с описанием работы различных методов, сходимости и прочее. 🔗👉 Ссылочка тут + за выходные ознакомился…

комменты в посте сломаны, это грустно ☹️

Please open Telegram to view this post

VIEW IN TELEGRAM

7🤯3🥴1

2.92K views08:47

Заскуль питона (Data Science)

Классы в Python для аналитика (?)

Знаю, что многим аналитикам тема классов кажется ненужной — и это нормально.

Сам изучал ООП на своем направлении в магистратуре, очень много всего предстояло изучить... И про свойства, про то, как реализовать, жуть короче, хочется функциями пользовать и все (и то максимум)...

Но если присмотреться, мы сталкиваемся с ними каждый день, просто не задумываемся об этом.

Например, в pandas 🐼.

1️⃣ Класс: pandas.DataFrame, который задает структуру таблиц: колонки, индексы, методы

2️⃣

Объект: df = pd.DataFrame(...), может быть задан через чтение баз данных, csv, вручную и тд.

3️⃣

Методы: df.groupby(), df.query, df, etc.

Классы могут помочь, когда мы хотим выстроить определенную структуру и избежать хаоса в коде

🔽

Опишу самый простой пример

🔽

Класс User описывает пользователя продукта.
У него есть: атрибуты user_id, os, orders и метод is_active(),
который определяет, активен ли пользователь (есть ли у него заказы).

class User:
    """Класс, описывающий пользователя продукта."""

    def __init__(self, user_id: int, os: str, orders: list[int]):
        """
        Args:
            user_id (int): Уникальный идентификатор пользователя.
            os (str): Операционная система (например, 'iOS' или 'Android').
            orders (list[int]): Список идентификаторов заказов пользователя.
        """
        self.user_id = user_id
        self.os = os
        self.orders = orders

    def is_active(self) -> bool:
        """Проверяет, есть ли у пользователя хотя бы один заказ."""
        return len(self.orders) > 0

Я слышал, что на некоторых курсах по аналитике уже включают ООП. Например, в теме по 🆎.
Это логично: когда ты работаешь с десятками экспериментов, хочется выстроить для них единую структуру, чтобы каждый тест имел одинаковый формат, методы расчёта и итоговую инфу 👀

class Experiment:
    def __init__(self, name, control, test, metric_name):
        self.name = name
        self.control = control
        self.test = test
        self.metric_name = metric_name

    def calc_mean(self, group):
        return group[self.metric_name].mean()

    def uplift(self):
        return (self.calc_mean(self.test) - self.calc_mean(self.control)) / self.calc_mean(self.control)

    def summary(self):
        return {
            "experiment": self.name,
            "uplift": round(self.uplift() * 100, 2),
            "control_mean": self.calc_mean(self.control),
            "test_mean": self.calc_mean(self.test),
        }

Но в крупных компаниях зачастую реализована своя A/B платформа, аналитику остается только делать дизайн эксперимента, подводить итоги и делать рекомендации... 🧐

💻

💻 Подход с классами не ограничивается тестами.

Необязательно использовать что-то сложное, например, на обучении я реализовывал классы для обращения к API / обработке ошибок / хранения информации на кошельке у юзера. Офк, это можно решить и с помощью SQL (про хранение данных), а у меня проект был без него 💅

Его можно применять и в других задачах — например, в ML, где удобно базово описать модель под свои данные и потом переиспользовать или наследовать её в будущем.

class ConversionModel:
    def fit(self, df):
        ...
    def predict(self, new_data):
        ...

✏️ Что можно почитать?

1. 🔗 Ссылочка 1
2. 🔗 Ссылочка 2
3. 🔗 Ссылочка 3

Если интересен разбор с кейсами применения ООП, ставьте 🐳, пишите, использовали ли вы у себя?

@zasql_python

Please open Telegram to view this post

VIEW IN TELEGRAM

🐳40❤10👍4🔥2

3.22K views13:23

Заскуль питона (Data Science)

Рабочая суббота! Правда, замечательно?

Предлагаю сегодня не упарываться по работе и пойти отдыхать пораньше.

Но раз у компа, напишите...

Из какой сферы вы вкатились в IT? Или это был логичный переход?

Я раньше хотел стать маркетологом, так как не знал куда идти с моим бекграундом (менеджер), участвовал в куче кейс-чемпионатов, чтобы получить оффер хоть куда-то...

Понял, что сложно проходить в финал, нужно искать работу. В резюме у меня было:

— классный
— мотивированный
— уверенный пользователь ПК
— знаю метрики
— средний балл хороший!

(не было опыта в общем, хотел себя продать).

Помню, что была смешная попытка собеседования в компанию:

Рекрутер написал, что мне нужно быть в 20:00 со своей ручкой и распечатанным резюме (2021 год на дворе). Наверное надо было пересмотреть Волк с Уолл-стрит и продать ручку...

Конечно же, я не поехал :)

Один знакомый посоветовал курсы Тимофея Хирьянова по алгоритмам. Скажу честно, я все записывал в тетрадочку, но меня хватило ненадолго 😢, не зацепило меня писать код про черепашку

Следующий заход у меня был через полгода ⌚️

Решил вкатиться через хакатон, который длился 7 месяцев кстати 😁

Удалось проскочить в одну компанию с этим проектом и вкатиться в IT,
а дальше вы историю знаете, я надеюсь 👀

А как вы вкатывались в IT? Почему решили вкатиться? Пишите в комментариях 🐳

🐳

🐳

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥13🐳7❤3👍1

2.93K views13:30

Заскуль питона (Data Science)

🫙

Про чтение в SQL [ч. 1]

Господа-аналитики, ничего сложного, делаем 90% своей работы, все в порядке. А вот как работает все под капотом не было особо сильного понимания. Решил глянуть парочку источников... 🔥

Будем говорить в контексте работы с нераспределенными базами данных. К ним относятся: PostgreSQL, MySQL, Oracle, MS SQL.

Увидел формулировку ниже, решил покопать ⌨️

Основная идея повышения скорости работы нераспределённой базы данных заключается в уменьшении количества операций чтения/записи с жёсткого диска

👀 У ИТМО нашел страничку, где описаны объемы, производительности, стоимости, в целом можно собрать какие-то выводы, что оперативка быстрее и лучше, но дороже, в целом понятно, почему хочется меньше жесткого диска)

Но RAM выполняет функцию буфера, а данные хранятся на диске.

Предположим, у нас есть упрощенная табличка в нераспределенной базе данных people со следующей структурой:

CREATE TABLE people (
  last_name varchar(32),
  first_name varchar(32),
  second_name varchar(32),
  sex char(1),
  birthday date
);

Допущение, что в среднем фамилия имя и отчество состоят из 7 RU символов,
а кодировка используется Unicode, тогда средняя строка займет на диске:

(7 * 2 + 1)  * 3 + 2 * 1 + 4 = 51 байт

💅 Есть еще определенная метадата, которая будет добавлять +32 байта, тогда средняя строчка займет 83 байта с учетом метадаты. Блок - это минимальная единица чтения и записи базы данных (страница данных в файле таблицы).

Один блок во многих учебных материалах идет в 4 кб (4096 байт)

👩‍💻

У постгре, например, он стоит в 8 кб по стандарту

=> В одном блоке содержится 📛

4096 / 83 = 49 строк и 29 байт остатка

⚠ Важно: база читает не одну строку, а весь блок целиком.

В таблице у нас 1000 записей, значит суммарно у нас будет блоков:

1000 / 49 ~ 20.4 блоков (округляем до 21)

Хотим сделать фильтрацию в SQL

🔽

select * from people where last_name IN ('Иванов', 'Петров', 'Сидоров');

❓

Мы не знаем где находятся записи, поэтому блоки будем считывать последовательно ([1, 2, 3, ... 21] блок, а может наши данные находятся в 12, 15 и 21 блоке).

🙊 Чем ближе нужные строки друг к другу, тем быстрее запрос. Если они лежат в одном блоке, база считает всё за один проход, а если раскиданы по разным, то придётся читать каждый блок отдельно

🐢

🙅‍♂️ Если отсортировать записи в блоке по ключу, то, дойдя до последнего совпадения, можно просто остановить поиск, так как дальше нужных значений уже не будет.

Чтобы не читать лишние блоки и быстрее находить нужные записи можно пользоваться индексными структурами, про которые я хочу написать в последующих постах, поговорим о стоимости запросов и о том, где они хороши, а где нет. Все что нужно — это 🐳

А я то думал, что когда был в 💙 и строил витрины с сегментациями, сортировками,
думал, что все просто, но еще нужно много всего подучить 🧑‍🎓

@zasql_python

Please open Telegram to view this post

VIEW IN TELEGRAM

🐳52❤6🔥2

3.04K viewsedited 07:28

Заскуль питона (Data Science)

Еще чуть-чуть и снова выходные 🤟

Что планируете успеть сделать за эти три дня?

— Начать писать скрипт для задачи 👍
— Понять, что все работает не так ☠️
— Начать переписывать логику ✏️
— Не сохранить и снова начать писать заново, потому что сервер перезапустился, а автосейв не сработал 🔄
— Отвлечься на несколько адхоков и потерять контекст задачи 🤞
— Потратить несколько минут, чтобы обратно въехать контекст и продолжить делать 👍
— Принять судьбу и с поражением закрыть ноутбук до завтра 🥳
— Повторить цикл ещё пару раз до пятницы 👍
— Идем отдыхать 🛌

Пишите свои дела в комментах 👇

@zasql_python

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

31113

2.75K views07:06

Заскуль питона (Data Science)

🤨 Преобразование Фишера для оценки доверительного интервала корреляции Пирсона

Корреляция может пригодиться в разных сценариях, например, когда мы строим модели линейной регрессии, отбираем признаки или бизнесово смотрим какие метрики линейно связаны ⛓️

Кажется, что np.corrcoef(a, b)[0,1] достаточно.

Ну или аналог ниже 🔽

import numpy as np
r = (np.cov([a,b], bias=True) / np.sqrt(np.var(a) * np.var(b)))[0][1]

Это хорошо, мы можем посчитать точечную оценку на выборке. Но! Мы же не знаем истинного значения коэффициента корреляции генеральной совокупности (также, как и средние, например). Выход: мы обычно строим доверительные интервалы на уровне значимости alpha.

Корреляция 0.8 звучит уверенно, но насколько мы в ней уверены статистически?

Когда это нам может пригодиться?

1. Аналитические исследования: насколько сильно линейно связаны метрики в продукте, для первой итерации по поиску прокси-метрик в 🆎
2. Сравнение корреляций между сегментами.
3. В 💻 насколько фича связана с целевой метрикой...
4. Мониторинг стабильности метрик. Если начала связь разъезжаться, возможно, поведение пользователей поменялось.

Ниже преобразование Фишера, которое делает распределение ближе к нормальному. Сгенерируем две случайные величины с корреляцией, равной 0.8. Для них посчитаем доверительный интервал Фишера на Python 🐍

from scipy.stats import norm 
import numpy as np

np.random.seed(42) 

n = 10000
rho = 0.8

mean = [0, 0]
cov = [[1, rho],
       [rho, 1]]  

x, y = np.random.multivariate_normal(mean, cov, size=n).T

r = np.corrcoef(x, y)[0, 1]

def fisher_ci(r, n, alpha=0.05):
    z = np.arctanh(r)
    se = 1/np.sqrt(n-3)
    z_crit = norm.ppf(1-alpha/2)
    lo = np.tanh(z - z_crit*se)
    hi = np.tanh(z + z_crit*se)
    return lo, hi

lo, hi = fisher_ci(r, n)
print(f"Доверительный интервал корреляции Пирсона: [{lo:.3f}, {hi:.3f}]")

Для Спирмена или Кендалла можно использовать бутстрап или другие приближения...

Если хотите разбор — какие вообще тесты (например для 🆎) бывают и когда какой использовать — ставьте 100 🕺, соберу подборку с примерами

А еще недавно у меня закончился ИС в 🛍, если вам интересно про это почитать, ставьте 100 😎

@zasql_python

Please open Telegram to view this post

VIEW IN TELEGRAM

93557❤33🔥2🐳2👍1

2.74K views06:26

Заскуль питона (Data Science)

👀 Снова собеседования?

Нет, пока я никуда не собираюсь из 🛍, в следующих постах расскажу про прохождение испытательного срока и общее впечатление от процессов

Интересно посмотреть со стороны компании, нанимающей аналитиков сейчас.

🤔

Представьте, что у вас один технический этап собеседования в компании на позицию аналитика, а затем идут в финалы.

Много компаний придерживаются следующих этапов:

1. Скрининг + HR
2. Технический этап собеседования
3. Финал

🍪

🍪 На скрининге происходит первичный метч между компанией и кандидатом (по зп / релевантному опыту и другим факторам).

А вот интерес к техничке:

Что спрашивать кандидата? Предположим, мы хотим прособеседовать универсального аналитика. Python + SQL + A/B + Статистика + BI + продуктовое понимание + ML (необязательно). Грейд кандидата определяется по количеству выполненных заданий по критериям. То есть под конкретные задачи мы его не закрываем, проходит общий трек.

🐍

Давать SQL, Python? Для общего понимания "хардов" кандидата? Сейчас LLM в большем количестве случаев справляется с написанием кода, но, трехэтажные запросы, создание витрин не вывозит. С Python периодически приходится дебажить, если сложная функция.

🎲 Давать статистику и теорию вероятностей? Мы считаем, что это является прокси к мышлению кандидата? Задачки на теорему Байеса, кубики можно выучить (зачастую их и дают на собеседованиях).

🆎 A/B тесты? Да, если человек проводил эксперимент, он может знать общий регламент. "Продвинутые" методы для A/B тестов давно есть на Хабре, их можно заботать.

📊 BI. Был опыт? Да / нет.

Слышал, что некоторые спрашивают про LLM, но это пока что экстраординарные случаи. Ну и про вайбкодинг, конечно 🤔

По сути, теперь собеседовать нужно не по знаниям, а по мышлению. Насколько кандидат способен структурировать задачу, а не просто знать ответ.

Некоторые компании (например, 🛍) фокусируются только на продуктовых кейсах, так как уровень кандидата можно понять по разбору его проектов, работе, соответственно. Считаю, что это один из правильных вариантов, так как времени зачастую на проведение секции не хватает. На самом деле, техническая секция в случае с Avito разделена на две. Стата / тервер + оценка по матрице компетенций.

🙊

Если бы вы сегодня собеседовали аналитика — что бы проверили в первую очередь: мышление или харды? Пишите свое мнение, будет интересно почитать.

Ставьте 🕺, если хотите дальше читать про собесы, а я пошел писать пост про мой испытательный срок и 🆎

@zasql_python

Please open Telegram to view this post

VIEW IN TELEGRAM

6675❤3🔥2👍1🐳1

3.05K views10:20

Заскуль питона (Data Science)

🍪

🍪

Подготовка к собеседованиям

Вдохновившись вашими комментариями, я решил сделать сайт, где будут вопросы для аналитиков в формате блиц с базой знаний (вопрос-ответ).

Тут SQL, Python, A/B, статистика, теория вероятностей, продуктовое мышление и др.

👩‍💻

👩‍💻

🎲

📊

🤔

🆎

Всего 500+ вопросов, список постоянно пополняется.

🔗

Потыкаться можно тут

🔗

— Каталог. База вопросов по темам, удобно читать и повторять
— Блиц. формат быстрой проверки знаний, трекинг стриков (возможно, сюда нужно таймер повесить).
— Карточки. Аналог Quizlet для запоминания и самопроверки.

🙊

Функционал будет расширяться! Как будет время потыкайтесь, не все идеально, но с этим можно работать.
Есть тёмная и светлая темы, фильтры, рандомный вопрос по кнопке и очень удобный поиск 🔍

Давайте нагрузим систему как в проде 😎
Проверим, кто ляжет первым: Railway или я 💀

У меня есть планы на развитие сайта, ставьте 300+ 🕺, если интересно узнать, репостите и пишите свой фидбек в комментариях

🔽

Please open Telegram to view this post

VIEW IN TELEGRAM

52293015🔥12❤7

3.75K viewsedited 06:45

Заскуль питона (Data Science)

Во сколько лет вы узнали, что боксплот — это проекция гистограммы сверху?

Или еще проще: вид с пика гистограммы вниз.

Концептуально показывает ту же форму распределения в сжатом виде

Теперь вы не сможете смотреть на них по-старому 😄

@zasql_python

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

1118❤147🔥1🐳11

3.34K views07:22

Заскуль питона (Data Science)

Как прошел мой испытательный срок в WB 🛍

Всем привет! Буквально недавно закончился мой испытательный срок, решил с вами об этом поделиться.

С самого начала у меня не было сомнений, что все будет ок в плане прохождения. Еще больше удивился, когда мне за 2 месяца до конца ИС сказали, что план закрыт. Пятилетка за год, получается? 😁

Было много ресерчей по поиску точек роста в продукте, A/B тесты, периодически ML и классическая работа аналитика (дашборды, витрины собрать, автоматизировать). Мне очень нравится, что есть возможность заниматься тем, чем что действительно интересно.

Был приятно удивлён, когда увидел стек, очень похожий на тот, что был в 💙. Правда удивительно, да? 😬
Когда я устраивался в Ozon, думал, что вылечу с работы через месяц, так как не работал классическим аналитиком с кучей инструментов.

Есть, конечно, проблема с процессами, но куда без этого?

1. Единой документации нет — только локальные описания под отдельные витрины.
2. Периодически происходит рестарт систем, в которых работаю (JH, например).

Чего-то глобального, что влияет негативно на мою работу не нашел, буду двигаться дальше.

А, ну еще я начал проводить собеседования дополнительно, так как решил, что это важно в плане оценки скиллов, взаимодействия с людьми. В общем, интересно сидеть по другую сторону экрана 😙

Расскажу немного про общее впечатление, так как оно было неоднозначное до трудоустройства.

Все нравится, команда топчик, продакты заряженные (по мне, это одно из ключевых, когда ребятки заряжены). Есть, конечно, куда расти и мне и процессам, но негативного (которое было со стороны). Очень нравится, что спринт длится 2 недели, за это время можно раскачаться 🍪

🍪

Ставьте 🕺, если интересно узнать, что я для вас готовлю. Скорее всего это будет следующим постом.

🔽 Делитесь в комментариях, как прошел ваш последний испытательный срок 🔽

@zasql_python

Please open Telegram to view this post

VIEW IN TELEGRAM

14493

3.36K views06:22

Заскуль питона (Data Science)

🍪🍪 Полезные материалы для аналитика в одном месте

Хотел дропнуть на следующей неделе, но подумал — зачем ждать? 😄

😮 zasqlpython.ru — новый домен и куча новых материалов!

Я обновил сайт и наконец собрал всё, что копил несколько лет в канале и в заметках, все в одном месте, будет список дополняться.

Что появилось:

📚 Большая подборка материалов по SQL / Python / A/B / ML

🧠 Полезные шаблоны, шпаргалки, разборы кейсов

⭐ Возможность сохранять понравившиеся вопросы и собирать свои подборки

🎲 В планах: режим рандомной тренировки + дополнительные секции

Если у вас есть идеи, что добавить — пишите в комментарии.
Будет интересно посмотреть, что сейчас востребовано у аналитиков.

Заходите, тестируйте, ломайте — всё как мы любим 😁

🔗 Ссылочку дублирую еще и здесь 🔗

Ставьте 🕺, если годно, а если нет, бросьте в меня камнем 👀

@zasql_python

Please open Telegram to view this post

VIEW IN TELEGRAM

112125❤14🔥93

3.36K viewsedited 15:02

Заскуль питона (Data Science)

Заскуль питона (Data Science)

🍪 Полезные материалы для аналитика в одном месте Хотел дропнуть на следующей неделе, но подумал — зачем ждать? 😄 😮 zasqlpython.ru — новый домен и куча новых материалов! Я обновил сайт и наконец собрал всё, что копил несколько лет в канале и в заметках…

🆎 [EN] Бесплатный курс по A/B тестированию

🐸 Знаю, что их не так много, но я нашел годноту, которую добавил к себе в материалы на сайт

😍 От Сколтеха есть курс, который ведется на английском языке, но ведут его русскоговорящие ребята (в т. ч. Александр Сахнов).

Всего 40 уроков, 5 недель обучения и есть практика в Google Colab (ipynb)

🤔 Программа курса

— Неделя 1. А/B-тесты. Введение
— Неделя 2. Основы статистики. Параметрическое оценивание. Бутстреп
— Неделя 3. Основы статистики. Проверка гипотез
— Неделя 4. А/B-тесты. Базовый уровень
— Неделя 5. А/B-тесты. Повышение чувствительности. Обзор современных методов

Конечно же, я добавил еще лекции ШАДа по A/B тестированию, как же без них 🍪

🍪

Ставьте 🕺, если нужны мысли про вайбкодинг в целом и как я это вижу в плане разработки
Если уже хватит апдейтов про сайт, ставьте 😮

🥺 Пока вы здесь, киньте бустов (это бесплатно для Premium), плиз, чтобы я смог поменять фон и добавить больше эмодзи в реакции на постах

@zasql_python

Please open Telegram to view this post

VIEW IN TELEGRAM

710617❤105

2.86K views06:34

Заскуль питона (Data Science)

Про вайбкодинг

(*на картинке вайб котик)

О да, и до меня дошла эта тема. Особенно, когда вчера Cloudflare не очень хорошо себя чувствовал, из-за чего часть чатов была недоступна (Perplexity, ChatGPT и др.). Вот блин, пришлось руками код писать, проверка на компетенцию специалиста в современных реалиях. А отобрать у тебя ИИ, кто ты? 👀

В общем, сам "термин", про который еще в феврале 2025 написал Andrew Karpathy. Суть в том, что все ошибки и вообще весь код загоняется в LLM до тех пор, пока он не начал работать. А сам в коде ты можешь даже не разбираться (зачастую так 🐸), главное показать, что ты хочешь протестировать и хорошо написать промпт для модели. Руководство на русском прикреплю сюда. Даже начали делать какие-то конторы курсы по вайб-кодингу, весьма интересно 🤔

Мне удалось сделать сайт по сути таким образом: был подобран агент, идея, которая была реализована с помощью различных промптов, тестов, кучи дотюнивания и так по кругу. По сути ИДЕЯ самое ключевое (если мы не упираемся в детали разработки, определение зависимостей между проектами и переписыванием кода за современными языковыми моделями). Особенно, когда есть сложная архитектура.

Знаю ребят, кто использует LLM для прототипирования / питча идеи, ее визуализации и лучшей "продажи". А кто-то даже использует в качестве рабочего решения, которое за несколько дней выводится в прод. Звучит впечатляюще, особенно, если оглядеться 3-4 года назад, когда для реализации гипотезы или хотя бы визуала нужно было больше времени.

Ключевое: агенты не таблетка, так как сейчас встречается много сервисов / инструментов, которые похожи друг на друга. То есть для простых приложений снизился порог входа, но то, что отделяет годный продукт от обычного — идея. Ну и соответственно, возможность продать роляет, поэтому навыки в маркетинге (куда я изначально хотел метить, возможно, расскажу про это историю позже 💃) будут как нельзя кстати.

Мое мнение: Гипотезы можно тестировать быстрее, но только тогда, когда вся система людей, ответственных за выкатку фичи в продукте, способна поддержать идею и быстро ее реализовать (в том числе разработка, аналитика, дизайнеры, продакты). Знание предметной области важно (например, по части аналитики) и нельзя просто бездумно делегировать ИИ (пока что 😁), то есть с точки зрения написания кода (когда ты уже знаешь определенные паттерны) — это про ускорение процесса, а не про бездумное копирование 🍪🍪.

Вайбкодинг про скорость тестирования идей.

Давайте наберем 100+ 🕺 и я выкатываю следующий пост, кстати пишите в комментах о чем вам бы было интересно почитать)

🥺 Пока вы здесь, киньте бустов (это бесплатно для Premium), плиз, чтобы я смог поменять фон и добавить больше эмодзи в реакции на постах

@zasql_python

Please open Telegram to view this post

VIEW IN TELEGRAM

10410❤74

2.14K viewsedited 07:48

Заскуль питона (Data Science)

Выбор доработки по практике для zasqlpython.ru

Писали некоторые ребята, что хотят видеть больше практики на сайте. Что ж, именно по продуктовым задачам можно это сделать, только нужно помочь определиться с форматом ✏

😮

Первый формат: Практика прямо на сайте. В ячейке пишешь код на синтаксисе (SQL / Python) -> нажимаешь Run (смотришь на вывод) -> дальше сдаешь сам код, сравнивается с ответом

➕

Плюсы:

1. Всё внутри сайта. Удобство для пользователя, не нужно лишний раз переходить, как на литкоде, но продуктовые задачи.

2. Быстрая проверка, удобно решать прямо с мобилки/рабочего места, к пункту 1.

3. Можно делать мини-интерактив вроде анализов, фильтров и т.д.

4. Единый контекст. Понятный пайплайн решения.

5. Сразу видно результат выполнения кода на тех данных, что даны в задаче.

➖

Минусы:

1. Нужна база данных в фоне (или автосоздание семпла таблиц при запуске). Но как будто норм, если все будет развернуто локально, только вопрос куда будет обращаться пользователь, к заново созданной базе после каждой сессии? 🤔

2. Нужно защищаться от вечных циклов, тяжёлых запросов и т.п (например, продумать таймаут, чтобы находчивые пользователи не сделали while True ♾, я уверен, что еще много всякого).

3. Поддержка требует бэкенда и ресурсов. Несколько датацентров нужно под это дело 🤨, правда 😐

🕺

Второй формат: открываешь Google Colab и делаешь задание, в которое вводишь ответ. То есть сам код и его выполнение в одном месте -> ожидается только ответ

➕

Плюсы:

1. Полная свобода: можно строить графики, делать SQL через SQLite, исследовать много всякого. Графики покрутить, с Gemini обмозговать, если нужно 💅

2. Можно сохранить результат как мини-проект на GitHub 👩‍💻

3. Сайт не нагружается, всё выполняется в Colab 😏, плюс для меня, но мб для кого-то критично.

➖

Минусы:

1. Нужно переходить на другую платформу. Да, сложно нажать по ссылке и выполнить задания, вдруг там вирусы, не ну а чего? ❓

2. Не так все очевидно (если нет четкого ТЗ по ячейкам, можно закопаться и уйти в дебри). Если не будет четко описанного ТЗ, что считаем, чем пользуемся, для чего делаем, можно прийти в тупик. Но зато симулятор аналитика в реальной жизни получится 🤣

Таким образом возникает трейдофф между удобством пользователя (всё на сайте, моментальная проверка) и сложностью реализации/поддержки (инфраструктура, защита, ресурсы) 🤣, ох уж этот ваш вайбкодинг

Мне интересно понять: какой формат вы выберете?

😮 — Формат с ячейками прямо на сайте (есть окно для ввода кода)
🕺 — Формат с вводом варианта ответа (где-то в другом месте делаете самостоятельно)
😎 — Гибридный формат

Пишите в комментариях ваши мысли, буду рад почитать

Сегодня, как и вчера я на Матемаркетинге, планирую выпустить пост саммари

👍

. Кто хочет пообщаться, пишите

✨

Please open Telegram to view this post

VIEW IN TELEGRAM

732514❤3

1.91K views05:41

Заскуль питона (Data Science)

Прошли 2 дня Матемаркетинга…

Было очень приятно увидеть знакомые лица, пообщаться вживую и наконец-то выйти из Telegram хоть на пару дней 😄
Если хотите — го накидаем много 🕺

🕺

🕺

🕺, а я расскажу свои впечатления, что понравилось, что удивило и сколько мерча удалось унести за все активности (их было много 👀).

Хочу собрать мини-обзор с докладами, которые зашли — так что пишите в комментах, кто был, что понравилось и что взять на заметку 🙌

@zasql_python

Please open Telegram to view this post

VIEW IN TELEGRAM

125❤742

1.84K viewsedited 17:26

Заскуль питона (Data Science)

HR: Расскажите про свой опыт в ML?

Ответ убил...

Пишите свой вариант для этой картинки в комментариях

🔽

Please open Telegram to view this post

VIEW IN TELEGRAM

28177❤31

1.76K views10:15

Заскуль питона (Data Science)

😮

Новый день — новый продукт для аналитиков 😮

Бот для проверки навыков продуктовых и дата-аналитиков.

Был я на стенде ММ'25 и мне зашла идея сделать квиз, но более масштабный, а не только для 10 вопросов. Также я видел у знакомых ребят подобный продукт, давно хотел реализовать, только на своей стороне с упором на продуктовую аналитику.

1. Только варианты ответов по кнопкам, никаких развернутых.
2. Можно собирать статистику по количеству правильных и неправильных вопросов.
3. Планирую это добавить на сайт для логического продолжения, чтобы точно всегда было под рукой.

Почему вам должно зайти?

1. Бесплатно 💵
2. Больше упора на A/B, продуктовые кейсы, метрики и т.д. 🆎
3. Объяснение варианта ответа
4. Все в Телеграм, удобно, бесшовно

По поводу лого, если интересно. Сгенерировал в Figma AI по промпту, несколько раз закидывал. Изначально использовал классический вариант генерации через DALLE-3, но чет не зашло, так как мне нужен был лого, а тут прям понравилось. В общем, советую, кто будет делать для себя визуал (мб лого для канала, например, элементы на сайте и тд).

Ставьте 🕺, если зашло! Пишите свои комментарии, что можно добавить

Если вы хотите добавить свои вопросы для собесов, прикрепляйте их сюда

⬅️

Хочу добить 10 лвл канала, сейчас пока восьмой, но это уже неплохо (буст доступен для тех, у кого премиум — это одна кнопка и бесплатно), чтобы сделать обои в своем стиле + несколько прикольных эмодзи. Поэтому, пока вы здесь, нажмите кнопочку

🥺

🥺

🥺.

@zasql_python

Please open Telegram to view this post

VIEW IN TELEGRAM

59105❤2🐳211

1.12K views07:25