Делитесь мемами, которые характеризуют ваше состояние после рабочих будней
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15🔥7😁5🐳3
🆎 ЦПТ, скосы распределений, логарифмирование
В Google Colab приложил симуляции, которые показывают, как интуитивно работают методы + прикрепил разбор статьи с описанием работы различных методов, сходимости и прочее.
🔗 👉 Ссылочка тут
+ за выходные ознакомился с парочкой статей, которые описывают то, как работать с тяжелыми хвостами.
Если наберется много🐳 , разберу подробней парочку из них. Где-то планируется завышать значение t-критическое, где-то отсекать хвосты и моделировать их через определенный алгоритм, а где-то их обрезать, например, как тут выкинуть топ n% выбросов, ну и существуют методы, когда заменяют выбросы значением квантилей.
В общем, кажется, идеального решения нет и всё зависит от:
1. формы распределения (логнормальное, экспоненциальное, скошенное)
2. доли активных пользователей
3. цели теста (чувствительность vs устойчивость).
🐍 Дополнительно дублирую ссылочку на Google Colab
🐸 @zasql_python
В Google Colab приложил симуляции, которые показывают, как интуитивно работают методы + прикрепил разбор статьи с описанием работы различных методов, сходимости и прочее.
+ за выходные ознакомился с парочкой статей, которые описывают то, как работать с тяжелыми хвостами.
Если наберется много
В общем, кажется, идеального решения нет и всё зависит от:
1. формы распределения (логнормальное, экспоненциальное, скошенное)
2. доли активных пользователей
3. цели теста (чувствительность vs устойчивость).
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳63❤9🔥7
Заскуль питона (Data Science)
🆎 ЦПТ, скосы распределений, логарифмирование В Google Colab приложил симуляции, которые показывают, как интуитивно работают методы + прикрепил разбор статьи с описанием работы различных методов, сходимости и прочее. 🔗 👉 Ссылочка тут + за выходные ознакомился…
комменты в посте сломаны, это грустно ☹️
Please open Telegram to view this post
VIEW IN TELEGRAM
Классы в Python для аналитика (?)
Знаю, что многим аналитикам тема классов кажется ненужной — и это нормально.
Сам изучал ООП на своем направлении в магистратуре, очень много всего предстояло изучить... И про свойства, про то, как реализовать, жуть короче, хочется функциями пользовать и все (и то максимум)...
Но если присмотреться, мы сталкиваемся с ними каждый день, просто не задумываемся об этом.
Например, в pandas🐼 .
1️⃣ Класс: pandas.DataFrame, который задает структуру таблиц: колонки, индексы, методы
2️⃣ Объект: df = pd.DataFrame(...), может быть задан через чтение баз данных, csv, вручную и тд.
3️⃣ Методы: df.groupby(), df.query, df, etc.
Классы могут помочь, когда мы хотим выстроить определенную структуру и избежать хаоса в коде
🔽 Опишу самый простой пример 🔽
Класс User описывает пользователя продукта.
У него есть: атрибуты user_id, os, orders и метод is_active(),
который определяет, активен ли пользователь (есть ли у него заказы).
Я слышал, что на некоторых курсах по аналитике уже включают ООП. Например, в теме по 🆎.
Это логично: когда ты работаешь с десятками экспериментов, хочется выстроить для них единую структуру, чтобы каждый тест имел одинаковый формат, методы расчёта и итоговую инфу👀
💻 💻 Подход с классами не ограничивается тестами.
Необязательно использовать что-то сложное, например, на обучении я реализовывал классы для обращения к API / обработке ошибок / хранения информации на кошельке у юзера. Офк, это можно решить и с помощью SQL (про хранение данных), а у меня проект был без него💅
Его можно применять и в других задачах — например, в ML, где удобно базово описать модель под свои данные и потом переиспользовать или наследовать её в будущем.
✏️ Что можно почитать?
1.🔗 Ссылочка 1
2.🔗 Ссылочка 2
3.🔗 Ссылочка 3
Если интересен разбор с кейсами применения ООП, ставьте🐳 , пишите, использовали ли вы у себя?
@zasql_python
Знаю, что многим аналитикам тема классов кажется ненужной — и это нормально.
Сам изучал ООП на своем направлении в магистратуре, очень много всего предстояло изучить... И про свойства, про то, как реализовать, жуть короче, хочется функциями пользовать и все (и то максимум)...
Но если присмотреться, мы сталкиваемся с ними каждый день, просто не задумываемся об этом.
Например, в pandas
Классы могут помочь, когда мы хотим выстроить определенную структуру и избежать хаоса в коде
Класс User описывает пользователя продукта.
У него есть: атрибуты user_id, os, orders и метод is_active(),
который определяет, активен ли пользователь (есть ли у него заказы).
class User:
"""Класс, описывающий пользователя продукта."""
def __init__(self, user_id: int, os: str, orders: list[int]):
"""
Args:
user_id (int): Уникальный идентификатор пользователя.
os (str): Операционная система (например, 'iOS' или 'Android').
orders (list[int]): Список идентификаторов заказов пользователя.
"""
self.user_id = user_id
self.os = os
self.orders = orders
def is_active(self) -> bool:
"""Проверяет, есть ли у пользователя хотя бы один заказ."""
return len(self.orders) > 0
Я слышал, что на некоторых курсах по аналитике уже включают ООП. Например, в теме по 🆎.
Это логично: когда ты работаешь с десятками экспериментов, хочется выстроить для них единую структуру, чтобы каждый тест имел одинаковый формат, методы расчёта и итоговую инфу
class Experiment:
def __init__(self, name, control, test, metric_name):
self.name = name
self.control = control
self.test = test
self.metric_name = metric_name
def calc_mean(self, group):
return group[self.metric_name].mean()
def uplift(self):
return (self.calc_mean(self.test) - self.calc_mean(self.control)) / self.calc_mean(self.control)
def summary(self):
return {
"experiment": self.name,
"uplift": round(self.uplift() * 100, 2),
"control_mean": self.calc_mean(self.control),
"test_mean": self.calc_mean(self.test),
}
Но в крупных компаниях зачастую реализована своя A/B платформа, аналитику остается только делать дизайн эксперимента, подводить итоги и делать рекомендации...🧐
Необязательно использовать что-то сложное, например, на обучении я реализовывал классы для обращения к API / обработке ошибок / хранения информации на кошельке у юзера. Офк, это можно решить и с помощью SQL (про хранение данных), а у меня проект был без него
Его можно применять и в других задачах — например, в ML, где удобно базово описать модель под свои данные и потом переиспользовать или наследовать её в будущем.
class ConversionModel:
def fit(self, df):
...
def predict(self, new_data):
...
1.
2.
3.
Если интересен разбор с кейсами применения ООП, ставьте
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳40❤10👍4🔥2
Рабочая суббота! Правда, замечательно?
Предлагаю сегодня не упарываться по работе и пойти отдыхать пораньше.
Но раз у компа, напишите...
Из какой сферы вы вкатились в IT? Или это был логичный переход?
Я раньше хотел стать маркетологом, так как не знал куда идти с моим бекграундом (менеджер), участвовал в куче кейс-чемпионатов, чтобы получить оффер хоть куда-то...
Понял, что сложно проходить в финал, нужно искать работу. В резюме у меня было:
— классный
— мотивированный
— уверенный пользователь ПК
— знаю метрики
— средний балл хороший!
(не было опыта в общем, хотел себя продать).
Помню, что была смешная попытка собеседования в компанию:
Рекрутер написал, что мне нужно быть в 20:00 со своей ручкой и распечатанным резюме (2021 год на дворе). Наверное надо было пересмотреть Волк с Уолл-стрит и продать ручку...
Конечно же, я не поехал :)
Один знакомый посоветовал курсы Тимофея Хирьянова по алгоритмам. Скажу честно, я все записывал в тетрадочку, но меня хватило ненадолго😢 , не зацепило меня писать код про черепашку
Следующий заход у меня был через полгода⌚️
Решил вкатиться через хакатон, который длился 7 месяцев кстати😁
Удалось проскочить в одну компанию с этим проектом и вкатиться в IT,
а дальше вы историю знаете, я надеюсь👀
А как вы вкатывались в IT? Почему решили вкатиться? Пишите в комментариях🐳 🐳 🐳
@zasql_python
Предлагаю сегодня не упарываться по работе и пойти отдыхать пораньше.
Но раз у компа, напишите...
Из какой сферы вы вкатились в IT? Или это был логичный переход?
Я раньше хотел стать маркетологом, так как не знал куда идти с моим бекграундом (менеджер), участвовал в куче кейс-чемпионатов, чтобы получить оффер хоть куда-то...
Понял, что сложно проходить в финал, нужно искать работу. В резюме у меня было:
— классный
— мотивированный
— уверенный пользователь ПК
— знаю метрики
— средний балл хороший!
(не было опыта в общем, хотел себя продать).
Помню, что была смешная попытка собеседования в компанию:
Рекрутер написал, что мне нужно быть в 20:00 со своей ручкой и распечатанным резюме (2021 год на дворе). Наверное надо было пересмотреть Волк с Уолл-стрит и продать ручку...
Конечно же, я не поехал :)
Один знакомый посоветовал курсы Тимофея Хирьянова по алгоритмам. Скажу честно, я все записывал в тетрадочку, но меня хватило ненадолго
Следующий заход у меня был через полгода
Решил вкатиться через хакатон, который длился 7 месяцев кстати
Удалось проскочить в одну компанию с этим проектом и вкатиться в IT,
а дальше вы историю знаете, я надеюсь
А как вы вкатывались в IT? Почему решили вкатиться? Пишите в комментариях
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13🐳7❤3👍1
Господа-аналитики, ничего сложного, делаем 90% своей работы, все в порядке. А вот как работает все под капотом не было особо сильного понимания. Решил глянуть парочку источников...
Будем говорить в контексте работы с нераспределенными базами данных. К ним относятся: PostgreSQL, MySQL, Oracle, MS SQL.
Увидел формулировку ниже, решил покопать
Основная идея повышения скорости работы нераспределённой базы данных заключается в уменьшении количества операций чтения/записи с жёсткого диска
Но RAM выполняет функцию буфера, а данные хранятся на диске.
Предположим, у нас есть упрощенная табличка в нераспределенной базе данных
people со следующей структурой:CREATE TABLE people (
last_name varchar(32),
first_name varchar(32),
second_name varchar(32),
sex char(1),
birthday date
);
Допущение, что в среднем фамилия имя и отчество состоят из 7 RU символов,
а кодировка используется Unicode, тогда средняя строка займет на диске:
(7 * 2 + 1) * 3 + 2 * 1 + 4 = 51 байт
Один блок во многих учебных материалах идет в 4 кб (4096 байт)
=> В одном блоке содержится
4096 / 83 = 49 строк и 29 байт остатка
В таблице у нас 1000 записей, значит суммарно у нас будет блоков:
1000 / 49 ~ 20.4 блоков (округляем до 21)
Хотим сделать фильтрацию в SQL
select * from people where last_name IN ('Иванов', 'Петров', 'Сидоров'); Чтобы не читать лишние блоки и быстрее находить нужные записи можно пользоваться индексными структурами, про которые я хочу написать в последующих постах, поговорим о стоимости запросов и о том, где они хороши, а где нет. Все что нужно — это
А я то думал, что когда был в
думал, что все просто, но еще нужно много всего подучить
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
🐳52❤6🔥2
Еще чуть-чуть и снова выходные 🤟
Что планируете успеть сделать за эти три дня?
— Начать писать скрипт для задачи👍
— Понять, что все работает не так☠️
— Начать переписывать логику✏️
— Не сохранить и снова начать писать заново, потому что сервер перезапустился, а автосейв не сработал🔄
— Отвлечься на несколько адхоков и потерять контекст задачи🤞
— Потратить несколько минут, чтобы обратно въехать контекст и продолжить делать👍
— Принять судьбу и с поражением закрыть ноутбук до завтра🥳
— Повторить цикл ещё пару раз до пятницы👍
— Идем отдыхать🛌
Пишите свои дела в комментах👇
@zasql_python👉 @ds_memes
Что планируете успеть сделать за эти три дня?
— Начать писать скрипт для задачи
— Понять, что все работает не так
— Начать переписывать логику
— Не сохранить и снова начать писать заново, потому что сервер перезапустился, а автосейв не сработал
— Отвлечься на несколько адхоков и потерять контекст задачи
— Потратить несколько минут, чтобы обратно въехать контекст и продолжить делать
— Принять судьбу и с поражением закрыть ноутбук до завтра
— Повторить цикл ещё пару раз до пятницы
— Идем отдыхать
Пишите свои дела в комментах
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
Корреляция может пригодиться в разных сценариях, например, когда мы строим модели линейной регрессии, отбираем признаки или бизнесово смотрим какие метрики линейно связаны
Кажется, что
np.corrcoef(a, b)[0,1] достаточно. Ну или аналог ниже
import numpy as np
r = (np.cov([a,b], bias=True) / np.sqrt(np.var(a) * np.var(b)))[0][1]
Это хорошо, мы можем посчитать точечную оценку на выборке. Но! Мы же не знаем истинного значения коэффициента корреляции генеральной совокупности (также, как и средние, например). Выход: мы обычно строим доверительные интервалы на уровне значимости
alpha. Корреляция 0.8 звучит уверенно, но насколько мы в ней уверены статистически?
Когда это нам может пригодиться?
1. Аналитические исследования: насколько сильно линейно связаны метрики в продукте, для первой итерации по поиску прокси-метрик в 🆎
2. Сравнение корреляций между сегментами.
3. В
4. Мониторинг стабильности метрик. Если начала связь разъезжаться, возможно, поведение пользователей поменялось.
Ниже преобразование Фишера, которое делает распределение ближе к нормальному. Сгенерируем две случайные величины с корреляцией, равной 0.8. Для них посчитаем доверительный интервал Фишера на Python
from scipy.stats import norm
import numpy as np
np.random.seed(42)
n = 10000
rho = 0.8
mean = [0, 0]
cov = [[1, rho],
[rho, 1]]
x, y = np.random.multivariate_normal(mean, cov, size=n).T
r = np.corrcoef(x, y)[0, 1]
def fisher_ci(r, n, alpha=0.05):
z = np.arctanh(r)
se = 1/np.sqrt(n-3)
z_crit = norm.ppf(1-alpha/2)
lo = np.tanh(z - z_crit*se)
hi = np.tanh(z + z_crit*se)
return lo, hi
lo, hi = fisher_ci(r, n)
print(f"Доверительный интервал корреляции Пирсона: [{lo:.3f}, {hi:.3f}]")
Для Спирмена или Кендалла можно использовать бутстрап или другие приближения...
Если хотите разбор — какие вообще тесты (например для 🆎) бывают и когда какой использовать — ставьте 100
А еще недавно у меня закончился ИС в
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
Нет, пока я никуда не собираюсь из
Интересно посмотреть со стороны компании, нанимающей аналитиков сейчас.
Много компаний придерживаются следующих этапов:
1. Скрининг + HR
2. Технический этап собеседования
3. Финал
А вот интерес к техничке:
Что спрашивать кандидата? Предположим, мы хотим прособеседовать универсального аналитика. Python + SQL + A/B + Статистика + BI + продуктовое понимание + ML (необязательно). Грейд кандидата определяется по количеству выполненных заданий по критериям. То есть под конкретные задачи мы его не закрываем, проходит общий трек.
🆎 A/B тесты? Да, если человек проводил эксперимент, он может знать общий регламент. "Продвинутые" методы для A/B тестов давно есть на Хабре, их можно заботать.
Слышал, что некоторые спрашивают про LLM, но это пока что экстраординарные случаи. Ну и про вайбкодинг, конечно
По сути, теперь собеседовать нужно не по знаниям, а по мышлению. Насколько кандидат способен структурировать задачу, а не просто знать ответ.
Некоторые компании (например,
Ставьте
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
Вдохновившись вашими комментариями, я решил сделать сайт, где будут вопросы для аналитиков в формате блиц с базой знаний (вопрос-ответ).
Тут SQL, Python, A/B, статистика, теория вероятностей, продуктовое мышление и др.
Всего 500+ вопросов, список постоянно пополняется.
— Каталог. База вопросов по темам, удобно читать и повторять
— Блиц. формат быстрой проверки знаний, трекинг стриков (возможно, сюда нужно таймер повесить).
— Карточки. Аналог Quizlet для запоминания и самопроверки.
Есть тёмная и светлая темы, фильтры, рандомный вопрос по кнопке и очень удобный поиск
Давайте нагрузим систему как в проде😎
Проверим, кто ляжет первым: Railway или я💀
У меня есть планы на развитие сайта, ставьте 300+
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
5 229 30 15🔥12❤7
Во сколько лет вы узнали, что боксплот — это проекция гистограммы сверху?
Или еще проще: вид с пика гистограммы вниз.
Концептуально показывает ту же форму распределения в сжатом виде
Теперь вы не сможете смотреть на них по-старому😄
@zasql_python👉 @ds_memes
Или еще проще: вид с пика гистограммы вниз.
Концептуально показывает ту же форму распределения в сжатом виде
Теперь вы не сможете смотреть на них по-старому
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
1 118❤14 7🔥1🐳1 1
Как прошел мой испытательный срок в WB 🛍
Всем привет! Буквально недавно закончился мой испытательный срок, решил с вами об этом поделиться.
С самого начала у меня не было сомнений, что все будет ок в плане прохождения. Еще больше удивился, когда мне за 2 месяца до конца ИС сказали, что план закрыт. Пятилетка за год, получается?😁
Было много ресерчей по поиску точек роста в продукте, A/B тесты, периодически ML и классическая работа аналитика (дашборды, витрины собрать, автоматизировать). Мне очень нравится, что есть возможность заниматься тем, чем что действительно интересно.
Был приятно удивлён, когда увидел стек, очень похожий на тот, что был в💙 . Правда удивительно, да? 😬
Когда я устраивался в Ozon, думал, что вылечу с работы через месяц, так как не работал классическим аналитиком с кучей инструментов.
Есть, конечно, проблема с процессами, но куда без этого?
1. Единой документации нет — только локальные описания под отдельные витрины.
2. Периодически происходит рестарт систем, в которых работаю (JH, например).
Чего-то глобального, что влияет негативно на мою работу не нашел, буду двигаться дальше.
А, ну еще я начал проводить собеседования дополнительно, так как решил, что это важно в плане оценки скиллов, взаимодействия с людьми. В общем, интересно сидеть по другую сторону экрана😙
Расскажу немного про общее впечатление, так как оно было неоднозначное до трудоустройства.
Все нравится, команда топчик, продакты заряженные (по мне, это одно из ключевых, когда ребятки заряжены). Есть, конечно, куда расти и мне и процессам, но негативного (которое было со стороны). Очень нравится, что спринт длится 2 недели, за это время можно раскачаться🍪 🍪
Ставьте🕺 , если интересно узнать, что я для вас готовлю. Скорее всего это будет следующим постом.
🔽 Делитесь в комментариях, как прошел ваш последний испытательный срок 🔽
@zasql_python
Всем привет! Буквально недавно закончился мой испытательный срок, решил с вами об этом поделиться.
С самого начала у меня не было сомнений, что все будет ок в плане прохождения. Еще больше удивился, когда мне за 2 месяца до конца ИС сказали, что план закрыт. Пятилетка за год, получается?
Было много ресерчей по поиску точек роста в продукте, A/B тесты, периодически ML и классическая работа аналитика (дашборды, витрины собрать, автоматизировать). Мне очень нравится, что есть возможность заниматься тем, чем что действительно интересно.
Был приятно удивлён, когда увидел стек, очень похожий на тот, что был в
Когда я устраивался в Ozon, думал, что вылечу с работы через месяц, так как не работал классическим аналитиком с кучей инструментов.
Есть, конечно, проблема с процессами, но куда без этого?
1. Единой документации нет — только локальные описания под отдельные витрины.
2. Периодически происходит рестарт систем, в которых работаю (JH, например).
Чего-то глобального, что влияет негативно на мою работу не нашел, буду двигаться дальше.
А, ну еще я начал проводить собеседования дополнительно, так как решил, что это важно в плане оценки скиллов, взаимодействия с людьми. В общем, интересно сидеть по другую сторону экрана
Расскажу немного про общее впечатление, так как оно было неоднозначное до трудоустройства.
Все нравится, команда топчик, продакты заряженные (по мне, это одно из ключевых, когда ребятки заряжены). Есть, конечно, куда расти и мне и процессам, но негативного (которое было со стороны). Очень нравится, что спринт длится 2 недели, за это время можно раскачаться
Ставьте
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
Хотел дропнуть на следующей неделе, но подумал — зачем ждать? 😄
Я обновил сайт и наконец собрал всё, что копил несколько лет в канале и в заметках, все в одном месте, будет список дополняться.
Что появилось:
Если у вас есть идеи, что добавить — пишите в комментарии.
Будет интересно посмотреть, что сейчас востребовано у аналитиков.
Заходите, тестируйте, ломайте — всё как мы любим
Ставьте
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
1 121 25❤14🔥9 3
Заскуль питона (Data Science)
🆎 [EN] Бесплатный курс по A/B тестированию
🐸 Знаю, что их не так много, но я нашел годноту, которую добавил к себе в материалы на сайт
😍 От Сколтеха есть курс, который ведется на английском языке, но ведут его русскоговорящие ребята (в т. ч. Александр Сахнов).
Всего 40 уроков, 5 недель обучения и есть практика в Google Colab (ipynb)
🤔 Программа курса
— Неделя 1. А/B-тесты. Введение
— Неделя 2. Основы статистики. Параметрическое оценивание. Бутстреп
— Неделя 3. Основы статистики. Проверка гипотез
— Неделя 4. А/B-тесты. Базовый уровень
— Неделя 5. А/B-тесты. Повышение чувствительности. Обзор современных методов
Конечно же, я добавил еще лекции ШАДа по A/B тестированию, как же без них🍪 🍪
Ставьте🕺 , если нужны мысли про вайбкодинг в целом и как я это вижу в плане разработки
Если уже хватит апдейтов про сайт, ставьте😮
🥺 Пока вы здесь, киньте бустов (это бесплатно для Premium), плиз, чтобы я смог поменять фон и добавить больше эмодзи в реакции на постах
@zasql_python
Всего 40 уроков, 5 недель обучения и есть практика в Google Colab (ipynb)
— Неделя 1. А/B-тесты. Введение
— Неделя 2. Основы статистики. Параметрическое оценивание. Бутстреп
— Неделя 3. Основы статистики. Проверка гипотез
— Неделя 4. А/B-тесты. Базовый уровень
— Неделя 5. А/B-тесты. Повышение чувствительности. Обзор современных методов
Конечно же, я добавил еще лекции ШАДа по A/B тестированию, как же без них
Ставьте
Если уже хватит апдейтов про сайт, ставьте
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
7 106 17❤10 5
Про вайбкодинг
(*на картинке вайб котик)
О да, и до меня дошла эта тема. Особенно, когда вчера Cloudflare не очень хорошо себя чувствовал, из-за чего часть чатов была недоступна (Perplexity, ChatGPT и др.). Вот блин, пришлось руками код писать, проверка на компетенцию специалиста в современных реалиях. А отобрать у тебя ИИ, кто ты?👀
В общем, сам "термин", про который еще в феврале 2025 написал Andrew Karpathy. Суть в том, что все ошибки и вообще весь код загоняется в LLM до тех пор, пока он не начал работать. А сам в коде ты можешь даже не разбираться (зачастую так🐸 ), главное показать, что ты хочешь протестировать и хорошо написать промпт для модели. Руководство на русском прикреплю сюда. Даже начали делать какие-то конторы курсы по вайб-кодингу, весьма интересно 🤔
Мне удалось сделать сайт по сути таким образом: был подобран агент, идея, которая была реализована с помощью различных промптов, тестов, кучи дотюнивания и так по кругу. По сути ИДЕЯ самое ключевое (если мы не упираемся в детали разработки, определение зависимостей между проектами и переписыванием кода за современными языковыми моделями). Особенно, когда есть сложная архитектура.
Знаю ребят, кто использует LLM для прототипирования / питча идеи, ее визуализации и лучшей "продажи". А кто-то даже использует в качестве рабочего решения, которое за несколько дней выводится в прод. Звучит впечатляюще, особенно, если оглядеться 3-4 года назад, когда для реализации гипотезы или хотя бы визуала нужно было больше времени.
Ключевое: агенты не таблетка, так как сейчас встречается много сервисов / инструментов, которые похожи друг на друга. То есть для простых приложений снизился порог входа, но то, что отделяет годный продукт от обычного — идея. Ну и соответственно, возможность продать роляет, поэтому навыки в маркетинге (куда я изначально хотел метить, возможно, расскажу про это историю позже💃 ) будут как нельзя кстати.
Мое мнение: Гипотезы можно тестировать быстрее, но только тогда, когда вся система людей, ответственных за выкатку фичи в продукте, способна поддержать идею и быстро ее реализовать (в том числе разработка, аналитика, дизайнеры, продакты). Знание предметной области важно (например, по части аналитики) и нельзя просто бездумно делегировать ИИ (пока что😁 ), то есть с точки зрения написания кода (когда ты уже знаешь определенные паттерны) — это про ускорение процесса, а не про бездумное копирование 🍪 🍪 .
Вайбкодинг про скорость тестирования идей.
Давайте наберем 100+🕺 и я выкатываю следующий пост, кстати пишите в комментах о чем вам бы было интересно почитать)
🥺 Пока вы здесь, киньте бустов (это бесплатно для Premium), плиз, чтобы я смог поменять фон и добавить больше эмодзи в реакции на постах
@zasql_python
О да, и до меня дошла эта тема. Особенно, когда вчера Cloudflare не очень хорошо себя чувствовал, из-за чего часть чатов была недоступна (Perplexity, ChatGPT и др.). Вот блин, пришлось руками код писать, проверка на компетенцию специалиста в современных реалиях. А отобрать у тебя ИИ, кто ты?
В общем, сам "термин", про который еще в феврале 2025 написал Andrew Karpathy. Суть в том, что все ошибки и вообще весь код загоняется в LLM до тех пор, пока он не начал работать. А сам в коде ты можешь даже не разбираться (зачастую так
Мне удалось сделать сайт по сути таким образом: был подобран агент, идея, которая была реализована с помощью различных промптов, тестов, кучи дотюнивания и так по кругу. По сути ИДЕЯ самое ключевое (если мы не упираемся в детали разработки, определение зависимостей между проектами и переписыванием кода за современными языковыми моделями). Особенно, когда есть сложная архитектура.
Знаю ребят, кто использует LLM для прототипирования / питча идеи, ее визуализации и лучшей "продажи". А кто-то даже использует в качестве рабочего решения, которое за несколько дней выводится в прод. Звучит впечатляюще, особенно, если оглядеться 3-4 года назад, когда для реализации гипотезы или хотя бы визуала нужно было больше времени.
Ключевое: агенты не таблетка, так как сейчас встречается много сервисов / инструментов, которые похожи друг на друга. То есть для простых приложений снизился порог входа, но то, что отделяет годный продукт от обычного — идея. Ну и соответственно, возможность продать роляет, поэтому навыки в маркетинге (куда я изначально хотел метить, возможно, расскажу про это историю позже
Мое мнение: Гипотезы можно тестировать быстрее, но только тогда, когда вся система людей, ответственных за выкатку фичи в продукте, способна поддержать идею и быстро ее реализовать (в том числе разработка, аналитика, дизайнеры, продакты). Знание предметной области важно (например, по части аналитики) и нельзя просто бездумно делегировать ИИ (пока что
Вайбкодинг про скорость тестирования идей.
Давайте наберем 100+
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
Выбор доработки по практике для zasqlpython.ru
Писали некоторые ребята, что хотят видеть больше практики на сайте. Что ж, именно по продуктовым задачам можно это сделать, только нужно помочь определиться с форматом✏
😮 Первый формат: Практика прямо на сайте. В ячейке пишешь код на синтаксисе (SQL / Python) -> нажимаешь Run (смотришь на вывод) -> дальше сдаешь сам код, сравнивается с ответом
➕ Плюсы:
1. Всё внутри сайта. Удобство для пользователя, не нужно лишний раз переходить, как на литкоде, но продуктовые задачи.
2. Быстрая проверка, удобно решать прямо с мобилки/рабочего места, к пункту 1.
3. Можно делать мини-интерактив вроде анализов, фильтров и т.д.
4. Единый контекст. Понятный пайплайн решения.
5. Сразу видно результат выполнения кода на тех данных, что даны в задаче.
➖ Минусы:
1. Нужна база данных в фоне (или автосоздание семпла таблиц при запуске). Но как будто норм, если все будет развернуто локально, только вопрос куда будет обращаться пользователь, к заново созданной базе после каждой сессии?🤔
2. Нужно защищаться от вечных циклов, тяжёлых запросов и т.п (например, продумать таймаут, чтобы находчивые пользователи не сделали while True♾ , я уверен, что еще много всякого).
3. Поддержка требует бэкенда и ресурсов. Несколько датацентров нужно под это дело🤨 , правда 😐
🕺 Второй формат: открываешь Google Colab и делаешь задание, в которое вводишь ответ. То есть сам код и его выполнение в одном месте -> ожидается только ответ
➕ Плюсы:
1. Полная свобода: можно строить графики, делать SQL через SQLite, исследовать много всякого. Графики покрутить, с Gemini обмозговать, если нужно💅
2. Можно сохранить результат как мини-проект на GitHub👩💻
3. Сайт не нагружается, всё выполняется в Colab😏 , плюс для меня, но мб для кого-то критично.
➖ Минусы:
1. Нужно переходить на другую платформу. Да, сложно нажать по ссылке и выполнить задания, вдруг там вирусы, не ну а чего?❓
2. Не так все очевидно (если нет четкого ТЗ по ячейкам, можно закопаться и уйти в дебри). Если не будет четко описанного ТЗ, что считаем, чем пользуемся, для чего делаем, можно прийти в тупик. Но зато симулятор аналитика в реальной жизни получится🤣
Мне интересно понять: какой формат вы выберете?
😮 — Формат с ячейками прямо на сайте (есть окно для ввода кода)
🕺 — Формат с вводом варианта ответа (где-то в другом месте делаете самостоятельно)
😎 — Гибридный формат
Пишите в комментариях ваши мысли, буду рад почитать
@zasql_python
Писали некоторые ребята, что хотят видеть больше практики на сайте. Что ж, именно по продуктовым задачам можно это сделать, только нужно помочь определиться с форматом
1. Всё внутри сайта. Удобство для пользователя, не нужно лишний раз переходить, как на литкоде, но продуктовые задачи.
2. Быстрая проверка, удобно решать прямо с мобилки/рабочего места, к пункту 1.
3. Можно делать мини-интерактив вроде анализов, фильтров и т.д.
4. Единый контекст. Понятный пайплайн решения.
5. Сразу видно результат выполнения кода на тех данных, что даны в задаче.
1. Нужна база данных в фоне (или автосоздание семпла таблиц при запуске). Но как будто норм, если все будет развернуто локально, только вопрос куда будет обращаться пользователь, к заново созданной базе после каждой сессии?
2. Нужно защищаться от вечных циклов, тяжёлых запросов и т.п (например, продумать таймаут, чтобы находчивые пользователи не сделали while True
3. Поддержка требует бэкенда и ресурсов. Несколько датацентров нужно под это дело
1. Полная свобода: можно строить графики, делать SQL через SQLite, исследовать много всякого. Графики покрутить, с Gemini обмозговать, если нужно
2. Можно сохранить результат как мини-проект на GitHub
3. Сайт не нагружается, всё выполняется в Colab
1. Нужно переходить на другую платформу. Да, сложно нажать по ссылке и выполнить задания, вдруг там вирусы, не ну а чего?
2. Не так все очевидно (если нет четкого ТЗ по ячейкам, можно закопаться и уйти в дебри). Если не будет четко описанного ТЗ, что считаем, чем пользуемся, для чего делаем, можно прийти в тупик. Но зато симулятор аналитика в реальной жизни получится
Таким образом возникает трейдофф между удобством пользователя (всё на сайте, моментальная проверка) и сложностью реализации/поддержки (инфраструктура, защита, ресурсы)🤣 , ох уж этот ваш вайбкодинг
Мне интересно понять: какой формат вы выберете?
Пишите в комментариях ваши мысли, буду рад почитать
Сегодня, как и вчера я на Матемаркетинге, планирую выпустить пост саммари
👍
. Кто хочет пообщаться, пишите
✨
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
Прошли 2 дня Матемаркетинга…
Было очень приятно увидеть знакомые лица, пообщаться вживую и наконец-то выйти из Telegram хоть на пару дней😄
Если хотите — го накидаем много🕺 🕺 🕺 🕺 , а я расскажу свои впечатления, что понравилось, что удивило и сколько мерча удалось унести за все активности (их было много 👀 ).
Хочу собрать мини-обзор с докладами, которые зашли — так что пишите в комментах, кто был, что понравилось и что взять на заметку🙌
@zasql_python
Было очень приятно увидеть знакомые лица, пообщаться вживую и наконец-то выйти из Telegram хоть на пару дней
Если хотите — го накидаем много
Хочу собрать мини-обзор с докладами, которые зашли — так что пишите в комментах, кто был, что понравилось и что взять на заметку
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
HR: Расскажите про свой опыт в ML?
Ответ убил...
Пишите свой вариант для этой картинки в комментариях🔽
@zasql_python
Ответ убил...
Пишите свой вариант для этой картинки в комментариях
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM
Бот для проверки навыков продуктовых и дата-аналитиков.
Был я на стенде ММ'25 и мне зашла идея сделать квиз, но более масштабный, а не только для 10 вопросов. Также я видел у знакомых ребят подобный продукт, давно хотел реализовать, только на своей стороне с упором на продуктовую аналитику.
1. Только варианты ответов по кнопкам, никаких развернутых.
2. Можно собирать статистику по количеству правильных и неправильных вопросов.
3. Планирую это добавить на сайт для логического продолжения, чтобы точно всегда было под рукой.
Почему вам должно зайти?
1. Бесплатно
2. Больше упора на A/B, продуктовые кейсы, метрики и т.д. 🆎
3. Объяснение варианта ответа
4. Все в Телеграм, удобно, бесшовно
По поводу лого, если интересно. Сгенерировал в Figma AI по промпту, несколько раз закидывал. Изначально использовал классический вариант генерации через DALLE-3, но чет не зашло, так как мне нужен был лого, а тут прям понравилось. В общем, советую, кто будет делать для себя визуал (мб лого для канала, например, элементы на сайте и тд).
Ставьте
Если вы хотите добавить свои вопросы для собесов, прикрепляйте их сюда
Хочу добить 10 лвл канала, сейчас пока восьмой, но это уже неплохо (буст доступен для тех, у кого премиум — это одна кнопка и бесплатно), чтобы сделать обои в своем стиле + несколько прикольных эмодзи. Поэтому, пока вы здесь, нажмите кнопочку
@zasql_python
Please open Telegram to view this post
VIEW IN TELEGRAM