История A/B тестирования: от лечения цинги до цвета ссылок Google
Сегодня разберем историю A/B тестов — от первых экспериментов в медицине до современных бизнес-кейсов. Материал получился объемнее, чем изначально планировался, поэтому вынесла отдельно:
https://ubogoeva.github.io/R4Analytics/posts/history_of_AB_testing.html
В следующих постах разберем больше про первые A/B тесты в Amazon, Microsoft и других бигтехах.
Пишите в комментариях, что уже знали и что оказалось новым!
#stats #AB_tests #analytics
Сегодня разберем историю A/B тестов — от первых экспериментов в медицине до современных бизнес-кейсов. Материал получился объемнее, чем изначально планировался, поэтому вынесла отдельно:
https://ubogoeva.github.io/R4Analytics/posts/history_of_AB_testing.html
В следующих постах разберем больше про первые A/B тесты в Amazon, Microsoft и других бигтехах.
Пишите в комментариях, что уже знали и что оказалось новым!
#stats #AB_tests #analytics
ubogoeva.github.io
R4Analytics - История A/B тестирования: от лечения цинги до цвета ссылок Google
❤56🔥28👍7⚡1👏1
Ну как там с нормальным распределением для t-теста?
Уже завтра, 10 апреля в 19:00 МСК, будет долгожданная лекция про ненужность нормального распределения от лектория «Разрушители статистических мифов»!
🦖Миф №3: Ненормальное распределение требует ненормальных решений | Матвей Славенко
На встрече мы поговорим про то, откуда взялись проверки на нормальность, что с ними не так и что делать, если не проверять на нормальность.
Регистрация по ссылке, и еще я закину в комменты непосредственно перед началом ссылку на трансляцию.
Запись будет опубликована на сайте.
🔥 Эксклюзивный контент для моих подписчиков: администрация секретно ознакомилась с черновиками лекции, прикрепляю несколько слайдов оттуда и бонусные мемы. Приходите на лекцию онлайн, чтобы иметь возможность задавать вопросы, но запись тоже будет.
P.S. ААААААА наконец-то Матвей выпустит лекцию, с прошлого лета ждем! Дождались, ура!)))
Уже завтра, 10 апреля в 19:00 МСК, будет долгожданная лекция про ненужность нормального распределения от лектория «Разрушители статистических мифов»!
🦖Миф №3: Ненормальное распределение требует ненормальных решений | Матвей Славенко
На встрече мы поговорим про то, откуда взялись проверки на нормальность, что с ними не так и что делать, если не проверять на нормальность.
Регистрация по ссылке, и еще я закину в комменты непосредственно перед началом ссылку на трансляцию.
Запись будет опубликована на сайте.
🔥 Эксклюзивный контент для моих подписчиков: администрация секретно ознакомилась с черновиками лекции, прикрепляю несколько слайдов оттуда и бонусные мемы. Приходите на лекцию онлайн, чтобы иметь возможность задавать вопросы, но запись тоже будет.
P.S. ААААААА наконец-то Матвей выпустит лекцию, с прошлого лета ждем! Дождались, ура!)))
🔥66🎉18❤5👍1
Как вкатиться в продуктовую аналитику с научным бэкграундом?
Насколько важна сильная база в статистике?
На эти и другие вопросы отвечу на стриме с Юрой Борзило, он крутой продуктовый аналитик в Альфа банке, автор канала про A/B тесты и продуктовую аналитику: https://t.iss.one/y_borzilo
Напомню, что я раньше работала биоинформатиком в лаборатории, изучала генные сети фитогормонов растений. Теперь перекатилась в продуктовую аналитику в Литрес, провожу A/B тесты и исследования.
На стриме поговорим:
1. Что такое "Анализ генных сетей фитогормонов растений"?
2. Почему решила уйти из науки в в аналитику?
3. Что было самое сложное при поиске первой работы аналитиком?
4. В чем отличие использования статистики в науке и в аналитике?
5. Почему всем нужен реальный опыт A/B тестов даже если хорошо знаешь статистику?
6. Действительно ли надо упарываться рядовому аналитику в статистику или хватит какой-то базы?
Стрим состоится 16 апреля, в 19.00 МСК.
Ссылки на трансляцию пришлю в день проведения стрима, а также обновлю в этом посте:
а вот и она https://us06web.zoom.us/j/82861386388?pwd=gguHOFCxOwAQT5MzNK4t2aSaz98bDK.1, запись будет отдельно
Пишите вопросы в комментариях или во время стрима!
Насколько важна сильная база в статистике?
На эти и другие вопросы отвечу на стриме с Юрой Борзило, он крутой продуктовый аналитик в Альфа банке, автор канала про A/B тесты и продуктовую аналитику: https://t.iss.one/y_borzilo
Напомню, что я раньше работала биоинформатиком в лаборатории, изучала генные сети фитогормонов растений. Теперь перекатилась в продуктовую аналитику в Литрес, провожу A/B тесты и исследования.
На стриме поговорим:
1. Что такое "Анализ генных сетей фитогормонов растений"?
2. Почему решила уйти из науки в в аналитику?
3. Что было самое сложное при поиске первой работы аналитиком?
4. В чем отличие использования статистики в науке и в аналитике?
5. Почему всем нужен реальный опыт A/B тестов даже если хорошо знаешь статистику?
6. Действительно ли надо упарываться рядовому аналитику в статистику или хватит какой-то базы?
Стрим состоится 16 апреля, в 19.00 МСК.
Ссылки на трансляцию пришлю в день проведения стрима, а также обновлю в этом посте:
а вот и она https://us06web.zoom.us/j/82861386388?pwd=gguHOFCxOwAQT5MzNK4t2aSaz98bDK.1, запись будет отдельно
Пишите вопросы в комментариях или во время стрима!
🔥67👍5⚡3🤩3👎2
Статистика и R в науке и аналитике
Как вкатиться в продуктовую аналитику с научным бэкграундом? Насколько важна сильная база в статистике? На эти и другие вопросы отвечу на стриме с Юрой Борзило, он крутой продуктовый аналитик в Альфа банке, автор канала про A/B тесты и продуктовую аналитику:…
А вот и запись стрима
https://youtu.be/gqbuCF8B4Cg
https://youtu.be/gqbuCF8B4Cg
YouTube
Из науки в продуктовую аналитику. Стрим Юрия Борзило и Елены Убогоевой.
На стриме поговорим:
1. Что такое "Анализ генных сетей фитогормонов растений"?
2. Почему решила уйти из науки в в аналитику?
3. Что было самое сложное при поиске первой работы аналитиком?
4. В чем отличие использования статистики в науке и в аналитике?
5.…
1. Что такое "Анализ генных сетей фитогормонов растений"?
2. Почему решила уйти из науки в в аналитику?
3. Что было самое сложное при поиске первой работы аналитиком?
4. В чем отличие использования статистики в науке и в аналитике?
5.…
❤25🔥12👍5
История A/B тестирования: первые тесты в бигтехе
Продолжаем разбирать историю A/B тестов — начало в этом посте.
Сегодня рассмотрим первопроходцев A/B в современном понимании. Точно сказать, какой именно тест был самым первым, нельзя, но ранние примеры приходятся на начало 2000-х:
📱 Amazon:
Amazon позиционирует себя как data-driven компания, где тестируют самые минимальные изменения интерфейса. Уже в 2004 году Рон Кохави представил доклад об их тестах.
Грег Линден предложил показывать персональные рекомендации на этапе чекаута ("Похожие товары" перед оплатой). Старший вице-президент по маркетингу был категорически против, опасаясь, что это отвлечет пользователей от покупки и снизит продажи.
Однако Линден все равно запустил A/B тест, в котором вариант с рекомендациями победил с таким отрывом, что отказ от этой идеи стоил бы Amazon миллионы долларов.
🔍 Google:
Первый A/B тест провели в начале 2000х годов. UX-исследования показывали, что пользователи хотят видеть больше результатов поиска на странице: 20 лучше чем 10, 25 ещё лучше, 30 — идеально. Google провел A/B тест: в экспериментальной группе пользователям показывали 30 результатов поиска на одной странице.
Трафик в экспериментальной группе упал на 25% менее чем за шесть недель. Сотрудники задумались, почему это произошло. Одним из вариантов был парадокс выбора, когда пользователи из-за слишком большого количества вариантов не могут решить, что им выбрать.
Однако разгадка оказалась проста: скорость. Страницы с 30 результатами грузились дольше в среднем на 0.5 секунды, и этого оказалось достаточно, чтобы серьезно ухудшить пользовательский опыт, что повлекло за собой падение трафика и выручки. В результате Google остановился на 10 результатах поиска в выдаче, и это число используется до сих пор.
📱 Bing:
Сотрудник Bing предложил удлинить заголовки рекламы, добавив к ним первую строчку описания: группа A — короткий заголовок (Купить iPhone), группа B — длинный (Купить iPhone 5 с гарантией и доставкой). Идея казалась незначительной и полгода пылилась в бэклоге (очереди задач разработки), пока разработчик не решил её протестировать. Через несколько часов после старта теста сработал "revenue-too-high alert" — новый формат оказался "слишком хорош", подняв выручку на невероятные 12%. Это принесло Bing более $100M годового дохода в США, не ухудшив UX-метрики. Тест многократно повторяли, подтверждая результат (HBR, 2017).
📱 Netflix:
Тестировали обложки фильмов: группа A — стандартные постеры, группа B — персонализированные. Например, для фильма "Умница Уилл Хантинг" любителям романтики показывали кадры с Мэттом Дэймоном и Минни Драйвер, а фанатам комедий — с Робином Уильямсом, известным комиком. A/B тест показал, что персонализированные обложки значительно увеличили вовлечённость и персонализация стала стандартом Netflix (Netflix Tech Blog, 2017).
А вы замечали, что попали в A/B тест? Я недавно заметила, что я не попала в тестовую группу, когда у коллег изменился интерфейс гугл мита, а у меня нет. Однако примерно через неделю это изменение интерфейса доехало и до меня.
#AB_tests #analytics
Продолжаем разбирать историю A/B тестов — начало в этом посте.
Сегодня рассмотрим первопроходцев A/B в современном понимании. Точно сказать, какой именно тест был самым первым, нельзя, но ранние примеры приходятся на начало 2000-х:
Amazon позиционирует себя как data-driven компания, где тестируют самые минимальные изменения интерфейса. Уже в 2004 году Рон Кохави представил доклад об их тестах.
Грег Линден предложил показывать персональные рекомендации на этапе чекаута ("Похожие товары" перед оплатой). Старший вице-президент по маркетингу был категорически против, опасаясь, что это отвлечет пользователей от покупки и снизит продажи.
Однако Линден все равно запустил A/B тест, в котором вариант с рекомендациями победил с таким отрывом, что отказ от этой идеи стоил бы Amazon миллионы долларов.
Первый A/B тест провели в начале 2000х годов. UX-исследования показывали, что пользователи хотят видеть больше результатов поиска на странице: 20 лучше чем 10, 25 ещё лучше, 30 — идеально. Google провел A/B тест: в экспериментальной группе пользователям показывали 30 результатов поиска на одной странице.
Трафик в экспериментальной группе упал на 25% менее чем за шесть недель. Сотрудники задумались, почему это произошло. Одним из вариантов был парадокс выбора, когда пользователи из-за слишком большого количества вариантов не могут решить, что им выбрать.
Однако разгадка оказалась проста: скорость. Страницы с 30 результатами грузились дольше в среднем на 0.5 секунды, и этого оказалось достаточно, чтобы серьезно ухудшить пользовательский опыт, что повлекло за собой падение трафика и выручки. В результате Google остановился на 10 результатах поиска в выдаче, и это число используется до сих пор.
Сотрудник Bing предложил удлинить заголовки рекламы, добавив к ним первую строчку описания: группа A — короткий заголовок (Купить iPhone), группа B — длинный (Купить iPhone 5 с гарантией и доставкой). Идея казалась незначительной и полгода пылилась в бэклоге (очереди задач разработки), пока разработчик не решил её протестировать. Через несколько часов после старта теста сработал "revenue-too-high alert" — новый формат оказался "слишком хорош", подняв выручку на невероятные 12%. Это принесло Bing более $100M годового дохода в США, не ухудшив UX-метрики. Тест многократно повторяли, подтверждая результат (HBR, 2017).
Тестировали обложки фильмов: группа A — стандартные постеры, группа B — персонализированные. Например, для фильма "Умница Уилл Хантинг" любителям романтики показывали кадры с Мэттом Дэймоном и Минни Драйвер, а фанатам комедий — с Робином Уильямсом, известным комиком. A/B тест показал, что персонализированные обложки значительно увеличили вовлечённость и персонализация стала стандартом Netflix (Netflix Tech Blog, 2017).
А вы замечали, что попали в A/B тест? Я недавно заметила, что я не попала в тестовую группу, когда у коллег изменился интерфейс гугл мита, а у меня нет. Однако примерно через неделю это изменение интерфейса доехало и до меня.
#AB_tests #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Статистика и R в науке и аналитике
История A/B тестирования: от лечения цинги до цвета ссылок Google
Сегодня разберем историю A/B тестов — от первых экспериментов в медицине до современных бизнес-кейсов. Материал получился объемнее, чем изначально планировался, поэтому вынесла отдельно:
…
Сегодня разберем историю A/B тестов — от первых экспериментов в медицине до современных бизнес-кейсов. Материал получился объемнее, чем изначально планировался, поэтому вынесла отдельно:
…
🔥28👍11❤6
Что отражают усы (whiskers) на графике box-plot?
Final Results
6%
Стандартное отклонение (sd)
1%
Стандартную ошибку (se)
7%
Доверительный интервал (CI)
12%
Минимум и максимум
4%
10% и 90% данных
19%
Верхний и нижний квартили (Q1, Q3)
8%
Межквартильный размах (IQR)
30%
Наблюдаемые максимальные и минимальные значения от соответствующего квартиля в пределах 1.5 IQR
9%
Нет однозначного ответа
4%
Не знаю
🤔14❤2
Второй сезон лектория разрушителей статистический мифов открыт 🔥
13 мая, 19:00 МСК | Артемий Охотин
🦖 Миф №5: Рандомизация – смешать и не взбалтывать
На лекции мы обсудим, зачем нужна рандомизация, работает ли она на малых выборках, может ли она не получиться, и как правильно ее проводить!
Запись лекции будет опубликована на сайте: bioinf.me/stat_myths
В связи с праздниками пропустила первую лекцию второго сезона, ее можно посмотреть на сайте лектория:
🦖 Миф №4: Категорически категорично, или «просто разбей на группы» | Алексей Глазков
И еще через неделю будет моя лекция по визуализации данных, где в том числе разберем, как правильно интерпретировать боксплоты 😁, запись будет доступна, но по возможности приходите онлайн
20 мая, 19:00 МСК | Елена Убогоева
🦖 Миф №6: Визуализация – это просто красивые графики
Регистрация открыта до 20 мая 17:00 МСК: bioinf.me/stat_myths
До встречи!
13 мая, 19:00 МСК | Артемий Охотин
На лекции мы обсудим, зачем нужна рандомизация, работает ли она на малых выборках, может ли она не получиться, и как правильно ее проводить!
Запись лекции будет опубликована на сайте: bioinf.me/stat_myths
В связи с праздниками пропустила первую лекцию второго сезона, ее можно посмотреть на сайте лектория:
И еще через неделю будет моя лекция по визуализации данных, где в том числе разберем, как правильно интерпретировать боксплоты 😁, запись будет доступна, но по возможности приходите онлайн
20 мая, 19:00 МСК | Елена Убогоева
Регистрация открыта до 20 мая 17:00 МСК: bioinf.me/stat_myths
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍8
Правильный ответ на вопрос про боксплот: нет правильного ответа
Мнения в опросе разделились, побеждает ответ про максимальные и минимальные значения в пределах 1.5 IQR, а также довольно популярным оказался ответ про верхний и нижний квартили (на момент написания поста 31% и 19%, соответственно).
Однако я сама проголосовала за отсутствие однозначного ответа, так как в боксплоте могут быть разные настройки усов, поэтому нужно всегда подписывать, что означает ваш боксплот и читать обозначения. В большинстве случаев дефолтный боксплот будет действительно с наблюдаемым максимальным и минимальным значением от соответствующего квартиля в пределах 1.5 IQR, но могут быть и другие варианты.
В комментариях к опросу их обсудили, выношу их сюда в пост.
- Минимум и максимум: довольно часто встречаются боксплоты, где усы обозначают максимум и минимум, даже в статье Variations of Box Plots он именно такой (спасибо Максиму Кузнецову @bqmaks за ссылку на статью).
- 10% и 90% данных: в FastQC, биоинформатическом туле для контроля качества секвенирования, усы боксплотов обозначают 10% и 90% данных, цитата из документации:
Пример боксплотов оттуда на прикрепленной картинке
- Верхний и нижний квартили обычно обозначают сам ящик, а не усы, возможно популярность этого варианта объясняется тем, что люди невнимательно прочитали вопрос
- Все остальные варианты. Как было подмечено в комментариях, при желании в боксплоте можно настроить все что угодно, даже стандартное отклонение и доверительные интервалы, что конечно не рекомендуется делать.
На картинке к опросу боксплот соответствовал самому дефолтному варианту с 1.5 IQR, код для построения был такой:
Таким образом, наиболее близким к правильному ответу будет вариант, что усы боксплота соответствуют наблюдаемым максимальным и минимальным значениям от соответствующего квартиля в пределах 1.5 IQR, но могут быть и другие варианты, поэтому всегда нужно подписывать и проверять подписи ✍️
P.S. приходите 20 мая на лекцию по визуализации данных: https://bioinf.me/stat_myths
#base_stat
Мнения в опросе разделились, побеждает ответ про максимальные и минимальные значения в пределах 1.5 IQR, а также довольно популярным оказался ответ про верхний и нижний квартили (на момент написания поста 31% и 19%, соответственно).
Однако я сама проголосовала за отсутствие однозначного ответа, так как в боксплоте могут быть разные настройки усов, поэтому нужно всегда подписывать, что означает ваш боксплот и читать обозначения. В большинстве случаев дефолтный боксплот будет действительно с наблюдаемым максимальным и минимальным значением от соответствующего квартиля в пределах 1.5 IQR, но могут быть и другие варианты.
В комментариях к опросу их обсудили, выношу их сюда в пост.
- Минимум и максимум: довольно часто встречаются боксплоты, где усы обозначают максимум и минимум, даже в статье Variations of Box Plots он именно такой (спасибо Максиму Кузнецову @bqmaks за ссылку на статью).
- 10% и 90% данных: в FastQC, биоинформатическом туле для контроля качества секвенирования, усы боксплотов обозначают 10% и 90% данных, цитата из документации:
The upper and lower whiskers represent the 10% and 90% points
Пример боксплотов оттуда на прикрепленной картинке
- Верхний и нижний квартили обычно обозначают сам ящик, а не усы, возможно популярность этого варианта объясняется тем, что люди невнимательно прочитали вопрос
- Все остальные варианты. Как было подмечено в комментариях, при желании в боксплоте можно настроить все что угодно, даже стандартное отклонение и доверительные интервалы, что конечно не рекомендуется делать.
На картинке к опросу боксплот соответствовал самому дефолтному варианту с 1.5 IQR, код для построения был такой:
library(tidyverse)
library(palmerpenguins)
penguins %>%
filter(species == 'Gentoo') %>%
ggplot(aes(species, bill_length_mm))+
geom_boxplot()+
theme_minimal()
Таким образом, наиболее близким к правильному ответу будет вариант, что усы боксплота соответствуют наблюдаемым максимальным и минимальным значениям от соответствующего квартиля в пределах 1.5 IQR, но могут быть и другие варианты, поэтому всегда нужно подписывать и проверять подписи ✍️
P.S. приходите 20 мая на лекцию по визуализации данных: https://bioinf.me/stat_myths
#base_stat
5🔥30👍14❤7✍4
Как я перепутала средние чеки и ARPPU и заруинила несколько A/B тестов
Я работаю в команде платежей, поэтому основные A/B тесты у нас проводятся на последнем этапе воронки - от нажатия кнопки “Купить” до успешной оплаты. Мы используем конверсию в успешную оплату как ключевую метрику и ARPPU как вспомогательную, это достаточно стандартный подход.
Иногда бывает, что одна из метрик падает, а другая растет. Чтобы понять, что на самом деле происходит с выручкой, мы используем прогнозную финмодель. Мой коллега Рома читал про это очень крутой доклад на Aha-25 (ссылка вот, попозже я может напишу развернутый отзыв на конфу).
Небольшая сноска про термины 🤓:
Средний чек (Average Order Value, AOV) - это просто вся выручка, деленная на количество транзакций, то есть буквально среднеарифметическое.
ARPPU (Average Revenue Per Paying User) - средняя выручка на платящего пользователя.
Пример: пользователь 1 купил на 200р, пользователь 2 купил на 100р, потом еще на 300р. Тогда средний чек будет (200+100+300)/3=200, а ARPPU = (200 + (100+300))/2 = 300, так как платящих пользователей 2 в этом примере.
Есть еще метрика ARPU - Average Revenue Per User, средняя выручка на пользователя (включая тех, кто не заплатил).
ARPPU будет всегда больше чем средний чек, как минимум не меньше.
В контексте A/B тестов эти метрики считаются базовыми и разбираются на любом курсе.
Моя ошибка была в том, что я считала средние чеки (просто
Почему используется именно ARPPU как метрика в A/B тестировании?
В принципе, можно использовать разные денежные метрики в зависимости от поставленной задачи. В нашем случае мы рассматриваем ARPPU в связке с конверсией. Используя финмодель, эта связка помогает принимать решения не “на глазок”, а с прогнозом реальной выручки. Но только если метрики посчитаны правильно — теперь я это точно не забуду 🙃
#analytics #AB_tests
Я работаю в команде платежей, поэтому основные A/B тесты у нас проводятся на последнем этапе воронки - от нажатия кнопки “Купить” до успешной оплаты. Мы используем конверсию в успешную оплату как ключевую метрику и ARPPU как вспомогательную, это достаточно стандартный подход.
Иногда бывает, что одна из метрик падает, а другая растет. Чтобы понять, что на самом деле происходит с выручкой, мы используем прогнозную финмодель. Мой коллега Рома читал про это очень крутой доклад на Aha-25 (ссылка вот, попозже я может напишу развернутый отзыв на конфу).
Небольшая сноска про термины 🤓:
Средний чек (Average Order Value, AOV) - это просто вся выручка, деленная на количество транзакций, то есть буквально среднеарифметическое.
ARPPU (Average Revenue Per Paying User) - средняя выручка на платящего пользователя.
Пример: пользователь 1 купил на 200р, пользователь 2 купил на 100р, потом еще на 300р. Тогда средний чек будет (200+100+300)/3=200, а ARPPU = (200 + (100+300))/2 = 300, так как платящих пользователей 2 в этом примере.
Есть еще метрика ARPU - Average Revenue Per User, средняя выручка на пользователя (включая тех, кто не заплатил).
ARPPU будет всегда больше чем средний чек, как минимум не меньше.
В контексте A/B тестов эти метрики считаются базовыми и разбираются на любом курсе.
Моя ошибка была в том, что я считала средние чеки (просто
mean(revenue)
), но почему-то думала что это уже ARPPU, таким образом проанализировала несколько результатов тестов. Ошибку случайно заметил продакт, когда сверял исторические данные и увидел, что мои значения "ARPPU" по порядку величины подозрительно похожи на средние чеки 🤦♀️. Пришлось пересчитывать, благо принципиально выводы не поменялись, но несколько тестов были признаны неуспешными, а после пересчета оказалось, что все нормально.Почему используется именно ARPPU как метрика в A/B тестировании?
В принципе, можно использовать разные денежные метрики в зависимости от поставленной задачи. В нашем случае мы рассматриваем ARPPU в связке с конверсией. Используя финмодель, эта связка помогает принимать решения не “на глазок”, а с прогнозом реальной выручки. Но только если метрики посчитаны правильно — теперь я это точно не забуду 🙃
#analytics #AB_tests
Закрытый клуб маркетинговой и продуктовой аналитики. Доклады и конференции в мире MarTech и Продуктовой аналитики.
Matemarketing Education
Образовательная платформа
🔥45❤19👍6🙏2
🌱 Мендель, хи-квадрат и споры о статистике
В середине XIX века монах Грегор Мендель скрещивал сорта гороха и вывел знаменитые соотношения 3:1 и 9:3:3:1, которые стали фундаментом для понимания наследования признаков. Мы со школы знаем Менделя как отца генетики, и наверняка все помнят тот самый зеленый гладкий и желтый морщинистый горошек для иллюстрации законов дигибридного скрещивания.
В своей работе Мендель выбрал признаки, которые зависят только от одного гена, так называемые моногенные признаки — форма семян, цвет семян, высота стебля и тд, всего 7 признаков.
Мендель провёл десятки тысяч скрещиваний и получил соотношения 3:1 и 9:3:3:1. Это пример моногенного наследования — когда признак зависит от одного гена, и подчиняется простым законам, тем самым законам Менделя, которые назовут в его честь сильно позже:
1) Закон единообразия гибридов первого поколения: доминантный аллель подавляет рецессивный, и все гибриды первого поколения (F1) имеют одинаковый фенотип.
2) Закон расщепления признаков: при скрещивании гетерозигот (Aa × Aa) потомство делится в пропорции 3:1 по фенотипу и 1:2:1 по генотипу.
3) Закон независимого наследования признаков: при дигибридном скрещивании (два признака) гены наследуются независимо, давая соотношение 9:3:3:1 по фенотипу.
В целом можно сказать, что законы Менделя это “Hello world” от мира генетики. Во многих случаях они нарушаются, например если гены сцеплены, или если гомозиготы по рецессивному признаку не выживают, тогда расщепление будет другое. Однако было бы несправедливо сказать, что Менделю просто повезло наткнуться на удачный признак и удачный тип наследования, ведь был и неудачный опыт с ястребинкой, но это отдельная история.
Нас же интересует статистика.
В 1936 году Рональд Фишер, один из основателей современной статистики и синтетической теории эволюции, применил χ²-тест к данным Менделя и отметил, что результаты слишком близки к теоретическим пропорциям 3:1 и 9:3:3:1. Это вызвало подозрения.
Даже при моногенном наследовании должны были возникать отклонения от теоретических значений. Фишер предположил, что неизвестный ассистент Менделя мог неосознанно корректировать или отбирать данные, так как знал желаемое распределение.
Цитата Фишера:
По сути, Фишер обвинил Менделя в фальсификации данных, что вызвало бурные споры в научном сообществе, которые актуальны и сейчас (последнюю статью на эту тему нашла за 2019 год).
А что думают статистики сейчас?
Одна из ключевых современных работ — статья Pires & Branco (2010) в журнале Statistical Science. Авторы предложили простую, но элегантную статистическую модель, которая объясняет «слишком идеальные» данные Менделя без фальсификации.
Их гипотеза:
То есть если эксперимент давал пропорции хуже, чем предполагалось, его повторяли. А если новый результат был ближе к теории — брали его. Это не фальсификация, а unconscious bias, то есть неосознанная предвзятость.
Авторы показали, что такая модель:
- воспроизводит распределение p-value в данных Менделя,
- снимает подозрения в преднамеренной фальсификации,
- объясняет низкие χ²-значения лучше, чем честная выборка с независимыми тестами.
При этом они подчёркивают, несмотря на то, что замечание Фишера обосновано с точки зрения статистики, предложенная модель разрешает долгое противоречие между Менделем и Фишером, отцами современной генетики и статистики.
#stats
В комментарии закину фотографию из музея Менделя в Брно
В середине XIX века монах Грегор Мендель скрещивал сорта гороха и вывел знаменитые соотношения 3:1 и 9:3:3:1, которые стали фундаментом для понимания наследования признаков. Мы со школы знаем Менделя как отца генетики, и наверняка все помнят тот самый зеленый гладкий и желтый морщинистый горошек для иллюстрации законов дигибридного скрещивания.
В своей работе Мендель выбрал признаки, которые зависят только от одного гена, так называемые моногенные признаки — форма семян, цвет семян, высота стебля и тд, всего 7 признаков.
Мендель провёл десятки тысяч скрещиваний и получил соотношения 3:1 и 9:3:3:1. Это пример моногенного наследования — когда признак зависит от одного гена, и подчиняется простым законам, тем самым законам Менделя, которые назовут в его честь сильно позже:
1) Закон единообразия гибридов первого поколения: доминантный аллель подавляет рецессивный, и все гибриды первого поколения (F1) имеют одинаковый фенотип.
2) Закон расщепления признаков: при скрещивании гетерозигот (Aa × Aa) потомство делится в пропорции 3:1 по фенотипу и 1:2:1 по генотипу.
3) Закон независимого наследования признаков: при дигибридном скрещивании (два признака) гены наследуются независимо, давая соотношение 9:3:3:1 по фенотипу.
В целом можно сказать, что законы Менделя это “Hello world” от мира генетики. Во многих случаях они нарушаются, например если гены сцеплены, или если гомозиготы по рецессивному признаку не выживают, тогда расщепление будет другое. Однако было бы несправедливо сказать, что Менделю просто повезло наткнуться на удачный признак и удачный тип наследования, ведь был и неудачный опыт с ястребинкой, но это отдельная история.
Нас же интересует статистика.
В 1936 году Рональд Фишер, один из основателей современной статистики и синтетической теории эволюции, применил χ²-тест к данным Менделя и отметил, что результаты слишком близки к теоретическим пропорциям 3:1 и 9:3:3:1. Это вызвало подозрения.
Даже при моногенном наследовании должны были возникать отклонения от теоретических значений. Фишер предположил, что неизвестный ассистент Менделя мог неосознанно корректировать или отбирать данные, так как знал желаемое распределение.
Цитата Фишера:
"the data of most, if not all, of the experiments have been falsified so as to agree closely with Mendel’s expectations"
По сути, Фишер обвинил Менделя в фальсификации данных, что вызвало бурные споры в научном сообществе, которые актуальны и сейчас (последнюю статью на эту тему нашла за 2019 год).
А что думают статистики сейчас?
Одна из ключевых современных работ — статья Pires & Branco (2010) в журнале Statistical Science. Авторы предложили простую, но элегантную статистическую модель, которая объясняет «слишком идеальные» данные Менделя без фальсификации.
Их гипотеза:
Мендель мог из нескольких экспериментов публиковать только результаты с лучшим распределением, наиболее близким к теоретическому.
То есть если эксперимент давал пропорции хуже, чем предполагалось, его повторяли. А если новый результат был ближе к теории — брали его. Это не фальсификация, а unconscious bias, то есть неосознанная предвзятость.
Авторы показали, что такая модель:
- воспроизводит распределение p-value в данных Менделя,
- снимает подозрения в преднамеренной фальсификации,
- объясняет низкие χ²-значения лучше, чем честная выборка с независимыми тестами.
При этом они подчёркивают, несмотря на то, что замечание Фишера обосновано с точки зрения статистики, предложенная модель разрешает долгое противоречие между Менделем и Фишером, отцами современной генетики и статистики.
#stats
В комментарии закину фотографию из музея Менделя в Брно
2👍57❤24🔥14✍2
Отзыв о книге “Доверительное A/B тестирование” и фейлы перевода
Недавно дочитала эту книгу (в основном в переводе, но сверяясь с оригиналом). Книга очень крутая, настоящий must have для продуктовых аналитиков и продакт-менеджеров. Авторы буквально основатели A/B-тестирования в том виде, в каком мы его знаем.
Самые интересные и полезные темы для меня:
1. Введение, актуально не только для аналитиков, так как позволяет больше понять, почему не у всех бывает одинаковым интерфейс сайтов 😏
2. Этика A/B экспериментов, важная тема, которую мало обсуждают на курсах и в телеграм-каналах. Возможно, распишу про это подробнее в отдельном посте.
3. Про t-test и необходимо ли для него нормальное распределение выборки разобрано корректно, лучше чем в некоторых статистических пособиях. Более подробно про это была лекция от Института Биоинформатики.
4. Подводные камни A/B тестирования и способы их избежать: Sample Ratio Mismatch, сетевой эффект, парадокс Симпсона, необходимость A/A тестов и не только. Эти темы сейчас кажутся базовыми, так как много внимания уделяется на курсах, но во многом курсы и вдохновлены этой книгой.
5. Другие варианты экспериментов, когда A/B невозможен: Diff-in-Diff, interrupted time series и тд, неплохой обзор методов, но для глубокого изучения нужны дополнительные источники.
Еще мне было интересно почитать про историческое развитие метода, я даже вдохновилась написать про историю A/B задолго до появления интернета и бигтехов и первые A/B тесты в индустрии.
Но к сожалению перевод на русский от издательства ДМК Пресс оставляет желать лучшего.
Примеры ошибок в переводе:
– логи данных → данные журналов
– логарифмическое преобразование → преобразование журнала
– нулевая гипотеза → гипотеза нулевого значения или гипотеза о нуле
– статистически значимая разница → значительная разница (вот это по-моему одна из самых критичных ошибок)
– и множество мелких неточностей
В принципе в большинстве случаев понятно, о чем идет речь, плюс всегда можно посмотреть оригинал, тем не менее, такие ляпы затрудняют восприятие текста и вызывают недоверие к переводу.
Я бы рекомендовала читать книгу тем, кто хочет подтянуть именно продуктовую и методологическую часть A/B тестирования и повысить насмотренность. Но лучше иметь хороший бэкграунд в статистике и теории вероятностей, все-таки это не статистика и котики)
Пишите в комментариях, какие из вышеперечисленых тем хотелось бы разобрать подробнее!
#analytics #AB_tests
Недавно дочитала эту книгу (в основном в переводе, но сверяясь с оригиналом). Книга очень крутая, настоящий must have для продуктовых аналитиков и продакт-менеджеров. Авторы буквально основатели A/B-тестирования в том виде, в каком мы его знаем.
Самые интересные и полезные темы для меня:
1. Введение, актуально не только для аналитиков, так как позволяет больше понять, почему не у всех бывает одинаковым интерфейс сайтов 😏
2. Этика A/B экспериментов, важная тема, которую мало обсуждают на курсах и в телеграм-каналах. Возможно, распишу про это подробнее в отдельном посте.
3. Про t-test и необходимо ли для него нормальное распределение выборки разобрано корректно, лучше чем в некоторых статистических пособиях. Более подробно про это была лекция от Института Биоинформатики.
4. Подводные камни A/B тестирования и способы их избежать: Sample Ratio Mismatch, сетевой эффект, парадокс Симпсона, необходимость A/A тестов и не только. Эти темы сейчас кажутся базовыми, так как много внимания уделяется на курсах, но во многом курсы и вдохновлены этой книгой.
5. Другие варианты экспериментов, когда A/B невозможен: Diff-in-Diff, interrupted time series и тд, неплохой обзор методов, но для глубокого изучения нужны дополнительные источники.
Еще мне было интересно почитать про историческое развитие метода, я даже вдохновилась написать про историю A/B задолго до появления интернета и бигтехов и первые A/B тесты в индустрии.
Но к сожалению перевод на русский от издательства ДМК Пресс оставляет желать лучшего.
Примеры ошибок в переводе:
– логи данных → данные журналов
– логарифмическое преобразование → преобразование журнала
– нулевая гипотеза → гипотеза нулевого значения или гипотеза о нуле
– статистически значимая разница → значительная разница (вот это по-моему одна из самых критичных ошибок)
– и множество мелких неточностей
В принципе в большинстве случаев понятно, о чем идет речь, плюс всегда можно посмотреть оригинал, тем не менее, такие ляпы затрудняют восприятие текста и вызывают недоверие к переводу.
Я бы рекомендовала читать книгу тем, кто хочет подтянуть именно продуктовую и методологическую часть A/B тестирования и повысить насмотренность. Но лучше иметь хороший бэкграунд в статистике и теории вероятностей, все-таки это не статистика и котики)
Пишите в комментариях, какие из вышеперечисленых тем хотелось бы разобрать подробнее!
#analytics #AB_tests
5❤34👍17😁1
Загадка (все события вымышленны, любое совпадение случайно 😏):
Студент устроился джуном администратором баз данных в один известный бигтех
Проходит месяц. Наступил день зарплаты — а новичок за деньгами не приходит. Прошёл второй месяц, третий, четвёртый, а за зарплатой он так и не пришёл.
Стало его коллеге синьору интересно, что происходит. Он вызывает к себе этого студента и спрашивает:
— Ты что это за зарплатой не приходишь? Не нужна что ли?
— Зарплата?! Ой… А я-то думал, дали данные пользователей — и крутись как хочешь…
#stat_fun
Студент устроился джуном администратором баз данных в один известный бигтех
Проходит месяц. Наступил день зарплаты — а новичок за деньгами не приходит. Прошёл второй месяц, третий, четвёртый, а за зарплатой он так и не пришёл.
Стало его коллеге синьору интересно, что происходит. Он вызывает к себе этого студента и спрашивает:
— Ты что это за зарплатой не приходишь? Не нужна что ли?
#stat_fun
😁91💯6👀5🤔2❤1👎1
Сходила в гости к дружественному каналу "N айтишниц заходят в бар"
https://t.iss.one/n_it_girls/442
Немного рассказала про то, как попасть в аналитику данных, чуть подробнее про конкретные курсы и инструменты написала здесь https://t.iss.one/stats_for_science/105, а здесь больше про бэкграунд
#analytics
https://t.iss.one/n_it_girls/442
Немного рассказала про то, как попасть в аналитику данных, чуть подробнее про конкретные курсы и инструменты написала здесь https://t.iss.one/stats_for_science/105, а здесь больше про бэкграунд
#analytics
Telegram
N айтишниц заходят в бар
Они хотят знать, во что это выльется💸
По всем вопросам ☎️
https://forms.gle/6Wqszp7QqY2kyYm28
Дейтинг бот (работает на длинных каникулах) @N_dating_bot
По всем вопросам ☎️
https://forms.gle/6Wqszp7QqY2kyYm28
Дейтинг бот (работает на длинных каникулах) @N_dating_bot
🔥19❤10👍1