Диванные Данные
1.23K subscribers
42 photos
4 videos
30 links
Истории на диване от Lead Product Analyst

Присаживайся поудобнее, будем обсуждать карьеру в аналитике данных, собеседования и жизнь в IT. И саму аналитику, конечно же

Связь с автором @olya_na_divane
Download Telegram
5 подписок на Телеграм Премиум ⤴️

И снова на диване.


Как и обещала в воскресенье, в честь первой тысячи на канале разыгрываю 5 годовых подписок на Телеграм Премиум среди подписчиков канала.

Раньше таких активностей не делала, поэтому если у вас что-то не работает/отвалилось - пишите в комментарии, будем оперативно разбираться.

@Divan_data
Please open Telegram to view this post
VIEW IN TELEGRAM
295
ИИ и мошенники

И снова на диване.


У знакомого произошла история: пишет ему друг, что не хватило 12к на доставку заказа, просить занять до зарплаты. Записывает в телеграме видео-кружок, на котором объясняет ситуацию, используя все те фразы и выражения, которые всегда использовал в речи, с такой же интонацией. Знакомый был на работе, поэтому даже не стал вникать и перепроверять, перевёл 12к.

Оказалось, что телеграм-аккаунт его друга взломали мошенники, всю переписку и видео залили в нейросети, и на их основе нагенерили видео с просьбой занять денег и скинули в формате видео-кружка.

Поэтому если тебе скинули кружок с просьбой занять денег - перезвони человеку, спроси о чём-то, что может знать только он (желательно о чём-то, чего не было в соцсетях и в переписке).

🚨Будь осторожен! Не переходи по подозрительным ссылкам, не вбивай данные аккаунта где-либо, кроме официального приложения Телеграм. Если у тебя есть свой телеграм-канал, то для тебя это вдвойне важное правило, чтобы не украли канал.

#осторожно_на_диване
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯2810😭81
Кто-то начал заливать ботов после поста о мошенниках

И снова на диване.


Столкнулась с очень странной ситуацией - вчера после последнего поста мой канал начали заливать фейковыми подписчиками - ровно каждый час по 5-6 человек (см. фото), причём никакого привлечения подписчиков в этот момент времени не было.

Сидела всё утро разбиралась и вычищала этих ботов руками. Все ники странные, некоторые украинские. Возможно, это месть за предупреждение о мошенниках. 🤬

Для справки: за заливку фейковых подписчиков можно получить метку скам и даже блокировку канала, если боты начнут кидать жалобы. Так что это важно отслеживать, если у тебя есть свой канал.


Если заливка ботов продолжится, то на время сделаю канал приватным, а вступление в канал по заявке.

А если вдруг ты тоже сталкивался с такой проблемой, напиши в комментариях. Буду рада обсудить ⤵️

#осторожно_на_диване
Please open Telegram to view this post
VIEW IN TELEGRAM
19😭12🤯4
This media is not supported in your browser
VIEW IN TELEGRAM
Не перерабатывай в пятницу

И снова на диване.


Как пользоваться мемом?

1. Смотреть со звуком, но осторожно)
2. После просмотра плавно мигрировать из офиса в сторону дома

@Divan_data
😁26138👍1💯1
Какой у тебя уровень английского?
Anonymous Poll
7%
А1
11%
А2
27%
В1
31%
В2
17%
С1
3%
С2
4%
Не знаю английский
422
А теперь be honest. Какой у тебя уровень английского?
Anonymous Poll
6%
А1
15%
А2
30%
В1
28%
В2
13%
С1
3%
С2
4%
Не знаю английский
😁226💊4
Тестовое из одного банка

И снова на диване.


Лови тестовое задание по SQL из одного банка (не Сбер и не ТБанк). Схема БД на фото. Всего 6 задач ⤵️

1.1. Выделить поставщиков (Vendors), которые в 2021 году не продали ни одного зонта (зонты ищем в prod_desc).


1.2. Вычислить одним запросом среднюю стоимость заказа в разбивке по годам (из order_date) для американских (vend_country = ‘USA’) и неамериканких поставщиков.


1.3. Вывести адреса и имена покупателей, сделавших более 10 заказов.


1.4. Предположим, что все продукты делятся на 3 группы – зонты, диваны и шляпы (при этом в prod_desc указана по-русски и группа, и конкретная модель). Для каждой группы продуктов нужно вывести минимальную, максимальную и среднюю стоимость товара и среднее кол-во товаров такого типа в одном заказе.


1.5 Вывести имена покупателя и для каждого из них кол-во заказов, в которых фактическая цена продукта (orderitems.item_price) не равна изначальной цене (products.prod_price).


1.6. Одним запросом посчитать стоимость каждого заказа и разбить все заказы на корзины по стоимости: до 5000, 5000 – 10000, 10000 – 15000 , 15000 – 20000 и т.д. (верхняя граница неизвестна, продолжаем разбиение по 5000 до верхней границы, группа «от 20000 и более» не является верным ответом). Формат вывода: корзина (в любой понятной форме), кол-во заказов. Циклы не используем.


#тестовое_на_диване
Please open Telegram to view this post
VIEW IN TELEGRAM
1584
One hour to go

И снова на диване.


Напоминаю, что розыгрыш подписок на Телеграм-премиум состоится сегодня в 18:05. Не пропусти)
8🏆43❤‍🔥2
Диванные Данные
This media is not supported in the widget
VIEW IN TELEGRAM
18😭9👏6❤‍🔥2
История, которая повторится

И снова на диване.


Присаживайся поудобнее, сейчас будет небольшая история.

Давай вернемся на 30 лет назад в США середины 1990-х. В плеерах у молодежи играет Nirvana, по телевизору крутят первый сезон ситкома Друзья, а дети фанатеют по мультфильму Король Лев и первым видеоиграм.

В это же время в США происходит настоящий бум банкоматов. Да, банкоматы существовали и ранее, но только в 1990-е получили широкое распространение. Теперь в банкомате можно было не только снять наличные, но ещё и проверить баланс, и сделать перевод между счетами. Раньше все эти операции выполняли банковские служащие.

Казалось, развитие банкоматов приведёт к массовым сокращениям банковских кассиров. И действительно, число кассиров на филиал сократилось с 21 до 13 человек. Однако в результате содержание одного филиала подешевело, и банки открыли гораздо больше отделений. Общее число кассиров выросло, причём их основной задачей стал не счёт денег, а обслуживание и общение с клиентами – именно эти навыки стали высоко востребованными.

И только 20 лет спустя, когда автоматизация начала набирать новые обороты (интернет-банкинг и мобильные приложения), число кассиров начало падать: последнее время их занятость постоянно сокращается, и аналогичные тренды наблюдаются в десятках рутинных профессий (операторы кол-центров, секретари, кассиры в магазинах и др.)

И тут на сцену выходит прорывное развитие нейросетей. Мы получили для работы удобный инструмент, который берёт часть типовых задач и прочей рутины на себя, легко анализирует большие объемы информации и быстро находит баги в коде. Но ИИ пока не сильно автономен - без человека и его экспертизы в конкретном продукте получается слабый результат.

Тем не менее, если в моменте мы не видим угрозы радикальной автоматизаци рабочих мест в IT, это не значит, что этого не случится на горизонте 10 лет. Нейросети, безусловно, будут совершенствоваться, и чёрный лебедь прилетит, раньше или позже. Пирамида грейдов окончательно перевернётся: специалистов, выполняющих рутинные задачи, будет меньше всего, а преобладать в ней будут сеньоры. И чем дальше продвинутся нейросети, тем меньше будет пирамида у основания (меньше джунов).

💡Поэтому нам, чтобы не остаться у разбитого корыта, нужно уже сейчас качать те навыки, которые сложнее всего автоматизировать.

(продолжение следует)

#мысли_на_диване
@Divan_data
Please open Telegram to view this post
VIEW IN TELEGRAM
17👀742
Какие навыки не заменит ИИ

И снова на диване.


В посте выше обсудили, как нейросети могут повлиять на рынок труда. А как тогда подстраховаться от потери работы и какие навыки качать в эпоху ИИ?

1. Коммуникация

Самый важный навык. Люди любят общаться с живыми людьми и получать энергию от оффлайн-взаимодействий (да, даже интроверты)🐈. Этот навык можно разбить на две составляющие - на умение выстраивать доверительные отношения и на сторителлинг, то есть ясную и убедительную передачу идеи. Поэтому, как бы банально не звучало, качаем софт-скиллы.

2. Лидерские и стратегические навыки

Пока что все идет к тому, что командой из ИИ-агентов будет управлять человек, а не наоборот. А когда рутинная работа переходит к ИИ, главным становится вопрос, что именно нужно сделать и как это приоритизировать. Даже если ИИ предложит варианты решения проблемы, он не сможет взять на себя ответственность и принять финальное решение. Так что качаем навык запуска и ведения проектов, управления командами и принятия решения в условиях неопределённости.


3. Госуправление и политические навыки

Эти навыки пока что никто не отдаст на откуп ИИ. Сюда можно отнести навыки лоббирования, переговоров и построения коалиций, а также проведение сложных регуляторных и инфраструктурных инициатив. Очевидно, что в таких сферах долгое время будут работать люди, а не нейроагенты.

4. Глубокая узкоспециализированная экспертиза

Хотя ИИ может найти ответ на многие вопросы, сейчас он не способен заменить узких специалистов с большим опытом. Особенно, если их экспертиза связана со сферой, которая защищается государством от разглашения - например, безопасность или атомная энергетика.

5. Навыки разработки, обслуживания и развёртывания ИИ

Конечно же, один из главных навыков. Если не можешь победить - возглавь. Помимо разработки моделей и сложных технических навыков, сюда входит понимание сильных и слабых сторон моделей, интеграция ИИ-сервисов в рабочие процессы, аудит и отладка систем. Качай навыки работы с ИИ.

Качаешь ли какой-то из этих навыков?

#мысли_на_диване
@Divan_data
Please open Telegram to view this post
VIEW IN TELEGRAM
1243321
Вопрос на диване

Есть ли у тебя в команде код-ревью? Как часто твой код проверяют и в каких случаях?
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1😭1
И снова на диване.


Когда нет код-ревью, адекватность кода измеряется реакцией заказчика на то, что ты насчитал

#мем_на_диване
😁33💯721
Как пройти теорвер на собесе?

И снова на диване.


Классика собесов на теорвер - это задачи с кубиками, шарами, орлами и решками в различных извращенных вариациях. И задачи на теорему Байеса, конечно же.

Если не решаешь такие задачи регулярно, навык притупляется, и очередная задача вводит в ступор. Мне перед собесами помогает нарешивание задач и повторение теории. Всю интуицию по решению задач на теорвер я почерпнула на сайте Матпрофи (вот тут начало раздела по теорверу) и в случае необходимости возвращаюсь.

А теперь предлагаю тебе присесть на диван и вспомнить теорвер. И заодно размяться перед собесом, если ты сейчас в поиске. Всего 3 задачи, поехали:

🔜 Задача 1. Одновременно бросают 3 кубика с шестью гранями.
Какова вероятность, что хотя бы хотя бы на двух из трёх кубиков выпадет одно и то же число?

🔜 Задача 2. В A/B-тесте продуктовая команда смотрит 4 независимые метрики. Для каждой метрики изменение считают стат. значимым, если p-value < 0,05.
Какова вероятность получить стат. значимое изменение хотя бы по одной метрике, если на самом деле эффекта нет ни по одной метрике?

🔜 Задача 3. В городе 5% жителей болеют редким вирусом. Врачи разработали тест, который даёт положительный результат с вероятностью 90% (чувствительность = 90%), если человек болен. Если человек здоров, тест ошибочно даёт положительный результат с вероятностью 5% (специфичность = 95%). Алекс сдал тест, и результат оказался положительным.
Какова вероятность, что Алекс действительно болен?

Сохраняй задачи к себе или предлагай свое решение в комментариях ⤵️

#теорвер_на_диване
Please open Telegram to view this post
VIEW IN TELEGRAM
1143👍2
Решение теорвера на диване

И снова на диване.


Давай разберем задачи из поста выше. ⤴️

🔜 Задача 1. Одновременно бросают 3 кубика с шестью гранями. Какова вероятность, что хотя бы хотя бы на двух из трёх кубиков выпадет одно и то же число?

Сначала найдем общее кол-во исходов. Так как у нас 3 кубика с 6 гранями, то всего исходов будет 6 * 6 * 6 = 216. Проще всего найти вероятность противоположного события, а затем вычесть её из 1. В данном случае противоположное событие - это все три числа разные.

Посчитаем число исходов, когда все 3 кубика показывают разные числа, учитывая, что у нас 6 вариантов для первого кубика, затем 5 вариантов для второго, так как он не должен совпасть с первым кубиком, и 4 варианта для третьего кубика, так как он не должен совпасть с первыми двумя.

Считаем 6 * 5 * 4 = 120 исходов. Вычитаем из 1 и получаем искомую вероятность:

1 - 120/216 = 96/216 = 4/9 или примерно 0,44.

Здесь можно посчитать и по-другому - просто подобрать все подходящие варианты, не вычитая из 1. Нам подходят все варианты, где числа на 3-х кубиках одинаковые - это 6 исходов.

Плюс нам подходят те, где числа одинаковые на 2-х кубиках. Чтобы не считать здесь перебором, давай порассуждаем. Сначала выбираем число, которое будет повторяться, например, 1, а на 3-ем кубике учтем любое другое. Затем учтем перестановки.

Вариантов пар, которые совпадут на двух кубиках всего 6. На третьем кубике может выпасть 5 возможных чисел, чтобы они не совпали с парой кубиков. И еще нам нужно учесть все перестановки - то есть когда пара выпадет не на первых двух кубиках, а еще на 2-ом и 3-ем или на 1-ом и 3-ем. Возможных перестановок 3. Посчитаем:

6 * 5 * 3 = 90 исходов

Сложим исходы 6 + 90 и получим 96/216 или 4/9.


🔜 Задача 2. В A/B-тесте продуктовая команда смотрит 4 независимые метрики. Для каждой метрики изменение считают стат. значимым, если p-value < 0,05. Какова вероятность получить стат. значимое изменение хотя бы по одной метрике, если на самом деле эффекта нет ни по одной метрике?

Это классическая задача на множественное сравнение в АВ-тестах и критически важная, чтобы не допустить ложных выводов по итогам АВ. Здесь нам тоже проще посчитать противоположное событие и вычесть его из 1.

Нам нужно посчитать вероятность ошибки I рода хотя бы по одной метрике при условии, что все нулевые гипотезы истинны. Это то же самое, что из 1 вычесть вероятность, что по всем 4 метрикам мы не получим ложноположительного результата.

Давай по шагам. Для одной метрики вероятность не сделать ложноположительный вывод равна:

1 - 0,05 = 0,95

Метрики независимы, поэтому чтобы посчитать, что все 4 не покажут ложноположительный результат, нам нужно 0,95 перемножить 4 раза:

0,95^4 ≈ 0,8145

Теперь вычтем из единицы и получим вероятность хотя бы одного ложноположительного результата:

1 - 0,8145 = 0,1855

Итак, вероятность получить хотя бы одно значимое изменение по 4-м метрикам при отсутствии реального эффекта равна почти 20%. Помни об этом в АВ-тестах! На примере задачи отчетливо видно, что эта вероятность повышается при росте числа метрик.


🔜 Задача 3. В городе 5% жителей болеют редким вирусом. Врачи разработали тест, который даёт положительный результат с вероятностью 90% (чувствительность = 90%), если человек болен. Если человек здоров, тест ошибочно даёт положительный результат с вероятностью 5% (специфичность = 95%). Алекс сдал тест, и результат оказался положительным. Какова вероятность, что Алекс действительно болен?

Здесь классическая задача на теорему Байеса. Давай распишем условие задачи:

P(болен) = 0.05
P(здоров) = 0.95
P(положит. тест∣болен) = 0.9 (чувствительность теста)
P(положит. тест∣здоров) = 0.05 (ложноположительный результат)

Нужно найти P(болен∣положит. тест)

Посчитаем вероятнсость, что Алекс болен и получил положительный тест:

0,9 * 0,05 = 0.045

Теперь считаем полную вероятность положительного теста:

P(+) = P(+∣болен) * P(болен)+ P(+∣здоров) * P(здоров) = 0.9 * 0.05 + 0.05 * 0.95 = 0.045 + 0.0475 = 0.0925

Теперь разделим одно на другое:

0,045/0,0925 ​≈ 0.4865

То есть вероятность около 50%. Не очень надежный тест)
Please open Telegram to view this post
VIEW IN TELEGRAM
156👍3221
Как демотивирует успешный успех

И снова на диване.


- Как вообще жить? Все вокруг супер-успешные, много зарабатывают, путешествуют или запускают свой бизнес. Один я обычный чел и ничего в свои 27 не добился. (отрывок из реального диалога) 🐱

Думаю ты тоже видел в соцсетях тех супергероев, у кого уже в 23 года свой бизнес и квартира в центре Москвы. А еще зимовка каждый год в Таиланде и кругосветные путешествия. И эту картинку нам активно продают вопросом "А хочешь также?"

Вроде бы должно вдохновлять. Но после просмотра очередного поста в голову лезут мысли:

💬 Я ленивый?
💬 Почему я не могу так же?
💬Что со мной не так?

И вот вместо мотивации приходит зависть, самоедство и ощущение, что ты отстаёшь от какой-то абстрактной нормы. Парадокс в том, что вместо того, чтобы вдохновлять, успешный успех часто парализует. Кажется, если ты не стал миллионером до 30, не улетел на Бали с ноутбуком и не делаешь 10 дел до завтрака, то ты уже ничего в этой жизни не добьешься.

Забей и присядь на диван. 🛋 Помни, что путь у каждого свой, со своим темпом, смыслом и победами, которые не афишируют на публику. Ты просто живёшь свою жизнь и сравниваешь себя не с другими, а с самим собой в прошлом (если уж очень хочется сравнить).

Есть, кстати, годный лайфхак, который меняет качество жизни и позволяет избавиться от чувства вины, что ничего не делаешь. Начни делать по чуть-чуть. Вместо 10 задач на утро запиши 1 ключевую задачу или вообще половину/четвертинку задачи. Если давно хотел пройти какой-то курс, но откладывал, просто посмотри курс хотя бы 10-15 минут. 😲

Так ты начнешь медленно, но верно двигаться в сторону своих целей. И даже когда тебя покинут силы или день не сложится, ты будешь знать, что выполнил свой минимум и что день не прошёл бесследно. 👍

#мысли_на_диване
@Divan_data
Please open Telegram to view this post
VIEW IN TELEGRAM
52🤔661
Кого не заменит ИИ?

И снова на диване.


Для тех, кто пропустил последние новости - Microsoft выкатил результаты большого исследования по профессиям, которые заменит ИИ.

В список 40 профессий, в которых большую часть работы заберет на себя ИИ, вошли переводчики, историки, математики, журналисты, технические писатели, дата-сайнтисты, веб-разработчики и др. С полным списком можно ознакомиться по ссылке.

А среди тех, кому точно сейчас не стоит переживать о потере работы, можно назвать медсестер, хирургов, монтажников, бетонщиков, горничных, маляров и др.

Ставь 🔥, если не страшно, что тебя заменят

Ставь 🤕, если уже пошел на курсы маляров

#новости_на_диване
@Divan_data
Please open Telegram to view this post
VIEW IN TELEGRAM
3922👀51
Утренняя разминка

И снова на диване.


В одном городе за год родилось 65% мальчиков и 35% девочек, а во втором - 51% мальчиков и 49% девочек. Какой город больше?

#статистика_на_диване
31💯1