Аналитика данных / Data Study
8.49K subscribers
404 photos
38 videos
24 files
331 links
Сайт: https://datastudy.ru/
По всем вопросам: @daniildzheparov

Про аналитику и инженерию данных

Вакансии: https://t.iss.one/data_vacancy
Книги: https://t.iss.one/analyst_books
Download Telegram
Ситуация прям очень хорошо описывает необходимость создания документации сделанной работы.

НЕ ВСЕГДА достаточно оставлять комментарии в коде или SQL-запросах при работе с данными. Важно помечать преобразования, условия фильтрации и взаимосвязей (джойнов) данных в понятном и структурированном формате, чтобы даже через месяц можно было посмотреть на доку и вспомнить что было сделано 😁.
👍33🔥4😁32
Индексы в БД

🔎 Индексы - структура данных в базе, которая позволяет определить положение необходимых данных в базе с более высокой скоростью выполнения запросов к БД.

Пример для понимания: представьте, что вы ходите по торговому центру с целью найти магазин X. Если вы будете обходить весь торговый центр в поисках, пытаясь найти магазин по вывеске, это будет очень долго. Гораздо проще иметь в торговом центре карту или схему расположения магазинов с номерными знаками каждого магазина. Вот эти номерные знаки на карте магазинов возле их названия и будут подобием индексов в базе данных.

Зачем нужны индексы:
- более быстрый поиск необходимых данных внутри таблицы
- фильтрация данных по столбцу с индексом происходит быстрее
- объединение данных из таблиц, если в условиях объединения есть столбцы с индексами
- сортировка выборок данных также может ускориться при помощи сортировки по полю с индексом

Синтаксис создания индекса:
CREATE INDEX index_name ON table_name (column_name)

📍Это один из частых вопросах на собеседованиях, поэтому нужно понимать что такое индексы и как их можно применять

Полезные ссылки для знакомства с индексами:

- Что такое индексы (статья)
- Как создавать индексы в PostgreSQL (статья)
- Индексы (видео)
- Индексы для оптимизации SQL запросов (статья)
👍23🔥71
Недавно скидывал вам книгу от Ральфа Кимбалла про хранилище данных. Теперь почитайте про Data Lakehouse от Билла Инмона (краткий документ на английском)
🔥6
Bill Inmon / Building the Data Lakehouse

"The data lakehouse architecture presents an opportunity comparable to the one seen during the early years of the data
warehouse market. The unique ability of the lakehouse to manage data in an open environment, blend all varieties of
data from all parts of the enterprise, and combine the data science focus of the data lake with the end user analytics of the data warehouse will unlock incredible value for organizations."

Скачать книгу
🔥4👍1
Время летит быстрей с возрастом…

Вам не кажется, что чем старше ты становишься, тем быстрей пролетают дни/недели/года?

Вроде только недавно планировал отпуск и собирал сумки 🧳 , а все так быстро пролетело.

Только недавно кажется праздновали Новый Год и планировали лето, а за окном уже осень 🍂

Еще смотря на стажеров с их началом учебного года понимаю, что раньше успевал учиться, работать, создавать и вести свои курсы, при этом учеба занимала большой пласт времени.
А сейчас постоянной учебы нет, а времени кажется еще меньше стало по ощущениям чем было раньше
👍2516😁2
Сентябрь - время новых начинаний и начала обучения 📚🤓

Это у нас заложено видимо на уровне биологических часов после обучения в школе и университете. Лично я всегда в сентябре чувствую потребность в знаниях. Вчера выбирал интересные для себя курсы, хочу прокачаться в позиции tech lead, также хочу научиться на новом уровне писать ботов, ну и конечно направление аналитики не осталось без внимания. Есть потребность развиваться в 2 векторах:
- hard техничка (инжиниринг данных и dba)
- менеджмент

Остается еще курсы по игре на барабанной установке найти и буду укомплектован 😅
🔥21👍43
С праздником, друзья 🧑‍💻👩‍💻 🎉

Сегодня празднуют день программиста, всех причастных тоже поздравляю)
Ну и чтобы была польза, ловите ссылку на шпаргалку по git командам, которые пригодятся всем в IT вне зависимости от специализации

Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉13👍3🔥3
Вредные советы по работе с данными. Если вы сломать решили всю отчетность у коллег

✏️ Не используйте стандартов — Творчество важней всего
✏️ Данные не изучайте, так грузите. Бизнес разберется сам
✏️ Про проверки и ошибки Вы не думайте впустую: Пусть искрится и горит В закромах системы

Статья с юмором
👍10
Мысли вслух

В последнее время очень много рефлексирую и анализирую свое поведение, настроение, взгляд на мир и меняющиеся планы 🧠
Немного поделюсь накопившимся.

Прошлый год оказывается выдался очень активных на события в профессиональной и личной жизни, даже дух захватывает когда все вспоминаю
🎓закончил магистратуру
🤵‍♂️ женился
✍️ поменял место работы
и много других ярких моментов и достижений)

Даже несмотря на это казалось, что я делаю меньше чем могу, что-то не успеваю. В общем понял что словил FOMO (fear of missed opportunity - страх упущенной возможности).

Но анализируя текущий год с намного меньшим количеством выдающихся событий и более простым и приземленным отношением ко всему происходящему, понимаю, что все зависит от приоритетов. Тот год и этот отличает меня набором приоритетов.
Если еще год назад было нормой после работы ехать на пары, а после пар садиться за свои проекты и курсы. То в этом году после работы я хожу в зал, гуляю с женой, и только в отдельные периоды времени активно занимаюсь проектной работой.

Конечно есть и свои внешние факторы, повлияющие на такой изменение приоритетов, но об этом расскажу как-нибудь отдельно, как и возвращающееся часто чувство FOMO формата "лучше бы новый курс записал, чем потратил время на прогулку".
Увы, но мне дается слишком тяжело ценить момент, а не думать постоянно планами активностями на будущее 🤷‍♂️

Немного сумбурно получилось, но я думаю часть людей узнают себя в этом посте 👍
👍39🔥6
Вчера после работы гуляли и зашли в книжный магазин. Нашел много интересных книг, но покупать их там конечно же не стал, ведь на озоне они в 2 раза дешевле)
Заказал пока только «Мама, я тимлид», после прочтения поделюсь своими впечатлениями
👍37🔥124
Хочется пожелать всем замечательной рабочей недели и чтобы вы не испытывали стресс как и эти котики 😉
27🔥9👍6😁2
Где искать вакансии с анализом данных

Привет! Это статья будет полезна начинающим специалистам по анализу и работы с данными в формате сборника ресурсов для поиска вакансий.

Статья
👍10🔥3
Фреймворки Python с параллельной обработкой данных

Часто на практике возникает потребность обрабатывать большие объемы данных, либо работать с большим набором запросов к сервису. Делать это в один поток выполнения кода не всегда эффективно и быстро, а сделать эту работу параллельной помогают различные фреймворки или ETL инструменты.

Читать статью про фреймворки Python для параллельной обработки данных
👍4🔥41
Оконные функции простым языком - Фреймы (часть 2)

Спустя 2 года после написания первой части статьи наконец дошли руки до второй части.

🚨 Материал исключительно для новичков в SQL и применении оконок, опытные SQLисты проходите мимо. А то там в комментариях уже начали накидывать сложные кейсы, что я их в статье не указал, и вообще не расписал учебник вместо статьи со всей теорией и практикой в одном месте 😅

Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👍125
Это кажется ужасным поступком со стороны компании поступить так со своими сотрудниками, несмотря на все санкционное давление 😔

Надеюсь найдутся правильные правовые рычаги компенсации для сотрудников после таких поспешных действий компании 💪
👍29