Заскуль питона (Data Science)
6.22K subscribers
110 photos
15 videos
4 files
142 links
Канал про Python, Data Science, SQL и многое другое

По вопросам сотрудничества и рекламе: @m459n9

Мемы: @ds_memes

Чат: https://t.iss.one/my_it_frogs
Download Telegram
Позже мы все поймем.

#мемы
🤡4🔥2
Заскуль питона (Data Science) pinned «Воины, стоит определиться кто вы. 💪🏼 Прочитать статью можно по ссылке Многие знакомые говорят, что основной отток идёт от DS к продуктовым аналитикам. Существует очень много разветвлений того, чем можно заниматься, но по стандарту для аналитика следующий…»
Всем привет, сегодня я прикреплю список материалов, которые можно использовать для первичного обучения:

🐍 Python.

1. Инди-курс по программированию на Python (проходится за 2-3 недели, рассказаны базовые понятия, есть сертификат)
2. "Поколение Python": курс для начинающих (достаточно растянут, по моему мнению, есть несколько уровней прохождения, если кто-то проходил, дайте фидбек)
3. ПИТОНТЬЮТОР (краткий справочник по Python, можно использовать для заучивания синтаксиса, понимания каких-либо операций и др.)

📤 SQL.

1. Интерактивный тренажер по SQL (достаточно хороший курс, много заданий, работа с таблицами, подзапросами)
2. Практическое владение языком SQL (сайт, такое ощущение, что 2007 года, на упаковку не смотрим, много классных заданий, оконные функции, агрегирующие, в общем все, что нужно)
3. Онлайн тренажер с упражнениями по SQL (сайт с микро-учебником по SQL, хорошие задание, можно практиковаться спокойно)
4. Памятка/шпаргалка по SQL (статья на Хабре, читается на одном дыхании)

📊 Статистика (тут не про коэффициенты брачности/смертности, если что)

Основы статистики. 1 часть. (ведет Карпов, сейчас у него есть своя школа по подготовке спецов в сфере аналитике данных, очень классный. Рассмотрены базовые вещи, проведение A/B тестов, тестирование гипотез и многое другое, что используется в аналитике 24/7)
У него также есть 2 части по основам статистики, можно просмотреть
Основы статистики. 2 часть.
Основы статистики. 3 часть.

🎲 Теория вероятностей

Теория вероятностей - именно научная теория вероятностей, сложно, но разобраться можно
Вероятность и статистика - плейлист на ютубе от препода Яндекс.Практикума, много примеров, смотрится на одном дыхании.

📍 A/B тесты

A/B-тесты - что такое и как использовать? - неплохая статья для начала

🤖 Машинное обучение (very hard для новичка)

Машинное обучение для людей - статья, где рассказаны основные методы машинного обучения (минус в том, что они не подкреплены примерами из Python)
Введение в Data Science и машинное обучение - курс от того же Анатолия Карпова, который разбирал статистику, очень классный курс по введению

#база
5🔥1🤡1
Я подкрался незаметно...

В общем, для того чтобы кодить было приятно, а главное, понятно, читайте этот пост. Это база, через которую должен пройти каждый уважающий себя питонист. Короче, тема такая, вкратце объясняю.

У нас есть Python, мы заходим вот сюда и качаем самую последнюю версию.

Спросите меня, вроде бы все просто, к чему пост? Дело в том, что сам по себе Python - это подобие командной строки, первый раз было страшно...

Никто не работает так, потому что всё непонятно. Все используют какое-либо окружение, оболочку, об этом пост.

Выделяют несколько оболочек, я привык работать с Jupyter'ом, но есть еще и Google Colab.

Вроде бы красиво, теперь давайте устанавливать.

Если вы за Jupyter notebook и склоняетесь больше к нему, то вам сюда (тык)

Если вы за colab, то можете сейчас запускать и делать что-то)

Я пользовался 2-мя окружениями, больше нравится jup (можете посмотреть, что такое condas, он включается в себя jup и другое, если хотите, конечно же (тык)).

Различия можете посмотреть тут

#база
👍2🔥2
P.S: есть ещё и PyCharm, про него можете отдельно почитать. Я говорю именно про оболочку написания кода в виде ноутбука поблочно.
СТАТЬЯ ПРО 20 статистических методов, используемых при анализе данных. Здесь указана база по статистике, которая используется для анализа данных (но это не точно) .

Можете прочитать статью на Дзене тут

P.S: Здесь указано применение в Python'e с точки зрения использования различных библиотек, о которых, возможно, вы пока не знаете. Советую на примере этого сайта просмотреть основные показатели, которые используют аналитики.

#статистика #python #библиотеки #дополнительно
👍5
Я прогаю на питоне, я классный, должен знать очень много, хочу получать много денег, но что нужно уметь делать?

Ответ: Гуглить и учиться!

Гуглить? Серьезно? На самом деле, да. Потому что суть аналитиков заключается не только в имеющихся знаниях, знании синтаксисов, но и в адаптации чужого кода под свой. Например, вам нужно узнать количество уникальных пользователей, которые зарегистрировались на курс по Питону. К кому вы пойдёте с этой проблемой? Правильно, к гуглу. Вопрос может строится таким образом: how I can count unique values in Python? (Советую сразу привыкнуть писать на английском, потому что на зарубежных источниках больше информации + можно заодно подтянуть английский на уровне чтения документации, разборов интересующего вас вопроса).

Так что, гуглите, друзья, это вам пригодится в дальнейшем! Но и не забывайте о знаниях, ведь не все держится на одном гугле)

P.S: Также смотрите официальную документацию Python и того, что вы используете

#советы
👍5🤡2
❗️NAVIGATION ❗️

Всем привет, теперь на нашем канале будет навигация, с помощью которой вы можете легко ориентироваться по блокам:

#база - то, с чего нужно начать путь в аналитике, работе с данными

#дополнительно - дополнительные материалы, которые периодически будут выкладываться

#советы - то, что знаем мы и то, что нам советовали, когда только начинали свой путь

#мемы - ну тут всё понятно, посмотреть приколы, постараться понять суть, тоже полезно)

#чат - ссылка на чат

#отидо - пошаговое изучение всего того, что нам нужно
👍1
Всем доброй ночи! НАДО отдыхать)

#мемы
2
Что такое библиотеки и с чем их едят?

Возможно, вы слышали о том, что существуют какие-то библиотеки на Python, может и нет. Суть такая, что библиотека - это определенный модуль, который позволяет работать с данными максимально приятно и удобно.

Например, у нас есть датасет (набор данных) на 5 млн. строк. Спросите, такое реально? Да, конечно. Аналитики часто сталкиваются с подобным объемом данных. Но вот незадача, Excel поддерживает 1 048 576 строк, что достаточно мало для нас. Представьте, что тимлид выгружает нам данные в csv формате, что делать?

Для работы с данными используются такие библиотеки как:

🐼 Pandas (не панда, panel data), который позволяет работать с таблицами, загружать и выгружать данные в разных форматах, основная библиотека. Общепринятая аббревиатура: pd
Ссылка на документацию
🔹 Numpy позволяет работать с многомерными массивами, матрицами, применять методы линейной алгебры и многое другое, основная библиотека. Общепринятая аббревиатура: np
Ссылка на документацию

Для визуализации данных используем:

📈 Matplotlib - диаграммы, гистограммы и прочее.
Ссылка на документацию
🌊 Seaborn - продвинутая визуализация. Общепринятая аббревиатура: sns
Ссылка на документацию

Это основные библиотеки, которые используется при анализе данных. Пока мы не затрагиваем библиотеки, которые относятся к машинному обучению.

P.S: Большой массив данных также может быть обработан с помощью запросов SQL, здесь говорится только про Python
P.P.S: Вспоминаем пост про помощь гугла, умению искать информацию в интернете и разбираемся с библиотеками. Можно для этого использовать Youtube, Google и др.

#база
5
Всем привет! Прикрепляю ссылку на чат данного канала для того, чтобы каждый из вас мог общаться, обсуждать интересующие вопросы.

Пожалуйста, без флуда)

https://t.iss.one/+GSA00LI9DYwwYTgy

#чат
Ранее я затрагивал знание английского языка, поскольку код, документация, большая часть информации представлены именно на нём.

Главное понимать, что английский вам нужен на уровне чтения документации, использовании различных терминов и т.д. (он значительно отличается от разговорного).

Неплохой канал открыл в своё время, где можно попрактиковаться в запоминании IT-слов, если так можно выразиться.

Ссылку прикрепил ниже ⬇️
https://t.iss.one/+MBClkdw4fPE5Yzky

Вообще, это очень важный скилл, поскольку Python, SQL такие языки программирования, синтаксис которых максимально прост, но при этом прост для тех, кто понимает о чем идёт речь.

Например, синтаксис SQL:

SELECT *
FROM Table1
WHERE col1 > 0

Выбери всё из таблицы где значение > 0. То же самое с Python на уровне написания циклов:

for i in range (10):

Для i в диапазоне…

Ну вы поняли.

Можно пробовать практиковать английский как угодно, но, по моему мнению, самый эффективный метод - просмотр специальных видео, заточенных под вашу сферу, на английском языке с английскими субтитрами.

#советы
🔥7👍1