AI на дровах 🪵
237 subscribers
76 photos
19 videos
1 file
130 links
Привет! Меня зовут Семён, я работаю в сфере ML и аналитики данных, пишу в блог nerdit.ru статьи о своем опыте и том, что может пригодиться начинающим в начале их пути изучения больших данных.

👾HSE ML Unit Head⚡️
❤️Litres DS Team
Download Telegram
Рекомендательные системы - это мощный инструмент, который помогает нам справляться с информационным перегрузкой и находить интересующий нас контент. Они основаны на анализе наших предпочтений и поведения, предлагая нам наиболее подходящие варианты.
https://nerdit.ru/recommend-systems/
👍1
Привет, друзья! Сегодня я хочу поделиться с вами интересной функцией в библиотеке Pandas - GroupBy. Если вы занимаетесь анализом данных или работаете с таблицами, то, скорее всего, уже слышали об этой мощной функции. Давайте погрузимся в мир группировки данных с Pandas GroupBy и рассмотрим, как она может помочь вам в ваших проектах.
https://nerdit.ru/pandas-groupby/
#pandas
Создание чат-бота для Телеграм на Python – это увлекательное занятие, которое открывает перед вами огромные возможности. В этом посте мы рассмотрим основные шаги, которые вы должны произвести для создания своего бота.
https://nerdit.ru/telegram-chat-bot-python/
Работа с Excel в библиотеке Pandas предоставляет мощные инструменты для обработки и анализа данных. При помощи функций Pandas, мы можем импортировать данные из Excel-файлов, выполнять различные операции, такие как фильтрация, сортировка, группировка и агрегация данных, а также экспортировать измененные данные обратно в Excel-файлы.

Это значит, что мы можем автоматизировать и ускорить рутинные задачи, связанные с обработкой данных в Excel. Вместо ручного копирования и вставки данных, мы можем использовать функции Pandas для быстрой и эффективной обработки больших объемов информации.

К примеру, мы можем использовать Pandas для фильтрации данных и выбора только нужных строк или столбцов. Затем мы можем применить операции агрегации, чтобы получить суммарные значения, средние значения или любую другую статистику для наших данных.

#pandas #excel

Перейти к посту: https://nerdit.ru/excel-pandas/
Прогнозирование временных рядов: анализ и применение методов машинного обучения

Прогнозирование временных рядов является важной задачей в сфере анализа данных и принятия решений. Временные ряды представляют собой последовательность данных, упорядоченных по времени, и включают такие области, как финансовые рынки, погода, продажи и другие.

https://nerdit.ru/time-series-modeling-techniques/
Pandas dataframe и как его использовать для анализа данных

Pandas - это мощный инструмент для работы с данными в Python. Он предоставляет структуры данных, такие как DataFrame, которые облегчают анализ и манипуляцию данными.

https://nerdit.ru/pandas-dataframe/
Привет, друзья! Сегодня хочу поговорить с вами о знаменитом фреймворке Django. Django - это мощный инструмент для создания веб-приложений на Python, который позволяет разработчикам работать быстро и эффективно. Если вы только начинаете знакомство с Django, то вас ждёт захватывающее путешествие в мир веб-разработки.

Django предлагает гибкую архитектуру, встроенную административную панель, удобную работу с базами данных и множество других полезных инструментов. Этот фреймворк идеально подходит как для небольших проектов, так и для крупных веб-приложений.

Если вы хотите узнать больше о том, как начать работу с Django, оставайтесь с нами! Мы собираемся исследовать его возможности, создавать увлекательные проекты и делиться полезными советами. Держите руку на пульсе и готовьтесь к захватывающему погружению в мир Django. До скорой встречи!
#django
Первый проект на Django: Полное описание и код
Django - это мощный фреймворк для создания веб-приложений на Python. Создание своего первого проекта на Django может быть захватывающим и познавательным опытом. Давайте создадим простое веб-приложение для управления списком задач.
https://nerdit.ru/piervyi-proiekt-na-django-polnoie-opisaniie-i-kod/
#django
Google выпустил опенсорс версию Gemini

Новую модель Гугла, с открытыми весами и коммерческой лицензией, зовут Gemma. LLM доступна в 2х вариантах - 2B (работает на телефоне) и 7B (gpu).

7B модель по качеству обгоняет Мистраль 7B v0.1 и почти догоняет Llama 2 70B (на LLM Leaderboard).

Дать задание Instruct модели можно тут

Обратите внимание, что это (пока что) не чат-бот, а модель которой нужно давать инструкции (например напиши email)

🤗
Блог-пост
🖥 Блог-пост
👍1
Как можно использовать python в SEO?

Питон, как язык программирования, может быть чрезвычайно полезным инструментом в области SEO. Он позволяет автоматизировать различные задачи, связанные с поиском и анализом ключевых слов, сбором данных о поисковой выдаче, а также созданием отчетов о SEO-показателях.

https://nerdit.ru/kak-mozhno-ispolzovat-piton-v-seo/
Pandas - это библиотека Python, предназначенная для обработки и анализа данных. Она предоставляет мощные инструменты для работы с табличными данными, включая методы очистки данных. Очистка данных - это важный этап анализа данных, который включает в себя удаление или исправление ошибочных значений, обработку пропущенных данных и преобразование данных в формат, удобный для анализа.
https://nerdit.ru/mietody-ochistki-dannykh-v-pandas/
Привет, друзья! 🚀 Сегодня хочу поделиться с вами мыслями о том, почему изучение Python и анализа данных может стать одним из лучших вложений в ваше будущее.

Python - это не просто язык программирования, это целый новый мир возможностей. Он открывает двери в такие сферы, как веб-разработка, автоматизация, машинное обучение и, конечно же, анализ данных. Изучение Python - это как получение универсального ключа, который подходит к множеству замков. 🗝

А анализ данных - это навык, который позволяет превратить сырые данные в ценные инсайты и знания. В мире, где каждую секунду генерируются терабайты информации, умение видеть скрытые закономерности и выводы - это как иметь суперспособность. 🦸‍♂️

Вот несколько причин, почему стоит начать изучать Python и анализ данных уже сегодня:

- Востребованность. Специалисты в области данных - одни из самых востребованных на рынке труда.
- Универсальность. Python используется во многих отраслях, от финансов до биотехнологий.
- Доступность. Множество ресурсов и сообществ готовы помочь вам на пути обучения.
- Гибкость. С Python вы можете работать с различными типами данных, будь то текст, изображения или числовые данные.
- Инновации. Знание Python открывает путь к работе с новейшими технологиями и методиками.

И помните, что начать никогда не поздно. Каждый проект, каждый анализ, каждая написанная строка кода приближает вас к мастерству. 🌟

Не бойтесь начать, и вы увидите, как новые знания преобразят вашу карьеру и мышление. Давайте учиться вместе и развивать мир данных! 📊💡

#Python #DataAnalysis #Обучение #Карьера #Инновации
Привет, друзья!

Сегодня я хочу поделиться с вами полным гайдом по удалению столбцов в библиотеке Pandas. Если вы когда-либо сталкивались с необходимостью избавиться от определенных столбцов в своем DataFrame, то эта информация будет вам полезна.

Мы рассмотрим различные способы удаления столбцов с примерами кода и объяснениями. Это поможет вам освоить различные подходы и выбрать наиболее подходящий в конкретной ситуации.

Давайте вместе разберемся в этой важной теме и научимся уверенно удалять столбцы в Pandas!
https://nerdit.ru/udalieniie-stolbtsov-v-pandas-polnyi-ghaid/
#pandas
Привет! Сегодня я хочу поговорить о преобразовании типов данных в pandas. Это очень важный аспект работы с данными, так как часто при загрузке данных они могут быть прочитаны не в том формате, который нам нужен для анализа. Например, числа могут быть прочитаны как строки, даты могут быть прочитаны как объекты и так далее. Поэтому преобразование типов данных - это одна из первых задач, которую нужно выполнить при предварительной обработке данных.

Создание DataFrame

Для начала, давайте создадим DataFrame с помощью pandas. В этом примере мы создадим DataFrame, который содержит информацию о командах и их очках:
import pandas as pd

df = pd.DataFrame({
'team': ['a', 'b', 'c', 'd'],
'points': ['3', '7', '8', '9'],
'date': ['2021-01-01', '2021-02-01', '2021-03-01', '2021-04-01']
})

print(df.dtypes)


В этом DataFrame столбец 'points' имеет тип данных object, потому что мы ввели эти значения как строки. Аналогично, столбец 'date' также имеет тип данных object, хотя эти значения представляют даты.

Преобразование типов данных

Для преобразования типов данных в pandas мы можем использовать метод astype(). Этот метод принимает в качестве аргумента желаемый тип данных и возвращает новый DataFrame с преобразованными типами данных.
df['points'] = df['points'].astype(int)
df['date'] = pd.to_datetime(df['date'])

print(df.dtypes)

Теперь столбец 'points' имеет тип данных int, а столбец 'date' имеет тип данных datetime64[ns], что является стандартным типом данных для дат в pandas.
Всем привет!
Запостил отдельную страницу по Pandas на сайте https://nerdit.ru/pandas-full-guide/
Эта страница предназначена для удобной навигации по статьям на тему pandas, которое поможет как начинающим, так и опытным аналитикам данных освоить этот инструмент.

Pandas – это мощная библиотека для анализа данных на языке программирования Python, которая предоставляет структуры данных и инструменты для эффективной работы с табличными данными. Она широко используется в различных областях анализа данных, от финансового моделирования до искусственного интеллекта.
#pandas
Всем привет! Вчера вышла новая статья про распознавание печатей на документах с помощью библиотеки CV2.

Распознавание и классификация печатей на изображениях имеет широкий спектр применений, от автоматизации процессов до обеспечения безопасности. В данной статье мы рассмотрим методы обнаружения круглых и треугольных печатей с использованием алгоритмов обработки изображений и компьютерного зрения.
https://nerdit.ru/priedielieniie-krughlykh-i-trieugholnykh-piechatiei/