AI на дровах 🪵 – Telegram

AI на дровах 🪵

238 subscribers

77 photos

19 videos

1 file

131 links

Привет! Меня зовут Семён, я работаю в сфере ML и аналитики данных, пишу в блог nerdit.ru статьи о своем опыте и том, что может пригодиться начинающим в начале их пути изучения больших данных.

👾HSE ML Unit Head⚡️
❤️Litres DS Team

Download Telegram

About

Blog

Apps

Platform

AI на дровах 🪵

238 subscribers

AI на дровах 🪵

Привет! Сегодня я хочу поговорить о преобразовании типов данных в pandas. Это очень важный аспект работы с данными, так как часто при загрузке данных они могут быть прочитаны не в том формате, который нам нужен для анализа. Например, числа могут быть прочитаны как строки, даты могут быть прочитаны как объекты и так далее. Поэтому преобразование типов данных - это одна из первых задач, которую нужно выполнить при предварительной обработке данных.

Создание DataFrame

Для начала, давайте создадим DataFrame с помощью pandas. В этом примере мы создадим DataFrame, который содержит информацию о командах и их очках:

import pandas as pd

df = pd.DataFrame({
    'team': ['a', 'b', 'c', 'd'],
    'points': ['3', '7', '8', '9'],
    'date': ['2021-01-01', '2021-02-01', '2021-03-01', '2021-04-01']
})

print(df.dtypes)

В этом DataFrame столбец 'points' имеет тип данных object, потому что мы ввели эти значения как строки. Аналогично, столбец 'date' также имеет тип данных object, хотя эти значения представляют даты.

Преобразование типов данных

Для преобразования типов данных в pandas мы можем использовать метод astype(). Этот метод принимает в качестве аргумента желаемый тип данных и возвращает новый DataFrame с преобразованными типами данных.

df['points'] = df['points'].astype(int)
df['date'] = pd.to_datetime(df['date'])

print(df.dtypes)

Теперь столбец 'points' имеет тип данных int, а столбец 'date' имеет тип данных datetime64[ns], что является стандартным типом данных для дат в pandas.

49 viewsedited 14:25

AI на дровах 🪵

Всем привет!
Запостил отдельную страницу по Pandas на сайте https://nerdit.ru/pandas-full-guide/
Эта страница предназначена для удобной навигации по статьям на тему pandas, которое поможет как начинающим, так и опытным аналитикам данных освоить этот инструмент.

Pandas – это мощная библиотека для анализа данных на языке программирования Python, которая предоставляет структуры данных и инструменты для эффективной работы с табличными данными. Она широко используется в различных областях анализа данных, от финансового моделирования до искусственного интеллекта.
#pandas

Pandas - полное руководство

Эта страница предназначена для удобной навигации по статьям на тему pandas, которое поможет как начинающим, так и опытным аналитикам данных освоить этот инструмент.

56 viewsedited 07:14

AI на дровах 🪵

Всем привет! Вчера вышла новая статья про распознавание печатей на документах с помощью библиотеки CV2.

Распознавание и классификация печатей на изображениях имеет широкий спектр применений, от автоматизации процессов до обеспечения безопасности. В данной статье мы рассмотрим методы обнаружения круглых и треугольных печатей с использованием алгоритмов обработки изображений и компьютерного зрения.
https://nerdit.ru/priedielieniie-krughlykh-i-trieugholnykh-piechatiei/

Распознавание круглых и треугольных печатей на python

Для определения круглых и треугольных печатей на изображениях можно использовать различные методы обработки изображений. Например, для определения круглых печатей можно использовать библиотеку OpenCV, а для определения треугольных форм также можно применить…

112 viewsedited 12:14

AI на дровах 🪵

Привет! Сегодня расписал свой опыт визуализации данных с помощью Matplotlib и Seaborn.
Эти инструменты позволяют создавать красивые и информативные графики, которые помогают лучше понять и проанализировать данные.

https://nerdit.ru/vizualizatsiia-dannykh-s-pomoshchiu-matplotlib-i-seaborn/
#python #pandas

Визуализация данных с помощью Matplotlib и Seaborn

Привет! Сегодня я хочу поделиться своим опытом визуализации данных на Python с помощью двух мощных библиотек - Matplotlib и Seaborn. Эти инструменты позволяют создавать красивые и информативные графики, которые помогают лучше понять и проанализировать данные.

151 viewsSemen Lobachevskiy, 08:15

AI на дровах 🪵

Привет! Меня зовут Семён, я работаю в сфере ML и аналитики данных и пишу в блог nerdit.ru статьи о своем опыте и том, что может пригодиться начинающим в начале пути изучения больших данных и машинного обучения.

Если вам интересны эти направления, буду рад вашей подписке на канал, откликам и комментариям 😊
Будем знакомы 🖖

👍5

213 viewsSemen Lobachevskiy, edited 08:24

AI на дровах 🪵

AI на дровах 🪵 pinned a photo

08:24

AI на дровах 🪵

Я работаю в области машинного обучения уже несколько лет и за это время успел попробовать множество различных инструментов и библиотек. Однако, одной из самых полезных и часто используемых мной библиотек остается Pandas.
Расписал какие методы использую в статье: https://nerdit.ru/ispolzovaniie-pandas-v-mashinnom-obuchienii/ и это статья стала последней в полном гайде по пандас
#pandas

Использование Pandas в машинном обучении

Я работаю в области машинного обучения уже несколько лет и за это время успел попробовать множество различных инструментов и библиотек. Однако, одной из самых полезных и часто используемых мной библиотек остается Pandas.

👍2

170 viewsSemen Lobachevskiy, 15:59

AI на дровах 🪵

Всем привет!

Накидайте тем в комментариях для видео обзора, хочу попробовать записать, посмотреть как такой формат зайдет 😊🙏

Можно про питон, про инструменты, про ML и т.п.

121 viewsSemen Lobachevskiy, 10:52

AI на дровах 🪵

Привет! Тут вышло интересное видео, про ИИ для широкого понимая как там все работает. И немного размышлений на тему будущего ИИ и нас с вами.

https://youtu.be/1A_9slmQx8M?si=yOqWIPuLXOT0Aguz

Почему НЕЙРОСЕТИ нельзя КОНТРОЛИРОВАТЬ? — ТОПЛЕС

Смотри программу спринта по созданию видео и забери гайд по нейросетям бесплатно: https://bit.ly/toplesbot

Получи огромный потанцевал для своего бизнеса с бесплатным Битрикс24 + Ai. Регистрируйся: https://www.bitrix24.ru/~m0awG

Слушать новый трек от КРОСЫ🔥…

105 viewsSemen Lobachevskiy, 08:03

AI на дровах 🪵

Всем привет!
Начинаю цикл статей на тему машинного обучения с использованием библиотеки scikit-learn, она будет понятна и новичками, поэтому выбор пал на неё.
Собрал сводную страницу https://nerdit.ru/scikit-learn/ с содержанием статей, которые будут выходить раз в день-два.

Первая статья уже вышла)
https://nerdit.ru/chto-takoie-scikit-learn-i-dlia-chiegho-on-ispolzuietsia/
Накидайте огоньков, кому интересна эта тема 🙏

scikit-learn - полное руководство

Scikit-learn (также известный как sklearn) - это библиотека машинного обучения, разработанная на языке программирования Python.

👍1

94 viewsSemen Lobachevskiy, 08:21

AI на дровах 🪵

Как специалист по анализу данных и машинному обучению, я часто использую библиотеку scikit-learn в своей работе. Эта библиотека стала моим незаменимым инструментом благодаря своим многочисленным особенностям и преимуществам.

Одной из главных особенностей scikit-learn является ее обширная коллекция алгоритмов машинного обучения. Библиотека предоставляет реализации для широкого спектра задач, таких как классификация, регрессия, кластеризация и снижение размерности. Это позволяет мне быстро экспериментировать с различными алгоритмами и находить наиболее подходящий для моей задачи.

Дальше читаем статью https://nerdit.ru/osnovnyie-osobiennosti-i-prieimushchiestva-bibliotieki-scikit-learn/ и велком обсуждать в комментариях)

Основные особенности и преимущества библиотеки scikit-learn

Как специалист по анализу данных и машинному обучению, я часто использую библиотеку scikit-learn в своей работе. Эта библиотека стала моим незаменимым инструментом благодаря своим многочисленным особенностям и преимуществам. Позвольте мне поделиться с вами…

👍1

89 viewsSemen Lobachevskiy, 09:10

AI на дровах 🪵

В своей работе в области машинного обучения я сталкиваюсь с различными типами задач, каждая из которых требует своего подхода. Три основных типа задач, с которыми я чаще всего имею дело - это классификация, регрессия и кластеризация.

⚡Что это такое и чем они отличаются читайте в новой статье:

https://nerdit.ru/tipy-zadach-mashinnogho-obuchieniia-klassifikatsiia-rieghriessiia-klastierizatsiia/

#sklearn

Типы задач машинного обучения (классификация, регрессия, кластеризация)

В своей работе в области машинного обучения я сталкиваюсь с различными типами задач, каждая из которых требует своего подхода. Три основных типа задач, с которыми я чаще всего имею дело - это классификация, регрессия и кластеризация.

80 viewsSemen Lobachevskiy, 11:35

AI на дровах 🪵

Все начинающие саентисты сталкиваются с первым обучением модели на тестовой выборке и дальнейшей проверке её точности на тестовой. Такой подход используются довольно часто.
Как разделять эти выборки и что это такое читайте в новом посте 🔥
Если будут вопросы, задавайте в комментариях, с удовольствием помогу разобраться 🤓

Разделение данных на обучающую и тестовую выборки

Когда я начинал заниматься машинным обучением, одной из первых вещей, с которой я столкнулся, было разделение имеющихся данных на две части - обучающую выборку (training set) и тестовую выборку (test set). Это необходимо для того, чтобы проверить, насколько…

78 viewsSemen Lobachevskiy, 13:56

AI на дровах 🪵

Загрузка и предобработка данных - это первый и очень важный этап в любом проекте по анализу данных или машинному обучению. От качества данных напрямую зависит конечный результат. Поэтому я всегда уделяю много внимания этому процессу.

Данные могут храниться в различных форматах - CSV, JSON, XML, базах данных и др. Чаще всего мне приходится работать с форматами CSV и JSON.

https://nerdit.ru/zaghruzka-i-priedobrabotka-dannykh/
#sclearn

Загрузка и предобработка данных различных форматов

Загрузка и предобработка данных - это первый и очень важный этап в любом проекте по анализу данных или машинному обучению. От качества данных напрямую зависит конечный результат. Поэтому я всегда уделяю много внимания этому процессу.

102 viewsSemen Lobachevskiy, 08:16

AI на дровах 🪵

Привет, всем! Сегодня я хочу поделиться с вами интересной темой из мира машинного обучения и анализа данных - это алгоритмы рекомендаций.

Вы, наверняка, сталкивались с рекомендательными системами в интернет-магазинах, потоковых сервисах музыки и видео, социальных сетях и т.д. Они помогают нам находить новые товары, фильмы, музыку и людей, которые могут нас заинтересовать.

Существует множество алгоритмов рекомендаций, но я хочу рассказать о двух наиболее популярных: коллаборативной фильтрации и контентной фильтрации.

Коллаборативная фильтрация основана на идее, что люди, которые имеют схожие предпочтения в прошлом, скорее всего, будут иметь схожие предпочтения в будущем. Алгоритм анализирует историю поведения пользователей и находит схожие профили, чтобы рекомендовать товары или контент, которые понравились другим пользователям с похожими вкусами.

Контентная фильтрация, с другой стороны, основана на анализе характеристик товаров или контента. Алгоритм анализирует описания, теги, метаданные и другую информацию о товарах или контенте, чтобы рекомендовать похожие вещи, которые могут заинтересовать пользователя.

Оба алгоритма имеют свои преимущества и недостатки, и выбор между ними зависит от конкретной задачи и данных, которые доступны для анализа.

#теория
Если у вас есть вопросы или комментарии, я буду рад ответить на них.

84 viewsSemen Lobachevskiy, 08:43

AI на дровах 🪵

Немного статистикой по блогу nerdit.ru, который я запустил в начале года.

Где-то с марта месяца активно пишу статьи и стараюсь выкладывать раз в день в одно и то же время.

Такая стратегия позволила "прикормить" поисковых ботов и начать лучше ранжироваться в поиске, а так же попадать в быстрые ответы Google.

Интересно вам будет про такое читать тут, если иногда буду делиться информацией? 😊

#proблог

71 viewsSemen Lobachevskiy, edited 08:57

AI на дровах 🪵

Привет, друзья!

Сегодня я хочу рассказать вам о новом инструменте, который обязательно пригодится всем, кто проводит много времени на YouTube, но хочет сэкономить время и получить только самую важную информацию из видео.

🚀 Краткий пересказ видео youtube

📝 Как это работает?

    - Зайдите на сайт https://nerdit.ru/youtube-summarizer/
    - Вставьте URL видео, которое вы хотите пересказать.
    - Нажмите кнопку "Пересказать".
    - В течение нескольких секунд сервис анализирует видео и генерирует краткий текстовый пересказ.

🔍 Преимущества использования:

    - Экономия времени: Получите ключевую информацию из видео за несколько минут.
    - Удобство: Не нужно скачивать или устанавливать программное обеспечение.
    - Доступность: Работает с любым видео на YouTube как на русском, так и на английском.
    - Образовательные цели: Идеально подходит для студентов и исследователей, которым нужно быстро найти нужную информацию.

❤️Доступ только для подписчиков nerdit.ru

Краткий пересказ видео youtube

Введите URL-адрес видео YouTube и получите SEO-оптимизированную статью, готовую к публикации в вашем блоге или на веб-сайте.

68 viewsSemen Lobachevskiy, 05:31

AI на дровах 🪵

Создал страничку, куда буду выкладывать разработанных мной AI ботов.
Пока только пересказчик youtube (есть версия в виде телеграмм бота), о котором писал выше и бот-аналитик, который позволяет получить аналитическую сводку по вашему сайту за последние 30 дней на данных Я.Метрики.

Если есть идеи для бота с использованием AI, пишите в комментариях, будет интересно реализовать 🎃

https://nerdit.ru/tools/

Полезные AI боты

На этой странице собраны созданные мной полезные AI боты для разных задач.

69 viewsSemen Lobachevskiy, 19:13

AI на дровах 🪵

За эту неделю, закончил блок по оценки качества моделей:
- Метрики классификации (accuracy, precision, recall, f1-score, ROC-AUC)
- Метрики регрессии (MAE, MSE, RMSE, R^2)
- Матрица ошибок
- Кривая обучения
Всё это в рамках полного руководства по scikit-learn
Scikit-learn (также известный как sklearn) - это библиотека машинного обучения, разработанная на языке программирования Python.

И на подходе новый AI бот для изучения python, как для новичков так и для практикующих, думаю на этой неделе выложу.

👍3

69 viewsSemen Lobachevskiy, 20:29

AI на дровах 🪵

Я тут много пишу про телеграм ботов, но ещё ни разу не выходила статья о том, как создать простого бота)

Поэтому вот статья о том, как создать простого бота https://nerdit.ru/sozdaniie-prostogho-tielieghram-bota-s-ispolzovaniiem-bibliotieki-python-telegram-bot/

#практика

Создание простого телеграм-бота с использованием библиотеки python-telegram-bot

Привет! Сегодня я расскажу вам, как создать простого телеграм-бота с использованием библиотеки python-telegram-bot. Эта библиотека значительно упрощает процесс разработки и позволяет быстро настроить и запустить вашего собственного бота.

👍2

69 viewsSemen Lobachevskiy, 08:39

AI на дровах 🪵

Вчера был в комиссии по защите курсовых проектов у 2 курса ФКН Вышки.

Радует, как год от года растёт уровень проектов и подготовки студентов, которым на минуточку 19-20 лет.

Вспомнил себя в этом возрасте... 🫠

57 viewsSemen Lobachevskiy, 15:05