Машинное обучение RU
17.7K subscribers
1.58K photos
208 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
Try Redis — тренажёр по БД

Redis — это быстрое хранилище данных класса NoSQL, которое хранит и работает с данными типа «ключ — значение». Данная БД известна своей высокой производительностью, простотой и универсальностью.

А потренироваться в использовании вам поможет тренажёр Try Redis, который может генерировать запросы:

https://try.redis.io/

#redis
@machinelearning_ru
4👍2🔥2
📕 Название: Pandas for Everyone: Python Data Analysis, 2nd Edition (2023)
Автор:
Daniel Chen

Описание: В этой книге собраны практические знания и идеи для решения реальных проблем с помощью Pandas, даже если вы новичок в анализе данных на языке Python. Автор знакомит с ключевыми понятиями на простых, но практических примерах, постепенно развивая их для решения более сложных, реальных проблем науки о данных, таких как использование регуляризации для предотвращения чрезмерной подгонки данных или когда использовать методы машинного обучения без контроля для поиска основной структуры в наборе данных.

📚 Книга

@machinelearning_ru
8👍3🔥1
📌 Курс «Машинное обучение» на МКН СПбГУ
Аннотация


Объемный годовой курс, в котором подробно рассматриваются модели машинного обучения.

Такой подход позволяет осознать основные принципы данной области в целом. Знание этих принципов даст возможность самостоятельно понимать механизмы функционирования более сложных современных моделей, обнаруживать пути улучшения уже существующих алгоритмов, а также адаптировать методы машинного обучения для решения нестандартных задач.

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍82🔥2
🔍 Библиотеки Data Science, которые заслуживают гораздо большего внимания

В то время как большие ребята, Pandas, Scikit-learn, NumPy, Matplotlib, TensorFlow и т.д., занимают всё ваше внимание, легко пропустить некоторые простые и в то же время невероятные библиотеки.

Возможно, они не рок-звёзды GitHub и не обучаются по дорогим специализациям Coursera, но тысячи разработчиков вкладывают свою кровь и пот в их написание. Они незаметно заполняют пробелы, оставленные популярными библиотеками из тени.

Цель этой статьи – пролить свет на некоторые из этих библиотек и вместе удивиться тому, насколько мощным может быть сообщество разработчиков с открытым исходным кодом.

Читать

@machinelearning_ru
8
Узнайте, как ChatGPT-3 выводит анализ настроений на новый уровень в Python

Анализ настроений распознаёт и извлекает из текста субъективные знания, такие как мнения, эмоции и отношения. Он имеет широкое применение в различных областях, от исследования рынка и анализа отзывов клиентов до мониторинга социальных сетей и политических опросов.

Однако традиционные методы анализа настроений часто необходимо пересматривать, чтобы понять нюансы языка и сложности человеческих эмоций. Вот где GPT-3 , одна из последних и самых мощных моделей обработки естественного языка, вступает в игру.

Читать

@machinelearning_ru
👍71🔥1
Хватит записываться на скучные курсы! Самостоятельно изучите Sci-kit Learn с помощью ChatGPT!

Теперь мы все начинаем изучать Data Science и машинное обучение, записываясь на онлайн-курсы.

Признаюсь, некоторые из них действительно помогают в процессе обучения. Тем не менее, многие из них стали бесполезными после выпуска ChatGPT. Только представьте, что Искусственный Интеллект может помогать вам учиться абсолютно бесплатно... К тому же вы сможете сами составить программу обучения и выбрать методы, по которым будете учиться!

Читать

@machinelearning_ru
👍64🔥2
This New AI Is The Future of Videomaking!

Runway обещают через пару недель выкатить новые фичи связанные с текстовой генерацией и редактированием видео в открытый доступ на своём сайте.

https://www.youtube.com/watch?v=muNkPjigQEE

статья: https://arxiv.org/abs/2302.03011

демо: https://runwayml.com/

@machinelearning_ru
👍52🔥1
5 признаков того, что вы стали продвинутым пользователем Pandas, даже не осознавая этого

Ловите ли вы себя на мысли о том, что мечтаете о фреймах и сериях данных Pandas? Проводите ли вы часы подряд, выполняя сложные манипуляции и агрегации, едва замечая боль в спине и всё время думая: “как же это интересно”?

Что ж, с таким успехом вы могли бы быть продвинутым пользователем Pandas, даже не осознавая этого. Присоединяйтесь к клубу поклонников Pandas, которые достигли этого редкого уровня, и примите тот факт, что вы официально являетесь мастером обработки данных.

Итак, давайте взглянем на пять признаков того, что вы уже состоите в этом клубе.

Читать

@pro_python_code
👍81🔥1
Код для бстрого разложение данных высокой размерности.

Если вы хотите разложить данные высокой размерности на два или три измерения для их визуализации, что мы чаще делаем?

Распространенной техникой является PCA. Несмотря на полезность PCA, я всегда считал сложным создание графика PCA, пока не нашел эту документ в Yellowbrick.

Я рекомендую использовать этот инструмент, если вы хотите визуализировать PCA с помощью нескольких строк кода

from yellowbrick.datasets import load_credit
from yellowbrick.features import PCA

# Specify the features of interest and the target
X, y = load_credit()
classes = ['account in default', 'current with bills']

visualizer = PCA(scale=True, classes=classes)
visualizer.fit_transform(X, y)
visualizer.show()


https://www.scikit-yb.org/en/latest/api/features/pca.html

@machinelearning_ru
👍11🔥41
datefinder: Инструмент автоматического поиска дат и времени в строках Python

Если вы хотите автоматически искать дату и время с различными форматами в строках Python, попробуйте использовать datefinder. В приведенном коде показано, как использовать datefinder.

# pip install datefinder

from datefinder import find_dates

text = """"We have one meeting on May 17th,
2021 at 9:00am and another meeting on 5/18/2021
at 10:00. I hope you can attend one of the
meetings."""

matches = find_dates(text)

for match in matches:
print("Date and time:", match)
print("Only day:", match.day)

"""Output:
Date and time: 2021-05-17 09:00:00
Only day: 17
Date and time: 2021-05-18 10:00:00
Only day: 18
"""

Github

@machinelearning_ru
👍8🔥32
Как построить систему геоаналитики с применением ML?

Решать аналитические задачи с большим количеством значимых признаков помогает машинное обучение. В новой статье на Хабр вы найдете примеры работы сервисов геоаналитики VK Predict и узнаете, из каких этапов состоит разработка продукта с возможностями гео аналитики и какие модели машинного обучения используются при построении таких систем.

👉 Читать статью

@machinelearning_ru
👍7🔥1
PaLM + RLHF - Pytorch

Интресный проект, который позволяет реализовать функциональность ChatGPT, но с исходниками из открытого доступа.Учтите, что для обучения модели могут потребоваться большие вычислительные ресурсы​

Еще стоит отметить наличие подробной инструкции по использованию и возможность настроить модель под конкретные задачи.

$ pip install palm-rlhf-pytorch

Github

@machinelearning_ru
👍82🔥1
Глубокая нейронная сеть на Rust с нуля 🦀

Это руководство поможет вам глубже понять нейронные сети и их реализацию на Rust.

Часть 1
Часть 2
Часть 3

@machinelearning_ru
👍13🔥21