Машинное обучение RU
17.7K subscribers
1.58K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
Идентификация круглых печатей на изображении

Анализ данных, получаемых при обработке изображений — популярная тема среди разработчиков и аналитиков. Я поделюсь опытом применения преобразования Хафа для поиска окружностей на страницах сканированных документов.

Идея обратиться к идентификации геометрических объектов на изображении родилась при решении задачи поиска фальсификата в pdf файлах.

В период пандемии многие организации перешли на особый режим работы, личное взаимодействие с клиентами снизилось, поменялись бизнес-процессы. Изменения коснулись оформления первичных документов, чаще стали встречаться скан-копии файлов со вставленными подписями и печатями в виде отдельных картинок. Для оценки объема и формирования пула соответствующих документов потребовалось создать инструмент, способный «просмотреть» более 20 Гбайт файлов на предмет наличия указанных отклонений.

Задача:


Идентификация наличия круглых печатей на странице сканированного документа.

Реализация:

Python OpenCV (версия 4.6.0) – open source библиотека компьютерного зрения.

Читать

@machinelearning_ru
👍121🔥1
💡 MidJourney-Reference

Примеры генераций от Midjourney. Cправочник, содержащий стили и ключевые слова, которые вы можете использовать с ИИ MidJourney

Есть также страницы, на которых показано сравнение разрешений, веса изображений и многое другое

🖥 Github
💨 Видео инструкция

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥42
Введение в развёртывание ML: Flask, Docker и Locust

Вы потратили много времени на EDA, тщательно проработали все функции, несколько дней настраивали модель и, наконец, получили то, что хорошо работает в тестовом варианте. Теперь, мой друг, вам нужно развернуть вашу модель. В конце концов, любая модель, которая остаётся на локальном компьютере, ничего из себя не представляет, независимо от того, насколько она хороша.

Изучение этой части рабочего процесса Data Science может показаться непосильным, особенно если у вас нет большого опыта разработки программного обеспечения. Не бойтесь, основная цель этой статьи — познакомить вас с одним из самых популярных фреймворков для развёртывания на Python – Flask. Кроме того, вы узнаете, как контейнеризировать развёртывание и измерить его производительность – два аспекта, которые часто упускаются из виду.

Читать
Код

@machinelearning_ru
👍10🔥32
🖥 5 советов по работе с Jupyter, которые упростят вам процесс программирования

Поэтому в этой статье я представлю 5 крутых возможностей Jupyter, о существовании которых вы, вероятно, даже не подозревали.

📌 Читать

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥31
Пишем GPT в 60 строк NumPy — часть 1

Если уже тестировали популярные модельки нейросетей через API или даже просто когда-то что-то где-то слышали и хотите копнуть глубже, в этой статье автор рассказал, как написать GPT всего в 60 строках numpy с нуля: https://habr.com/ru/post/716902/

Для понимания статьи достаточно базово разбираться в Python, NumPy и обладать небольшим опытом в обучении нейросетей. В реализации отсутствует большая часть функциональности, чтобы максимально её упростить. В общем, enjoy.

Вообще, понимание архитектуры GPT — всего лишь небольшая часть более масштабной темы больших языковых моделей, но жизненно важная для разработчиков нейросетей. GPT оказалась первой архитектурой, у которой есть удобные свойства масштабирования, высокой параллелизации на GPU и качественного моделирования последовательностей. Ну и самое приятное, что исходники выложены на гитхабе: github.com/jaymody/picoGPT.

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍81🔥1
GPT-4 появится уже на следующей неделе и будет мультимодальным — об этом заявил технический директор Microsoft Андреас Браун.

Мультимодальность означает, что модель умеет работать с разными категориями данных, например, видео.

Всё развивается очень быстро.


@machinelearning_ru
🔥17👍72
🏷 Ресурсы, которые дадут очень прочную основу для начала работы с машинным обучением.

Набор тем, ранжированных по темам.

Градиентный спуск

Метрики — классификация

Матрицы неточностей, точность, прецезионность, recall, чувствительность
F1-оценка
TPR, TNR, FPR, FNR
Ошибки I и II типов
Кривые AUC-Roc

Метрики — регрессия

Общая сумма квадратов, объясненная сумма квадратов, остаточная сумма квадратов
Коэффициент детерминации и его скорректированная форма
AIC и BIC
Преимущества и недостатки RMSE, MSE, MAE, MAPE

Компромисс отклонение-дисперсия, Over/Under-Fitting

Метод k-ближайших соседей
Random Forests
Асимптотические свойства
Проклятие размерности

Выбор модели

k-Fold кросс-Валидация (перекрестная проверка)
L1 и L2 регуляризация
Байесовская оптимизация

Sampling

Классовый дисбаланс при обучении классифицирующих моделей
SMOTE
Несбалансированность классов в независимых переменных
Систематическая ошибка выборки

Модели регрессии

Глубокие нейронные сети для проблем регрессии
Случайная лесная регрессия
Регрессия XGBoost
ARIMA / SARIMA
Байесовская линейная регрессия
Регрессия на основе гауссовского процесса

Алгоритмы кластеризации


Метод К-средних
Иерархическая кластеризация
Процессы Дирихле

Классификационные модели

Логистическая регрессия
Множественная регрессия
XGBoost
Метод опорных векторов

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👍72
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft представила Visual ChatGPT — нейронка позволяет редактировать изображения прямо в чате.

Например, удаляет любые объекты, меняет их цвет, знает, какие предметы на фотке. Запоминает контекст и хорошо редачит.

Конечно, можно генерировать пикчи по любому запросу. Протестить можно уже сейчас.
👍11🔥32
This media is not supported in your browser
VIEW IN TELEGRAM
Chat with GPT — ChatGPT с голосом

Это неофициальное приложение ChatGPT с открытым исходным кодом, в котором есть дополнительные функции и возможности персонализации.

Он соединяет ChatGPT с ElevenLabs, чтобы дать чат-боту реалистичный человеческий голос. Кроме этого, ускоряет время отклика и можно регулировать креативность.

ChatGpt телеграм бот

@machinelearning_ru
🔥7👍21
This media is not supported in your browser
VIEW IN TELEGRAM
All-In-One-Deflicker

All-In-One-Deflicker — это общая платформа постобработки, которая может удалять различные типы мерцания из различных видео, в том числе видео из видеозахвата, обработки и генерации.

• Project website
• GitHub

@machinelearning_ru
👍52🔥1
Silero Models

Предварительно обученные модели преобразования речи в текст, текста в речь и улучшения текста.

https://github.com/snakers4/silero-models

@machinelearning_ru
👍63🔥1
Раскрашивание изображений с использованием нейронных сетей

С помощью DeOldify можно преобразовать старые черно-белые фотографии, добавив к ним цвет. Для работы с моделью автор использовал python 3.10, но вы можете поэкспериментировать со своими фотографиями на любом другом языке программирования.

Репозиторий: https://github.com/jantic/DeOldify
Руководство: https://habr.com/ru/post/681928/

#python
5🔥2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
GPT-4 для создании игр.

Пользователь под никоа skirano сделал игру Pong, которая работает прямо в диалоговом окне чат-бота. По его словам на это ушла минута и получилось с первой попытки.

Интересный факт, оригинальную Pong в 1972 году разрабатывали несколько месяцев.

@Chatgpturbobot - chatgpt bot в телеграме.

@machinelearning_ru
👍84🤔4🔥2👎1😁1
✔️ The Intel Neuromorphic DNS Challenge

Intel Neuromorphic DNS Challenge

🖥 Github
📌Статья
💨Dataset

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71🔥1
TemporalMaxer: Maximize Temporal Context with only Max Pooling for Temporal Action Localization

🖥 Github: https://github.com/tuantng/temporalmaxer

Paper: https://arxiv.org/abs/2303.09055v1

💨 Dataset: https://paperswithcode.com/dataset/kinetics

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥1🥰1