Анализ данных (Data analysis)
46.3K subscribers
2.34K photos
277 videos
1 file
2.07K links
Data science, наука о данных.

@haarrp - админ

@itchannels_telegram - 🔥 главное в ит

@ai_machinelearning_big_data - ML

@machinelearning_interview - вопросы с собесдований по Ml

РКН: clck.ru/3FmyAp
Download Telegram
📌Метрики в машинном обучении: понимание, применaение и интерпретация

Годная статья о метриках в Machine Learning.

Разбираются:
Accuracy, Confusion Matrix, Precision, Recall, F1-мера, ROC-AUC, Log Loss — для задач классификации

MSE, RMSE, R², MAE, MAPE, SMAPE, WAPE, RMSLE — для задач регрессии

📎 Статья

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍27🔥91🥰1
🔥 Британская компания создаст лазерную систему контроля плазмы для термоядерных реакторов будущего

*️⃣Британская компания Tokamak Energy заявила, что разрабатывает новую технологию лазерных измерений, которая имеет решающее значение для контроля экстремальных условий внутри реакторов будущих термоядерных электростанций и доставки чистой энергии в сеть. Для этого плазменный жгут должен оставаться стабильным, что при рабочих температурах свыше 100 млн градусов так просто не проверить.

*️⃣Контролировать качество плазмы в реакторе — её плотность и температуру — предложено с помощью новой лазерной системы дисперсионного интерферометра. Сейчас она работает на испытательном стенде в штаб-квартире Tokamak Energy в Оксфорде, прежде чем позже в этом году будет установлена на прототипе сферического термоядерного реактора компании — установке ST40.

*️⃣В прошлом году компания Tokamak Energy успешно ввела в эксплуатацию на установке ST40 лазерную диагностику на эффекте томсоновского рассеяния для получения подробных показаний температуры и плотности плазмы в определенных местах. В дополнение к этому новая система дисперсионного интерферометра будет определять среднюю плотность по всему плазменному жгуту. Компания утверждает, что это будет простой, надёжный и безотказный способ контроля качества плазмы в реакторе, который обязательно найдёт применение в будущих электростанциях.

📎 Читать подробнее

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍163
📌Создание веб-приложения для регрессионного анализа с нуля на Python

Это приложение позволяет строить модель множественной линейной регрессии на основе набора данных.
В процессе используются библиотеки Pandas, Matplotlib, Numpy, Streamlit.
Параллельно затрагивается много важных аспектов, например, чтение данных из Excel, даже немного о работе с CSS.
Обсуждаются разные аспекты, связанные с анализом данных и Data Science.

Отличная возможность прокачать скиллы создания DataScience-приложений; как вариант продемонстрировать этот пет-проект потенциальному работодателю

📎 Подробный кликабельный план ролика
📎 Ролик

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍205🥰2
🔥 Полезная статья о квантизации нейросетевых моделей от ML-разработчика Яндекса

Проработав несколько лет в команде, задачей которой стояла квантизация моделей для умных колонок, автор решил поделиться знаниями и рассказать, зачем нужна квантизация, в какой момент лучше всего квантизовать модель, а также рассмотреть разные типы данных и современные методы квантизации.

Статья о том, как можно сэкономить ресурсы на устройствах, заставить модели работать быстрее, а значит, экономить деньги и улучшить пользовательский опыт.

📎Статья на Хабре

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍133🥰1
🔥 HPT 🔥 - новое семейство открытых мультимодальных LLM от Hypergain.

HPT (Hyper-Pretrained Transformer) демонстрирует мощные возможности в нескольких мультимодальных тестах.

Github: https://github.com/hyperGAI/HPT
HuggingFace: https://huggingface.co/HyperGAI/HPT
Project: https://hypergai.com/blog/introducing-hpt-a-family-of-leading-multimodal-llms

@data_analysis_ml
👍9🔥21🥰1
🌟 Максимально наглядное объяснение Machine Learning

Зацените — сайт, посвящённый ML, который сплошь состоит из схем и диаграмм.
Здесь супер доступно и понятно описываются основные темы Машинного обучения, уж теперь то станет понятно абсолютно всё

🌟 Наслаждайтесь)

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3111🎉3🤨1
📌Годная шпаргалка по R для специалиста Data Science

Не так часто я упоминаю R в постах, а ведь это прекрасный инструмент, знание которого поможет там, где не справляется Python, Julia и другие ребята

Итак, с помощью R можно:
— Очистить и обработать данные. Например, для обработки массива информации о популярности разных товаров на R можно написать программу, которая сгруппирует данные о покупках по товарам, удалит дубли и подготовит таблицу для дальнейшей аналитики.

— Провести статистический тест. Посчитать среднюю продолжительность и увидеть, есть ли статистически значимая разница между несколькими показателями.

— Объединять данные из разных таблиц. Взять таблицы разных форматов, собрать из них данные и обрабатывать все как единый файл.

— Отрисовать интерактивный график. Распределить данные, отрегулировать параметры.

— Анализировать регрессионные модели. Выявить отношения между переменными — например, как доход магазина зависит от разных факторов.

— Провести другую математическую операцию. Объединить многомерные массивы, спрогнозировать величину, распознать текст. Для большинства задач есть готовые библиотеки, либо можно написать собственный код, используя широкий математический инструментарий.

А вот держите годную шпаргалку по R)

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍224🔥2🥰1🤨1