Data Analysis / Big Data
2.84K subscribers
566 photos
3 videos
2 files
2.76K links
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels
Download Telegram
Как я создавал свой первый дашборд на Visiology 3 и почему второй буду делать немного позже

Привет, Хабр! Меня зовут Салават Сафиуллин, и сегодня я хочу поделиться с вами своим первым опытом создания дашборда на Visiology 3. Это новая версия платформы, которой мы пользуемся уже несколько лет, но она кардинально отличается как архитектурой, так и принципами работы. Дашборды на версии нужно создавать заново и по-другому. Поэтому мне было особенно интересно сделать пробу и подготовить дашборд на базе демонстрационной Visiology 3.0. Под катом — подробный рассказ о моем "пилоте" и некоторые мысли о работе с новой версией Visiology.


Читать: https://habr.com/ru/post/714032/
Администрируем сервер Дельта BI, применяя опыт работы с Tableau Server

Головная боль администратора BI сервера пропорциональна масштабу развернутого решения. Начнем с главных ориентиров, следуя которым мы привыкли достигать баланса в работе BI сервера (и улучшать качество ночного сна админа). А дальше разберемся, какой функционал помогает решать эти и другие задачи в Дельта BI — на фоне привычного для Vizuators Tableau Server (TS).


Читать: https://habr.com/ru/post/714394/
Дайджест Python: чем плох Django и как создать бота на GPT-3

Собрали дайджест из лучших новостей и статей по Python с 15 по 31 января про Data Science, веб-разработку, нейросети и приложения.

Читать: «Дайджест Python: чем плох Django и как создать бота на GPT-3»
Дайджест Python: чем плох Django и как создать бота на GPT-3

Собрали дайджест из лучших новостей и статей по Python с 15 по 31 января про Data Science, веб-разработку, нейросети и приложения.

Читать: «Дайджест Python: чем плох Django и как создать бота на GPT-3»
Управление на основе данных. Что общего между электронным дневником и базой налоговой?

Сегодня о подходе к управлению, основанному на данных, не говорит только ленивый. Кто уже имеет с этим дело в своей работе, предлагаем сразу переходить к разделу с описанием опыта Татарстана по управлению данными. А для тех, кто этим направлением раньше не интересовался, Центр цифровой трансформации Татарстана дает пару вводных.


Читать: https://habr.com/ru/post/714492/
Делитесь своим опытом и получайте дополнительный доход

Яндекс Практикум ищет наставников и ревьюеров на свои курсы, особенно на следующие направления:

— Frontend-разработка
— DevOps
— Продуктовая аналитика

Узнать подробнее и откликнуться: https://tprg.ru/aikZ

#вакансии #работа
👍1
By the Numbers: Harry Kane’s 200 Premier League Goals

Check out how Oracle Cloud data analysis provides a deep dive into the Tottenham striker’s career milestone.

Read: https://blogs.oracle.com/analytics/post/premier-league-harry-kane
Гайд по созданию Big Data-проектов в облаке: технологический стек, этапы и подводные камни

Любой специалист, который когда-либо работал с Big Data знает, что в подобных проектах большой не только объем данных. Также это внушительные вычислительные ресурсы, разветвленный технологический стек и мощная инфраструктура. Поэтому Big Data-проекты часто реализовывают в облаке.

Меня зовут Алексей Бестужев, я архитектор VK Cloud, и в этой статье мы обсудим нюансы и неочевидные особенности запуска процессов при работе с большими данными в облаке.

Материал подготовлен на основе нашего совместного вебинара с Кириллом Сливчиковым, управляющим партнером компании 7RedLines.


Читать: https://habr.com/ru/post/714124/
Реальный путь в data science

Эта статья про мой путь до первой работы в DS (data science). Путь был не маленьким и был пройден за 2,5 года. Кого-то эта цифра отпугнет, если бы я знал это в начале, то меня бы тоже отпугнула, кто-то назовет меня неспособным дурачком (и отчасти будет прав), а для кого-то (я надеюсь) эта статья поможет сократить время обучения и пройти этот путь быстрее.


Читать: https://habr.com/ru/post/715234/
Select the best option to render dashboards in Oracle Analytics Cloud

This article describes the options available for rendering dashboards in Oracle Analytics Cloud

Read: https://blogs.oracle.com/analytics/post/oracle-analytics-dashboard-rendering-mode-options
Embedding Fusion Analytics Content in Oracle Application Cloud

A Digital Sales Oracle Application Cloud customer, who has also bought the Fusion Analytics warehouse; there are some use cases that warrant embedding Fusion Analytics content  in Oracle Application Cloud  as it provides contextual information on the primary CX application that the users use.

Read: https://blogs.oracle.com/analytics/post/embedding-fusion-analytics-content-in-oracle-application-cloud
Создаём оптимизированный план ТОиР с помощью F5 EAM Optimizer

Дефицит комплектующих, изменение логистических маршрутов, последствия коронакризиса и влияние западных санкций в 2022 году подтолкнули российские промышленные предприятия искать новые способы сохранения и повышения эффективности производства. Промышленным предприятиям нужны решения для оптимизации процессов техобслуживания и ремонта «сейчас» и построения концепции цифрового предприятия «завтра». На старте, как правило, покрываются основные элементы ТОиР, затем можно переходить к расширенным сценариям мониторинга на основе данных телеметрии и к оптимизации планов, и уже после этого внедрять модели предиктивного анализа. В этой статье мы хотим рассказать о том, как оптимизировать планы технического обслуживания и ремонта с помощью системы F5 EAM и ее модуля EAM Optimizer.


Читать: https://habr.com/ru/post/715354/
1
Меры центральности в Network Science

Привет, Хабр!

Меня зовут Сергей Коньков, я Data Scientist и участник профессионального сообщества NTA. За последние 10 лет интерес к науке Network Science неимоверно возрос, что повлекло за собой закономерное развитие всевозможных инструментов для исследований в данной области. Одним из таких инструментов является python-библиотека NetworkX, предназначенная для анализа графов или других сетевых структур. Этот пост будет направлен на объяснение и демонстрацию работы основных мер центральности, вычисляемых в графах.


Читать: https://habr.com/ru/post/715386/
Платформа данных в Леруа Мерлен — как мы победили масштабирование

Всем привет! Меня зовут Александр Токарев, я технический архитектор домена «Управление данными» в «Леруа Мерлен». Год назад мы уже делали обзор нашей Платформы данных, сейчас же я расскажу про её развитие за последний год и про задачи, которые нам удалось решить.

Мы столкнулись с необходимостью масштабировать наш подход, когда количество источников, интегрированных в платформу, стало больше 150. Всего же мы планируем интегрировать данные из более чем 800 систем. Однако ETL-инструменты, которые мы использовали на первых этапах развития дата платформы, не позволяли добиться эффективного масштабирования. Кроме того, сам процесс интеграции источников был достаточно трудоемким. Поэтому возник запрос на рефакторинг архитектуры процесса поставки данных, который, с одной стороны, позволил бы эффективно горизонтально масштабироваться, а с другой стороны, упростил бы сам процесс интеграции. В результате мы пришли к следующей схеме процесса.


Читать: https://habr.com/ru/post/712946/
MLOps в облаке: как организовать работу над ML-экспериментами с помощью MLflow

В свое время DevOps заметно изменил подход к разработке программного обеспечения. Последние пару лет благодаря практикам MLOps меняются принципы и подходы к работе дата-специалистов. Александр Волынский (Technical Product Manager ML Platform VK Cloud) и Сергей Артюхин (преподаватель программы «Симулятор ML» в Karpov Courses) рассказывают, почему MLOps — «новый черный» и как безболезненно реализовать этот подход в своем проекте.


Читать: https://habr.com/ru/post/712900/
Биоинформатика — это не набор инструкций

У Бластима недавно завершился интенсив «анализ NGS-данных». На прошедшем потоке к команде лекторов присоединился новый преподаватель Алексей Зарубин. Перед стартом курса мы задали ему несколько вопросов про профессиональный рост и текущие научные задачи, а также спросили совета, что нужно для успешной карьеры в области «сухой биологии». Публикуем самое интересное из интервью с Алексеем.


Читать: https://habr.com/ru/post/713344/