Data Analysis / Big Data
2.82K subscribers
573 photos
4 videos
2 files
2.7K links
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels
Download Telegram
Best Practices for Case Statements in Oracle Analytics

This article describes best practices for improving performance with case statements in Oracle Analytics

Read: https://blogs.oracle.com/analytics/post/best-practices-for-case-statements-in-oracle-analytics
Как мы разрабатывали алгоритм для анализа уникальных посетителей

Привет, Хабр! Мы — Александр Просвирнин, руководитель проектного направления, и Иван Григорьев, старший менеджер продукта центра «Видеонаблюдения и Безопасности» блока по телекоммуникационному бизнесу, работаем в экосистеме МТС.

В этой статье мы расскажем о решении для анализа уникальных посетителей. Опишем недостатки существующих на рынке решений и расскажем, почему надо остановиться именно на видеоаналитике — и что мы сделали для улучшения алгоритмов.


Читать: https://habr.com/ru/companies/ru_mts/articles/733440/
Применение методов CRISP-DM для анализа Big Sales Data

Метод обработки данных, полученных в процессе продажи людьми (звонки/встречи), с целью оптимизации воронки, сокращения цикла сделки и увеличения конверсии.


Читать: https://habr.com/ru/articles/733062/
Data-driven рост с помощью науки о данных и машинного обучения

Машинное обучение меняет способы использования данных компаниями для обеспечения прибыльного роста, предоставляя возможность опередить своих конкурентов. Ведущие игроки на вашем рынке уже используют науку о данных и машинное обучение в частности для принятия более эффективных решений в области маркетинга, продаж и успешного обслуживания клиентов. Еще не поздно воспользоваться этой возможностью - технологические компании могут ускорить свой рост, приняв пять ведущих практик.


Читать: https://habr.com/ru/articles/733672/
Данные: какие про вас собирают, а какие от вас закрывают?

Государство активно взяло курс на формирование реестра граждан и наполнение его разнородными данными. Про это высказываются самые разные чиновники после главного шага - введения системы "электронных повесток". К этому готовились. Напомню, что именно было сделано в последние два года для сбора максимального объема данных внутри госсистем.


Читать: https://habr.com/ru/articles/733676/
👍2
Сравнение технологии JuniStat и лазерных систем для беговых тестов

При первой встрече каждый клуб и федерация обычно интересуется точностью измерений, которые может обеспечить технология JuniStat. В рамках пилотного запуска проводятся замеры по определенному привычному и понятному эталону. За последние полгода были проведены тестирования игроков с целью проверки валидности данных по лазерам тремя федерациями и двумя клубами. Мы получили опыт в этой области и хотим им поделиться. Следует отметить, что все валидации прошли успешно, но результаты требовали пояснений. В большинстве случаев первой реакцией было удивление из-за того, что 70-80% результатов совпадают, а оставшиеся 20-30% выглядят как выбросы, но на самом деле они не являются таковыми. Необходимо проанализировать различные способы измерения и выяснить, по каким причинам результаты различаются.

Как измеряют время рывка сейчас?


Читать: https://habr.com/ru/articles/733866/
Unlocking data stream processing [Part 3] - data enrichment with fuzzy joins

Read: https://www.dataengineeringweekly.com/p/unlocking-data-stream-processing-84f
😁1
OBIA 12C: How to use External Tables in Oracle Autonomous Data Warehouse (ADW) with BI Applications Fusion Load Plan

This article provides an overview about how to use External tables in Oracle Autonomous Data Warehouse (ADW) with BI Applications Fusion Load Plan.
By default, In the BI Applications Fusion Load plan, FTS Phase scenario’s consume WLS ODI Server1 Managed Server JVM to read and process the BICCC extracted files. Instead you would want to use External tables in Oracle Autonomous Data Warehouse (ADW) to read and process BICCC Extracted files, refer to implementation guide attached in this blog.

Read: https://blogs.oracle.com/analytics/post/obia-12c-how-to-use-external-tables-in-oracle-autonomous-data-warehouse-adw-with-bi-applications-fusion-load-plan
DDRAMDisk выпустил новую линейку RAM дисков, но Россия в пролёте…

Привет Хабр!

Раньше я уже писала про интересный проект RAM диска – безлимитного заменителя SSD, подключаемого в PCIe слот компьютера и прикидывающегося обычным SSD диском, только очень быстрым и с неограниченным ресурсом TBW. Повторяться не буду, подробности работы девайса можете найти в оригинальной статье. Тогда были созданы платы, содержащие впаянные чипы памяти и имевшие фиксированный объём.

За прошедшие два года ребята доработали исходную плату (добавлена возможность подключения внешнего бекапного аккумулятора, увеличена надёжность) и разработали версии на слотах, причём, и для DDR3, и для DDR4 памяти.

Рассмотрим их подробнее. Все фотоматериалы взяты из раздела новостей сайта команды.
Смонтировать RAM диск

Читать: https://habr.com/ru/articles/734186/
Как структурировать проекты машинного обучения с помощью GitHub и VS Code: полная инструкция с настройками и шаблонами

Хорошо продуманный процесс структурирования проектов машинного обучения поможет быстро создавать новые репозитории GitHub и с самого начала ориентироваться на элегантную программную архитектуру. Команда VK Cloud перевела статью о том, как организовать файлы в проектах машинного обучения, используя VS Code. Шаблон для создания проектов машинного обучения можно скачать на GitHub.


Читать: https://habr.com/ru/companies/vk/articles/733000/
Байесовский подход к АБ тестированию

Байесовский подход к АБ-тестам — альтернатива частотному (фреквентистскому) подходу. Поговорим о том, как заменить p-value на более интерпретируемые метрики, используя байесовские методы. На примере теста конверсии сравним частотный и байесовский подходы.


Читать: https://habr.com/ru/companies/glowbyte/articles/732024/
Спринт с Visiology: 10 дней от подготовки данных до дашборда

Привет, друзья! Буквально через несколько дней мы начинаем спринт-интенсив по работе с платформой Visiology. Буквально за 10 дней я планирую показать и рассказать об основных элементах работы платформы. Если вы задумывались о знакомстве с Visiology или в вашей компании как раз рассматривают варианты перехода на российский BI, новый спринт — отличная возможность составить представление и уже получить первичную экспертизу по платформе. Все подробности — под катом.
Хочу сделать свой дашборд!

Читать: https://habr.com/ru/companies/visiology/articles/734442/
Построй ML-модель для Газпромбанка и выиграй миллион

Газпромбанк подготовил задачу для хакатона «Лидеры цифровой трансформации», за решение которой можно выиграть приз.

Читать: «Построй ML-модель для Газпромбанка и выиграй миллион»