Data Analysis / Big Data
2.82K subscribers
572 photos
4 videos
2 files
2.69K links
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels
Download Telegram
The Next Big Things for Oracle Cloud Platform

Recap of The Next Big Things session at Oracle Openworld 2018. Five exciting demos including: content experience, digital assistants, blockchain applications, data science development platform, and visual development.

Read: https://blogs.oracle.com/cloud-infrastructure/post/the-next-big-things-for-oracle-cloud-platform
Four Key Things to Do with Machine Learning

Is your organization getting the most out of machine learning? Learn the four keys to effective machine learning.

Read: https://blogs.oracle.com//post/four-key-things-to-do-with-machine-learning
What Is Oracle Cloud Infrastructure Data Catalog?

Oracle announces Oracle Cloud Infrastructure Data Catalog, a brand new tool to manage and govern your big data. Organize, enrich, search, and consolidate data in a way that expedites and optimizes your data lake.

Read: https://blogs.oracle.com//post/what-is-oracle-cloud-infrastructure-data-catalog
Real-World Performance Testing for Oracle Analytics Cloud with Apache JMeter

Oracle Analytics Cloud (OAC) is a comprehensive platform that enables organizations to analyze data and gain insights in real-time. Performance testing is an essential step to ensure that OAC can handle the expected workload without compromising its performance.

Read: https://blogs.oracle.com/undefined/post/real-world-performance-testing-for-oracle-analytics-cloud-with-apache-jmeter
Five things you may not know you could do with dataset authoring in the Dataset Editor of Oracle Analytics Cloud

This post explains powerful things you can do with dataset authoring in Oracle Analytics Cloud.

Read: https://blogs.oracle.com/undefined/post/five-things-you-may-not-know-you-could-do-with-the-dataset-authoring-in-oracle-analytics-dataset-editor
'Memory Saver' feature in Google Chrome may affect active usage of Oracle Analytics

Google Chrome Version 110 and Later 'Memory Saver' Feature May Affect Active Usage of Oracle Analytics

Read: https://blogs.oracle.com/proactivesupportepm/post/memory-saver-feature-in-google-chrome-may-affect-active-usage-of-oracle-analytics
Advisor Webcast: Security Integration of Oracle Analytics Server with E-Business Suite

ADVISOR WEBCAST: Security Integration of Oracle Analytics Server with E-Business Suite on March 29, 2023 (Doc ID 2920301.2)

Read: https://blogs.oracle.com/proactivesupportepm/post/advisor-webcast-security-integration-of-oracle-analytics-server-with-e-business-suite
Oracle named a Visionary in the 2023 Gartner® Magic Quadrant for Analytics and Business Intelligence Platforms

Gartner assesses vendors and talks about their strengths in the research. The vendors covered are recognized based on their vision and execution, including factors like Sales Execution/Pricing, Marketing Execution, Marketing Strategy, Sales Strategy etc. For the fourth year in a row, Oracle has been named a Visionary in the Gartner Magic Quadrant for Analytics and BI (ABI) Platforms.

Read: https://blogs.oracle.com/undefined/post/oracle-named-a-visionary-in-the-2023-gartner-magic-quadrant-for-analytics-and-business-intelligence-platforms
Реализация функции потерь в Python

Функции потерь Python являются важной частью моделей машинного обучения. Эти функции показывают, насколько сильно предсказанный моделью результат отличается от фактического.

Существует несколько способов вычислить эту разницу. В этом материале мы рассмотрим некоторые из наиболее распространенных функций потерь.

Ниже будут рассмотрены следующие четыре функции потерь.


Читать: https://habr.com/ru/articles/736536/
Как построить систему геоаналитики с применением ML

Геоаналитика помогает бизнесу принимать решения: где открыть магазин, построить отель или возвести новостройку с учетом доступности и популярности локации, наличия конкурентов и сотен других факторов. Решать подобные аналитические задачи с большим количеством значимых признаков помогает машинное обучение. В этой статье мы рассмотрим примеры работы сервисов геоаналитики VK Predict. Выясним, какие модели машинного обучения используются при построении таких систем и из каких этапов состоит разработка продукта с возможностями геоаналитики.

Статья подготовлена на основе вебинара команд VK Predict и VK Cloud.


Читать: https://habr.com/ru/companies/vk/articles/734102/
Loading Data from Oracle Object Storage into Oracle Fusion Analytics

This blog explains how to load data from Oracle Object Storage into Oracle Fusion Analytics.

Read: https://blogs.oracle.com/analytics/post/loading-data-from-oss-into-oracle-fusion-analytics
1
Как следить за здоровьем GreenPlum

Вопрос мониторинга GreenPlum часто оказывается непростым, особенно когда на платформе хранится действительно много данных, а запросы пользователей часто меняются. В этом посте я расскажу, как мы в «Леруа Мерлен» настраиваем инструменты Observability, находим узкие места и поддерживаем SLA кластера с GreenPlum на высоком уровне без использования проприетарных решений. Статья будет полезна DWH-архитекторам и DevOps’ам, которые планируют или уже эксплуатируют достаточно большие GP-инсталляции.


Читать: https://habr.com/ru/companies/leroy_merlin/articles/735970/
Бигдата, ты ли это?

Возможно ли не замечать “лишних” 30 Tb данных на SSD при живом настроенном мониторинге  и героически их обслуживать? Запросто, а ответы на вопросы кто же эти наблюдательные люди, как им это удалось и причем здесь PostgreSQL - ниже.


Читать: https://habr.com/ru/articles/736460/
Что такое Self-Service BI и зачем он нужен?

Habr, привет! Меня зовут Женя, и в настоящий момент я лидер направления Self-Service BI в крупном FMCG. Очень хочется начать делиться с вами своими знаниями и наработками, поэтому в рамках первой небольшой статьи решил рассказать вам максимально просто о том, а же такое Self-Service BI. Поэтому давайте познакомимся с основными подходами к построению Business Intelligence и поймем, почему важен процесс Self-Service.


Читать: https://habr.com/ru/articles/736978/
Как разработать модель выявления связанных компаний на основании анализа транзакций

На связи команда по разработке риск-моделей для крупного корпоративного, а также малого и среднего бизнеса банка «Открытие» Андрей Бояренков и Кирилл Козлитин. Сегодня мы хотим поделиться с вами процессом разработки модели выявления связанных компаний на основании транзакционных данных. Пришли к нам заказчики и говорят: «Хотим по имеющимся транзакциям наших клиентов определять, кто из контрагентов является с ними связанным».


Читать: https://habr.com/ru/companies/otkritie/articles/736990/
👍1
[recovery mode] Структурирование кредитного портфеля методами машинного обучения

Кредитные организации естественным образом располагают большими портфелями клиентских кредитов. Большими - в том смысле, что к ним начинают быть применимы законы больших чисел, предельные теоремы, а значит, и аппарат статистики, что делает естественным применение машинного обучения.

Задача разбиения кредитного портфеля на более однородные по качеству кредитов под-портфели встречается в финансах уже давно: так многие десятки лет структурируются и синдицируются студенческие займы, долги по кредитным картам, ипотечные обязательства для продажи инвесторам в виде ABS (Asset Backed Sequrities, или "ценные бумаги, обеспеченные активами"). Ярким примером такой однородной группы ABS являются печально известные subprime MBS (Mortgage Backed Sequrities, или "ценные бумаги, обеспеченные ипотечными обязательствами") – категория самых ненадёжных ипотечных займов, из-за которых разгорелся кризис 2007-2008 годов. MBS сектора кроме subprime: jumbo, prime и alt-A. Для определения к какому сектору относится конкретный ипотечный кредит, используется как правило всего пара признаков (сумма кредита, кредитный рейтинг должника). В этой статье мы рассматриваем задачу разбиения кредитного портфеля с использованием гораздо большего количества признаков: всей информации, которой обладает кредитор.


Читать: https://habr.com/ru/articles/737086/