От таблицы в Excel до собственного инструмента: как мы строили в VK Cloud решение для работы с внешними партнерами
Обмен данными между компаниями-партнерами при реализации совместных проектов — стандартная практика. Но часто есть сценарии, которые требуют особого подхода — например, из-за необходимости подстраивать формат отображения данных под специфику работы с информацией на стороне партнера.
Секреты аналитики
Обмен данными между компаниями-партнерами при реализации совместных проектов — стандартная практика. Но часто есть сценарии, которые требуют особого подхода — например, из-за необходимости подстраивать формат отображения данных под специфику работы с информацией на стороне партнера.
Секреты аналитики
PandasAI — кратно ускоряем работу аналитика данных в одну строчку
По сути PandasAI это LLM агент, который имеет доступ к Pandas. Агенту необходимо передать вопрос или указание на естественном языке, а он на основе данных найдет, построит диаграмму или преобразует данные.
Секреты аналитики
По сути PandasAI это LLM агент, который имеет доступ к Pandas. Агенту необходимо передать вопрос или указание на естественном языке, а он на основе данных найдет, построит диаграмму или преобразует данные.
Секреты аналитики
Основы теории вероятностей для будущих программистов и дата-аналитиков
Теория вероятностей — важный инструмент, который помогает создавать случайные числа для симуляций и криптографии, улучшать алгоритмы и структуры данных, а еще — разрабатывать точные модели для машинного обучения.
Секреты аналитики
Теория вероятностей — важный инструмент, который помогает создавать случайные числа для симуляций и криптографии, улучшать алгоритмы и структуры данных, а еще — разрабатывать точные модели для машинного обучения.
Секреты аналитики
Разработка фреймворка для автоматизации загрузок данных из источников
Аналитика данных и витрины аналитики — источники аналитической отчетности, на основе которой принимаются стратегические управленческие решения. Однако на рынке нет готовых фреймворков, которые полностью удовлетворяют потребности в извлечении данных.
Секреты аналитики
Аналитика данных и витрины аналитики — источники аналитической отчетности, на основе которой принимаются стратегические управленческие решения. Однако на рынке нет готовых фреймворков, которые полностью удовлетворяют потребности в извлечении данных.
Секреты аналитики
Как мы храним 20000+ метрик и миллиарды комбинаций разрезов в одной таблице
M42 — сервис для визуализации метрик. Он позволяет быстро проверять гипотезы, анализировать отклонения и оценивать инициативы. M42 — это часть единого аналитического продукта Trisigma, вторая его половина — платформа для A/B‑тестирования. Trisigma считает и визуализирует метрики в конкретных A/B‑экспериментах, а M42 помогает принимать решения глобально по продукту.
Секреты аналитики
M42 — сервис для визуализации метрик. Он позволяет быстро проверять гипотезы, анализировать отклонения и оценивать инициативы. M42 — это часть единого аналитического продукта Trisigma, вторая его половина — платформа для A/B‑тестирования. Trisigma считает и визуализирует метрики в конкретных A/B‑экспериментах, а M42 помогает принимать решения глобально по продукту.
Секреты аналитики
Перспективы профессии Data Science: ликбез для джунов
В этой статье автор расскажет, какие возможности для развития в дата-сайенс есть сейчас и какие появятся в ближайшем будущем, а ещё подсветит неочевидные для новичков особенности работы дата-сайентиста.
Секреты аналитики
В этой статье автор расскажет, какие возможности для развития в дата-сайенс есть сейчас и какие появятся в ближайшем будущем, а ещё подсветит неочевидные для новичков особенности работы дата-сайентиста.
Секреты аналитики
Играем в GOLF: как обучить нейросети точно предсказывать геометрию молекул, используя малое число данных
Автор этой статьи учится предсказывать свойства молекул, привлекая для этого нейросети — так выходит сильно быстрее, чем с помощью традиционных квантовохимических пакетов. Но есть и обратная сторона медали: чтобы нейросеть точно предсказывала энергии молекул, ей нужно очень много данных. В данном материале автор расскажет, как можно ослабить это ограничение.
Секреты аналитики
Автор этой статьи учится предсказывать свойства молекул, привлекая для этого нейросети — так выходит сильно быстрее, чем с помощью традиционных квантовохимических пакетов. Но есть и обратная сторона медали: чтобы нейросеть точно предсказывала энергии молекул, ей нужно очень много данных. В данном материале автор расскажет, как можно ослабить это ограничение.
Секреты аналитики
This media is not supported in your browser
VIEW IN TELEGRAM
Математика для Data Science: какая нужна и зачем
В этом ролике автор разбирает какая математика нужна для data science, где используется и для чего:
00:06 Пример
01:01 Школьная математика
01:39 Статистика
02:31 Линейная алгебра
03:20 Математический анализ
03:53 Теория вероятностей
04:21 Вывод
Смотреть это видео на youtube: youtu.be/wI0wnktEhGE
Секреты аналитики
В этом ролике автор разбирает какая математика нужна для data science, где используется и для чего:
00:06 Пример
01:01 Школьная математика
01:39 Статистика
02:31 Линейная алгебра
03:20 Математический анализ
03:53 Теория вероятностей
04:21 Вывод
Смотреть это видео на youtube: youtu.be/wI0wnktEhGE
Секреты аналитики
Анализ тенденций в области антифрода: как технологии проверки личности меняются и совершенствуются
В современном мире антифрод — это скрытый, но ключевой элемент защиты как для крупных бизнесов, так и для небольших компаний. Некоторые платформы активно внедряют системы антифрода для обеспечения безопасности и доверия своим пользователям.
Секреты аналитики
В современном мире антифрод — это скрытый, но ключевой элемент защиты как для крупных бизнесов, так и для небольших компаний. Некоторые платформы активно внедряют системы антифрода для обеспечения безопасности и доверия своим пользователям.
Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Интервью с Data Scientist
0:00:00 Начало
0:27:20 Переход в IT
0:38:17 Что такое Data analysis и Data Science
0:44:25 Big Data
0:45:40 Кто такой аналитик
0:46:06 Data mining
0:49:22 Машинное обучение, Deep learning, Нейронные сети
0:52:53 Data Set и обучение нейронных сетей
1:02:34 Как оценить сколько стоит Data Scientist
1:03:46 На чем пишут DS
1:08:54 Инструменты: Tableau, R, Wolfram
1:10:51 По каким процессам работает Data Scientist
1:22:37 Как развиваться чтобы стать DS и что предстоит пройти
1:26:50 Минимальные навыки, которыми должен обладать DS
1:31:25 Где брать практический опыт
1:35:05 Что спрашивают на собеседовании
1:36:17 Источники информации для обучения
Смотреть это видео на youtube: youtu.be/tQYCd8tg56U
Секреты аналитики
0:00:00 Начало
0:27:20 Переход в IT
0:38:17 Что такое Data analysis и Data Science
0:44:25 Big Data
0:45:40 Кто такой аналитик
0:46:06 Data mining
0:49:22 Машинное обучение, Deep learning, Нейронные сети
0:52:53 Data Set и обучение нейронных сетей
1:02:34 Как оценить сколько стоит Data Scientist
1:03:46 На чем пишут DS
1:08:54 Инструменты: Tableau, R, Wolfram
1:10:51 По каким процессам работает Data Scientist
1:22:37 Как развиваться чтобы стать DS и что предстоит пройти
1:26:50 Минимальные навыки, которыми должен обладать DS
1:31:25 Где брать практический опыт
1:35:05 Что спрашивают на собеседовании
1:36:17 Источники информации для обучения
Смотреть это видео на youtube: youtu.be/tQYCd8tg56U
Секреты аналитики
Инфраструктура для data engineer S3
В этой статье автор расскажет о технологии S3 со стороны дата-инженерии. Вы рассмотрите как развернуть сервис, как им пользоваться и зачем он нужен в дата-инженерии.
Секреты аналитики
В этой статье автор расскажет о технологии S3 со стороны дата-инженерии. Вы рассмотрите как развернуть сервис, как им пользоваться и зачем он нужен в дата-инженерии.
Секреты аналитики
Кино, финансы и data science
Можно заранее знать, будет ли фильм успешным? - "Да". Можем ли мы заранее знать, сколько принесет данный фильм в прокате? - "Да", но в определенном интервале и с определенными оговорками. Стоит ли вкладываться в конкретный фильм? - "Нет", скорее всего вы прогорите как инвестор. Можно ли вкладываться в "портфель проектов"? - "Да", но отобранный самым тщательным образом. "ДА-ДА-НЕТ-ДА" - это формула голосования за будущее национального кинематографа.
Секреты аналитики
Можно заранее знать, будет ли фильм успешным? - "Да". Можем ли мы заранее знать, сколько принесет данный фильм в прокате? - "Да", но в определенном интервале и с определенными оговорками. Стоит ли вкладываться в конкретный фильм? - "Нет", скорее всего вы прогорите как инвестор. Можно ли вкладываться в "портфель проектов"? - "Да", но отобранный самым тщательным образом. "ДА-ДА-НЕТ-ДА" - это формула голосования за будущее национального кинематографа.
Секреты аналитики
Media is too big
VIEW IN TELEGRAM
План обучения аналитики данных
В этом видео автор поделится подробным планом обучения аналитики данных на основе своего опыта. Вы рассмотрите принципы, которыми бы он руководствовался, если бы начинал с нуля.
Смотреть это видео на youtube: youtu.be/V3Q0cZJbFCA
Секреты аналитики
В этом видео автор поделится подробным планом обучения аналитики данных на основе своего опыта. Вы рассмотрите принципы, которыми бы он руководствовался, если бы начинал с нуля.
Смотреть это видео на youtube: youtu.be/V3Q0cZJbFCA
Секреты аналитики
Эвристики морских просторов: математическая оптимизация океанских контейнеровозов
Посмотрите вокруг. Есть высокая вероятность того, что какие-то из окружающих вас предметов прибыли к вам по морю. 90% товаров в мире перемещается по океану, зачастую на ужасно огромных грузовых судах. Но какими же будут наилучшие, наиболее оптимальные маршруты таких судов?
Секреты аналитики
Посмотрите вокруг. Есть высокая вероятность того, что какие-то из окружающих вас предметов прибыли к вам по морю. 90% товаров в мире перемещается по океану, зачастую на ужасно огромных грузовых судах. Но какими же будут наилучшие, наиболее оптимальные маршруты таких судов?
Секреты аналитики
Какую архитектуру данных мне выбрать? — подход Data-инженера (часть 1)
Сегодня данные являются одним из самых ценных активов организаций. Они играют ключевую роль в принятии стратегических решений, оптимизации бизнес-процессов и создании конкурентных преимуществ. В этом контексте инженерия данных представляет собой важнейшую дисциплину, которая охватывает весь процесс: от сбора и преобразования данных до хранения и обеспечения их доступности.
Секреты аналитики
Сегодня данные являются одним из самых ценных активов организаций. Они играют ключевую роль в принятии стратегических решений, оптимизации бизнес-процессов и создании конкурентных преимуществ. В этом контексте инженерия данных представляет собой важнейшую дисциплину, которая охватывает весь процесс: от сбора и преобразования данных до хранения и обеспечения их доступности.
Секреты аналитики
Media is too big
VIEW IN TELEGRAM
Все, что нужно знать о профессии аналитика данных
В этом видео автор разбирает кто такой аналитик данных и какие навыки ему нужны. Вы узнаете как освоить одну из самых востребованных профессий нашего времени, что ждет вас на старте карьеры и чем занимаются специалисты каждый день.
Смотреть это видео на youtube: youtu.be/MwlgWMK_GZE
Секреты аналитики
В этом видео автор разбирает кто такой аналитик данных и какие навыки ему нужны. Вы узнаете как освоить одну из самых востребованных профессий нашего времени, что ждет вас на старте карьеры и чем занимаются специалисты каждый день.
Смотреть это видео на youtube: youtu.be/MwlgWMK_GZE
Секреты аналитики
XJProfessor — помощник аналитика: преобразуем форматы данных легко и с улыбкой
При разработке интеграционного взаимодействия труднее всего даётся сопоставление различных форматов данных интегрируемых систем — «маппинг». Для этого нужно проанализировать много форматов, выявить корректные связи между элементами XSD- или JSON-схем и описать правила преобразования. Работа кропотливая, трудозатратная и не самая интересная.
Секреты аналитики
При разработке интеграционного взаимодействия труднее всего даётся сопоставление различных форматов данных интегрируемых систем — «маппинг». Для этого нужно проанализировать много форматов, выявить корректные связи между элементами XSD- или JSON-схем и описать правила преобразования. Работа кропотливая, трудозатратная и не самая интересная.
Секреты аналитики
Нужны твои навыки в работе с ИИ на МТС True Tech Hack 2026!
Тебе сюда, если ты инженер данных, разработчик или системный аналитик. 1 500 000 рублей — общий призовой фонд ИТ-соревнования.
Формат: командное онлайн-соревнование с финалом в Москве. Если нет команды — поможем найти на платформе мероприятия.
Тебя ждут три задачи на выбор — каждая с уникальной технической фишкой.
Для всех финалистов — приглашение на закрытую вечеринку, а лучших участников позовут на стажировку.
Успей зарегистрироваться до 9 апреля
Тебе сюда, если ты инженер данных, разработчик или системный аналитик. 1 500 000 рублей — общий призовой фонд ИТ-соревнования.
Формат: командное онлайн-соревнование с финалом в Москве. Если нет команды — поможем найти на платформе мероприятия.
Тебя ждут три задачи на выбор — каждая с уникальной технической фишкой.
Для всех финалистов — приглашение на закрытую вечеринку, а лучших участников позовут на стажировку.
Успей зарегистрироваться до 9 апреля
Какую архитектуру данных мне выбрать? — подход Data-инженера (часть 2)
При выборе архитектуры данных важно понимать, что каждый подход имеет свои достоинства и недостатки. Data Warehouse предлагает более структурированный подход, ориентированный на отчетность, в то время как Data Lake обеспечивает гибкость и возможности для анализа «больших данных». Data Lakehouse устраняет разрыв между этими двумя архитектурами, а Data Mesh предлагает более гибкую и децентрализованную модель управления данными. Выбор правильного подхода должен основываться на потребностях проекта и долгосрочных целях.
Секреты аналитики
При выборе архитектуры данных важно понимать, что каждый подход имеет свои достоинства и недостатки. Data Warehouse предлагает более структурированный подход, ориентированный на отчетность, в то время как Data Lake обеспечивает гибкость и возможности для анализа «больших данных». Data Lakehouse устраняет разрыв между этими двумя архитектурами, а Data Mesh предлагает более гибкую и децентрализованную модель управления данными. Выбор правильного подхода должен основываться на потребностях проекта и долгосрочных целях.
Секреты аналитики
Media is too big
VIEW IN TELEGRAM
15 секретов Excel, которые помогут вам в работе
00:34 Открытие нескольких файлов одновременно
01:12 Быстрое выделение ячеек
01:54 Перемещение по файлам Excel
02:29 Быстрое построения числовых рядов
03:36 Добавление в таблицу пустых строк или столбцов
04:13 Скоростное копирование и перемещение информации
05:01 Быстрая навигация
05:50 Быстрое изменение порядка представления данных
06:31 Изменение регистра букв
07:10 Транспонирование данных
07:45 Выделение только видимого диапазона ячеек
08:59 Быстрое заполнение пустых ячеек
09:56 Создание выпадающего списка данных
11:07 Выделение зависимых ячеек
11:46 Скрытие значений ячеек
Смотреть это видео на youtube: youtu.be/EFPzl3CNB9g
Секреты аналитики
00:34 Открытие нескольких файлов одновременно
01:12 Быстрое выделение ячеек
01:54 Перемещение по файлам Excel
02:29 Быстрое построения числовых рядов
03:36 Добавление в таблицу пустых строк или столбцов
04:13 Скоростное копирование и перемещение информации
05:01 Быстрая навигация
05:50 Быстрое изменение порядка представления данных
06:31 Изменение регистра букв
07:10 Транспонирование данных
07:45 Выделение только видимого диапазона ячеек
08:59 Быстрое заполнение пустых ячеек
09:56 Создание выпадающего списка данных
11:07 Выделение зависимых ячеек
11:46 Скрытие значений ячеек
Смотреть это видео на youtube: youtu.be/EFPzl3CNB9g
Секреты аналитики
Кажется, намечается интересная встреча для тех, кто работает с продуктовой аналитикой
18 марта пройдёт онлайн-митап от Trisigma, A/B-шницы от Авито, и hh.ru. Формат — дистанционный, так что подключиться можно из любой комфортной обстановки.
В программе — только практические темы:
— как работать с пересекающимися A/B-экспериментами и не ломать результаты
— как повышать эффективность рекламы через budget-split-тесты
— зачем нужен семантический слой, если вы хотите, чтобы AI-агенты «понимали» данные и им можно было доверять
Начало — 18 марта в 18:30 (мск). Участие бесплатное, по регистрации. Если тема продуктовой аналитики откликается, может быть будет полезно заглянуть.
18 марта пройдёт онлайн-митап от Trisigma, A/B-шницы от Авито, и hh.ru. Формат — дистанционный, так что подключиться можно из любой комфортной обстановки.
В программе — только практические темы:
— как работать с пересекающимися A/B-экспериментами и не ломать результаты
— как повышать эффективность рекламы через budget-split-тесты
— зачем нужен семантический слой, если вы хотите, чтобы AI-агенты «понимали» данные и им можно было доверять
Начало — 18 марта в 18:30 (мск). Участие бесплатное, по регистрации. Если тема продуктовой аналитики откликается, может быть будет полезно заглянуть.