Data Analysis / Big Data
2.82K subscribers
570 photos
4 videos
2 files
2.68K links
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels
Download Telegram
Практика работы с файлами и базой данных в Laravel и ChatGPT

Рассказываем, как ChatGPT справилась с обработкой данных. Модель попросили взять данные из таблицы, перенести их в БД и экспортировать в csv.

Читать: «Практика работы с файлами и базой данных в Laravel и ChatGPT»
Дайджест Python #10: генерация голоса и оценка скорости Mojo

Собрали новости Python с 15 по 31 мая. Узнайте, как сгенерировать голос человека на Python и во сколько раз Mojo быстрее Python на самом деле.

Читать: «Дайджест Python #10: генерация голоса и оценка скорости Mojo»
Спринт-интенсив Visiology: +300 к HR-карме бренда и куча красивых дашбордов

Привет, Хабр! Буквально на прошлой неделе мы завершили наш небольшой спринт-интенсив. Он доказал, что за 10 дней вполне можно познакомиться с платформой Visiology до такой степени, чтобы начать делать свои собственные дашборды, разбираться с особенностями загрузки данных и построения модели и другими нюансами работы с BI. Что интересно, в нашем спринте принимали участие как опытные BI-щики, так и начинающие специалисты. Под катом — несколько мнений активных участников, а также примеры дашбордов, созданных в ходе обучения.
Узнать, как это было...

Читать: https://habr.com/ru/companies/visiology/articles/740438/
Overview of Areas of Responsibility and Custom Security in Oracle Fusion HCM Analytics

This article provides an overview of Areas of Responsibility and how they are used to set up custom security in Oracle Fusion HCM Analytics. It provides links to additional blogs that cover detailed use cases.

Read: https://blogs.oracle.com/analytics/post/overview-of-aor-custom-security-in-hcm-analytics
PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив

Тимлид команды аналитики и DS в Авито Александр Ледовский рассказал, как быть, когда нужно посчитать что-то на pySpark, чтобы потом выгрузить.


Читать: https://habr.com/ru/companies/avito/articles/740232/
BI система на прокачку: как мы используем плагины Fine BI

Вот уже больше года, мы в BI Consult работаем с китайской платформой self service BI-анализа – Fine BI. Работаем, изучаем, интегрируем и рассказываем. На этот раз хотим сделать акцент на интересном и актуальном вопросе - Плагины.

Расскажем про магазин плагинов, составим для вас список полезных плагинов, покажем как устанавливаются плагины без смс, регистрации и одноразовых SIM карт.

В конце статьи вы найдете список всех плагинов, поддерживающих английский язык с описанием, которые подтверждены вендором и готовы к работе.


Читать: https://habr.com/ru/articles/741304/
Почему для MLOps лучше выбирать Open Source, а не проприетарное ПО

Самому обеспечивать гибкость и контроль собственного ML-пайплайна — это важно. Команды по машинному обучению могут использовать проприетарные платформы или создавать собственные решения с помощью Open-Source-инструментов. Компании часто представляют проприетарные платформы как более мощные, эффективные и простые в использовании. Но в действительности они часто оказываются более сложными и менее мощными, чем их Open-Source-конкуренты.


Читать: https://habr.com/ru/companies/vk/articles/735720/
Что такое Dython

Обозреваем Dython (Dynamic Python) – библиотеку Python для лёгкого анализа данных, особенно в области анализа зависимостей и корреляций.

Читать: «Что такое Dython»
Меч из озера: итоги сезона больших данных

…Из Data Lake вынырнула прекрасная дева и протянула Артуру меч, и на том мече рунической вязью было начертано «Big Data». «Пусть он служит тебе верой и правдой, пронзая тьму незнания и проливая свет на самые неочевидные закономерности», — торжественно произнесла Владычица Озера. Король Артур преклонил колени и принял меч из рук девы. Затем оседлал коня и направился в сторону ближайшего дата-центра.

Сезон больших данных на Хабре подошёл к концу. Сегодня мы поговорим о том, какими знаниями вооружили нас авторы сезона, раздадим ценные артефакты, а заодно — побеседуем о перспективах больших данных с авторами сезона и экспертами Газпромбанка.


Читать: https://habr.com/ru/specials/741742/
Oracle Analytics a Leader in Forrester Wave for Augmented BI Platforms

Oracle has been recognized as a Leader in The Forrester Wave: Augmented Business Intelligence Platforms, Q2 2023, authored by Boris Evelson. Oracle’s rating in the Wave carries significant weight as Forrester Research is one of the most respected and influential analyst firms that C-level executives globally consult before making buying decisions. For our customers and partners, the position as a Leader position validates their choice to work with Oracle Analytics.

Read: https://blogs.oracle.com/analytics/post/oracle-analytics-a-leader-in-forrester-wave-for-augmented-bi-platforms
Форматы данных и файлов: руководство для архитекторов

В мире данных происходит революция. Сегодня волна Open-Source-форматов данных, поднявшаяся благодаря развитию технологий, меняет привычное положение дел для всех участников экосистемы, от поставщиков до предприятий. Вы наверняка слышали о таких форматах, как Parquet, ORC, Avro, Arrow, Protobuf, Thrift и MessagePack. Команда VK Cloud перевела статью о том, что они собой представляют и какой из них лучше выбрать.


Читать: https://habr.com/ru/companies/vk/articles/741702/
Data Fusion Contest. Издание 2-ое, переработанное и дополненное

Соревнование Data Fusion Contest 2023 в этом году состоялось во второй раз и собрало  сильнейшие индустриальные команды и отдельных любителей моделей алгоритмов машинного обучения. Кто-то участвовал впервые, а кто-то, уже умудрённый прошлым опытом был явно настроен только на победу.

В этот раз мы решили принципиально изменить задание и придумали новый формат. Что произойдет, если столкнуть лицом к лицу участников, мотивированных атаковать модели машинного обучения, с другими участниками, мотивированными свои модели защищать? Кто победит, каким окажется тот стек моделей и подходов, который приведет к победе? Что важнее, знания и опыт, или гибкость ума или нестандартные подходы?

Мы задали себе все эти вопросы и решили найти ответы на практике, подготовив для участников Data Fusion Contest 2023 очень нестандартное и по теме и по формату соревнование по Adversarial ML с атаками на модели машинного обучения, а также с их защитой.

Давайте разбираться, что из этого получилось по факту, и какие решения предложили участники, чтобы оказаться в рядах победителей!


Читать: https://habr.com/ru/companies/vtb/articles/741500/
Построение BI-системы: вы могли об этом забыть…

Привет, Habr! Совсем недавно я опубликовал статью про Self-Service BI: что же это такое и зачем он нужен крупным компаниям. Но теперь хочется немного отойти непосредственно от Self-Service и вернуться в целом к построению BI-систем. В 2021 году я выступал на Analyst Days с одноименным докладом. Запись выступления ниже (казалось бы, причем тут автомобили?):


Читать: https://habr.com/ru/articles/742026/
ТОП-5 мобильных приложений для изучения Python

Собрали несколько популярных мобильных приложений для изучения Python и не только и описали их плюсы и минусы.

Читать: «ТОП-5 мобильных приложений для изучения Python»
👌2👍1
Подборка актуальных вакансий

Бизнес-аналитик
Где: удалённо
Опыт: от 1 года

Системный аналитик
Где: удалённо
Опыт: от 1 года

Аналитик
Где: удалённо
Опыт: от 1 года

Аналитик
Где: удалённо
Опыт: от 1 года

Системный аналитик
Где: удалённо
Опыт: от 2 лет

Full-stack аналитик
Где: удалённо
Опыт: от 2 лет

Аналитик
Где: удалённо
Опыт: от 2 лет

Web-аналитик
Где: Москва, можно удалённо
Опыт: от 2 лет

Системный аналитик
Где: Москва, можно удалённо
Опыт: от 2 лет

Аналитик ПО Диасофт FA# (Digital Q)
Где: Москва, можно удалённо
Опыт: от 2 лет

#вакансии #работа
Дайджест Python #11: шаурмичная на Python и AI-плагины для разработки

Лучшие статьи о Python с 1 по 15 июня: как готовить шаурму с Python, как создать чатбот на ruT5 и какие есть AI-плагины для разработки.

Читать: «Дайджест Python #11: шаурмичная на Python и AI-плагины для разработки»