Data Analysis / Big Data
2.84K subscribers
557 photos
3 videos
2 files
2.63K links
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels
Download Telegram
Разработа DWH с нуля – особенности архитектуры

Проект по построению DWH с нуля был запущен по инициативе Заказчика в рамках крупной трансформации управленческой отчетности и аналитики.

В статье расскажу, как мы выстроили архитектуру DWH, какие подходы использовали на каждом уровне, с какими подводными камнями столкнулись и как обеспечили стабильную поставку данных для аналитики.


Читать: https://habr.com/ru/articles/935212/

#ru

@big_data_analysis | Другие наши каналы
👍1
StarRocks 3.5: Snapshot, Load Spill, партиции, MV, транзакции, безопасность

StarRocks 3.5 приносит точечные улучшения по надёжности, производительности и безопасности: кластерные Snapshot для DR в архитектуре shared-data (разделение хранения и вычислений), оптимизацию пакетной загрузки (Load Spill) для сокращения мелких файлов и пропуска Compaction, более гибкое управление жизненным циклом партиций (слияние по времени и автоматический TTL), многооператорные транзакции для ETL, ускорение запросов по озеру данных через автоматические глобальные словари, а также поддержку OAuth 2.0 и JWT.


Читать: https://habr.com/ru/articles/935216/

#ru

@big_data_analysis | Другие наши каналы
Поисковые подсказки: подход «генератор-дискриминатор»

Всем привет! Меня зовут Федор Курушин, я занимаюсь машинным обучением в поиске Wildberries. Прямо сейчас я работаю над развитием сервиса персональных поисковых подсказок.

Недавно вместе с коллегой мы представляли нашу совместную работу Product Search Prompts: Generator-Discriminator Approach на конференции FICC 2025.

О подходе, который мы разработали для создания поисковых подсказок и для поиска релевантных похожих запросов для разных бизнес-сценариев, и пойдет речь в этой статье.


Читать: https://habr.com/ru/companies/wildberries/articles/934674/

#ru

@big_data_analysis | Другие наши каналы
Как внедрить векторный поиск в Oracle Analytics: пошаговое руководство. В статье подробно объясняется процесс настройки и использования векторного поиска в Oracle Analytics, что поможет улучшить аналитические возможности и ускорить обработку данных.

Читать подробнее

#en

@big_data_analysis | Другие наши каналы
Волны автоматизации в IT: эволюция требований рынка

Развитие ИТ с 1950 до наших дней рассмотрим 5 волн развития, что было со специалистами и технологиями. Попробуем угадать тренды и сделать рекомендации по развитию

Читать: «Волны автоматизации в IT: эволюция требований рынка»

#ru

@big_data_analysis | Другие наши каналы
⚙️ Как запускать инференс без перегрузки и лишней настройки

Мы часто видим, с чем сталкиваются разработчики: медленная генерация, нестабильный интерфейс, конфликты зависимостей и сложности при смене пайплайнов на локальной машине.⠀

В immers.cloud всё проще:

💰 Посекундная тарификация: тарифы от 23 руб/час, платите только за время, когда сервер реально работает.
⚡️ Быстрый старт: нужный сервер поднимается за пару минут.
📈 Гибкость и масштабируемость: 12 моделей видеокарт на выбор
🔧 Удобство: готовые образы для ваших задач, чтобы не тратить время на настройку.

А если нужно прерваться — можно просто заморозить ВМ с помощью функции Shelve: данные сохранятся, а платить за простои не придется.⠀

Если вам важен результат, а не настройка серверов — в immers.cloud всё готово для ваших проектов.⠀

🔗Начать и получить +20 % к первому пополнению
111
Как AI-редактор Cursor меняет процесс разработки — и стоит ли ему доверять

Одним из крупнейших сдвигов в современном софтверном девелопменте стало стремительное распространение AI-инструментов для написания кода. Эти решения помогают как разработчикам, так и людям без технического бэкграунда быстрее писать код, запускать прототипы и готовые приложения. Среди таких инструментов достаточно быстро привлёк внимание Cursor, почти сразу он занял позицию одного из лидеров рынка.

В этой статье я подробнее рассмотрю Cursor, его сильные и слабые стороны, а также сравню его с другими AI-редакторами кода. Это будет практический гайд, в котором я поделюсь своим опытом использования Cursor для создания to-do приложения. К концу материала у вас сложится четкое представление о том, подходит ли Cursor для вашего собственного девелоперского workflow.

Поехали.


Читать: https://habr.com/ru/articles/935966/

#ru

@big_data_analysis | Другие наши каналы