DATABASE DESIGN
1.41K subscribers
2.08K photos
3 videos
5.35K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
Подборка внешних жёстких дисков и SSD-накопителей

Сегодня, когда объёмы данных постоянно растут, а терять их становится всё критичнее, использование внешнего накопителя часто становится необходимостью. У каждого из нас есть файлы, которыми мы дорожим — от рабочих документов до фотографий с домашними питомцами. При этом у жёстких дисков есть срок службы и вероятность отказа в самый неподходящий момент. У меня был подобный опыт с накопителем Seagate и ошибкой «муха СС». С тех пор я в обязательном порядке дублирую все важные файлы в облако и ещё на один диск.
Взглянуть на накопители

Читать: https://habr.com/ru/companies/first/articles/811897/

@database_design
New Atlas Administrator Learning Path and Certification

A new learning path and certification for MongoDB Atlas administrators has been introduced, providing a guide for successfully passing the Associate Atlas Administrator certification. This certification demonstrates expertise in MongoDB Atlas administration and can lead to new job opportunities. Additionally, the MongoDB Provider for Entity Framework Core is now available, allowing C# developers to build applications with MongoDB while using familiar APIs and design patterns. The provider offers advanced querying options, mapping flexibility, and supports key features for development. As a valuable tool in today's competitive job market, certifications like these can open up new career opportunities and help propel professional growth. The text discusses the challenges faced by a startup in implementing full-text search functionality and the introduction of additional resources to build a data structure that considers various elements such as brand, product name, category, and more. To enhance their service and customer experience, the company decided to introduce MongoDB Atlas based on AWS, which significantly improved search performance and reduced search failure rates. The successful implementation of MongoDB also resulted in cost savings and a more efficient use of infrastructure resources. The company plans to further enhance their search capabilities by incorporating features like fuzzy search and autocomplete. The successful adoption of MongoDB was attributed to the quality of technology provided by MongoDB Korea and the active support of their team. The company aims to continue innovating their services and solidifying their position as a leading liquor platform in Korea. Daily Shot aims to be a company that has a positive impact on the overall liquor market, not just a platform for purchasing liquor. By continuing to collaborate with MongoDB, Daily Shot plans to create a virtuous cycle structure in which it grows together with the industry by providing leading services that reflect the diverse needs of customers.

Read: https://www.mongodb.com/blog/post/new-atlas-administrator-learning-path-and-certification

@database_design
23ai Deep Dive - In-Memory Vector Join Enhancements

In Oracle Database 23ai In-Memory Deep Vectorization has been expanded to support the following additional join types: Multi-level hash joins, Multi join key, Semi joins, Outer joins, Full group by aggregation. This enhancement enables additional performance by leveraging Single Instruction Multiple Data (SIMD) vector instructions.

Read: https://blogs.oracle.com/in-memory/post/23ai-im-vector-joins

@database_design
1
Как выбрать сервер. Что лучше сегодня — готовая или сборная система

Вы, конечно, знаете, что сервер является сердцем любого онлайн-сервиса или офисной сети. Именно серверы обеспечивают работоспособность наших любимых веб-сайтов, приложений, игр и социальных сетей, а нам позволяют открывать их 24 часа в сутки 7 дней в неделю. Эта статья — для новичков, которые не задумывались, чем отличаются серверы друг от друга, какими они бывают, а также коснемся вопроса выбора сервера.

Дисклеймер: это вводный материал в серии, посвященной серверам. Тут мы разберем основные понятия. А для тех, кто с серверами "на ты", совсем скоро выйдут материалы, в которых мы более глубоко разберем различные аспекты, касающиеся серверов, с профессиональной точки зрения.


Читать: https://habr.com/ru/companies/x-com/articles/812799/

@database_design
Autonomous Health Framework (AHF) Version 24.4 Released

Oracle Autonomous Health Framework (AHF) 24.4 includes Database 23ai support, node eviction detection and resolution, ability to downgrade AHF, automatic diagnostic collection for Database performance anomalies, daster AHF Insights report generation, accessibility improvements for AHF Insights and new health checks - learn more.

Read: https://blogs.oracle.com/database/post/ahf-24-4

@database_design
VRackDB — Просто и со вкусом

VRackDB - это простая In Memory Graphite like база данных, предназначенная для хранения временных рядов (графиков). (TypeScript)

Мне, как автору базы, хотелось бы немного рассказать о ее особенностях и области применения. Покажу немного картинок, немного кода, возможно даже, немного полезной для вас информации. В общем все как обычно.
Поехали!

Читать: https://habr.com/ru/articles/813049/

@database_design
Шардирование баз данных и проектирование систем

Шардирование базы данных — это процесс её разделения на несколько машин, что способствует масштабируемости приложения. Механизм шардирования предполагает разбиение данных на два или более мелких фрагмента, называемых логическими шардами. Затем логические блоки распределяются по отдельным узлам базы данных, называемым физическими блоками, каждый из которых может содержать несколько логических блоков.

Такой подход позволяет избежать проблем с производительностью, возникающих, когда одна из машин работает в условиях перегрузки, и обеспечивает более экономичное и грамотное масштабирование. По мере увеличения объема данных и трафика все чаще возникает необходимость горизонтального масштабирования путем добавления новых машин, а не вертикального путем модернизации одного большого сервера.

Читать: https://habr.com/ru/companies/piter/articles/813133/

@database_design
The Developers' Developers: Two Australian Developers Share Their Connections to Customers



Read: https://www.mongodb.com/blog/post/two-australian-developers-share-their-connections-to-customers

@database_design
Диски для космоса и традиционное российское железо: дайджест серверных новинок за апрель

Российские вендоры в апреле не отдыхали и активно выпускали новое железо. Среди отечественных новинок — серверы, диски и системы хранения данных. Уже присматриваете новое железо для своих серверов? Тогда добро пожаловать под кат!

Читать: https://habr.com/ru/companies/selectel/articles/813485/

@database_design
PostgreSQL 16. Организация данных. Часть 1

PostgreSQL очень популярная СУБД.

Её используют во многих проектах, как новички, так и профессионалы. Однако не все понимают, как именно работает данная система и какое у неё внутренне устройство.

Давайте разберемся вместе на основе книги "PostgreSQL 16 изнутри" и официальной документации!


Читать: https://habr.com/ru/articles/813781/

@database_design
Apache NiFi как доступный ETL инструмент: кейс применения + тестовый стенд Docker

В статье расскажу о практических аспектах использования Apache NiFi, опишу преимущества и проблемы, с которыми я столкнулся.

Для наглядности собрал "песочницу" в контейнере Docker, в которой представлены упрощенные примеры пайплайнов, аналогичные тем, которые были использованы в реальном проекте.


Читать: https://habr.com/ru/articles/813813/

@database_design
Announcing DirectQuery Support for the MongoDB Atlas Connector for Power BI



Read: https://www.mongodb.com/blog/post/announcing-direct-query-support-for-mongodb-atlas-connector-power-bi

@database_design
Oracle Globally Distributed Database addresses multi-country data residency challenges for Munich Re HealthTech

Oracle Globally Distributed Database helped Munich Re HealthTech comply with data residency regulations while cutting the cost of deploying the entire application stack for multi-region deployment.

Read: https://blogs.oracle.com/database/post/globally-distributed-database-munichre-data-residency

@database_design
How the NFSA is Using MongoDB Atlas and AI to Make Aussie Culture Accessible



Read: https://www.mongodb.com/blog/post/how-nfsa-is-using-mongodb-atlas-ai-make-aussie-culture-accessible

@database_design
Make Better Maps for Your Apps with Spatial Vector Tiles and H3 in Oracle Database 23ai

Powerful, popular spatial data formats for developers can now be natively generated by Oracle Database. Developers can use SQL to generate vector tiles and H3 hierarchies from geometries stored in the database using Oracle Spatial, for fast and flexible map visualization in web applications.

Read: https://blogs.oracle.com/database/post/make-better-maps-for-your-apps-with-spatial-vector-tiles-and-h3-in-oracle-database-23ai

@database_design
Почему люди до сих пор не отказались от дискет


Музыкант Эспен Крафт хранит свои звуковые сэмплы на гибких дисках и использует их для создания музыки из-за их аутентичного звука

Последний гибкий диск был изготовлен больше десятка лет назад, сегодня на нём не хватит места даже для хранения фотографии с современного смартфона. Так почему же некоторые люди до сих пор любят ими пользоваться?

Когда в голову Эспена Крафта приходит идея нового музыкального произведения, он открывает одну из своих многочисленных коробок с дискетами. Открыв коробку, этот ютубер из Норвегии пробегает глазами по рядам разноцветных пластмассовых квадратов.

На одной из этикеток написано «Басовый звук Moog». Именно то, что нужно Крафту. Он достаёт диск и засовывает его в синтезатор. Машина подтверждает наличие диска приятным шумом. По словам Крафта, после этого начинается магия.

Сэмпл почти готов к воспроизведению, но именно предвкушение зарождает ностальгию Крафта по «тёплому и уютному месту». Идея уже висит в воздухе. Он нажимает на клавишу. Уши наполняются звуком.

Если вы помните времена, когда пользование гибкими дисками не казалось чем-то странным, то вам, вероятно, не меньше тридцати лет. Гибкие диски, или дискеты, появились примерно в 1970 году, и около трёх десятков лет были основным способом хранения и резервного копирования компьютерных данных. Всё приобретаемое людьми ПО и программы загружались на пачки таких дисков. Это технология из другой компьютерной эпохи, но по разным причинам дискеты по-прежнему привлекательны для некоторых людей, а значит, ещё не умерли.

Читать: https://habr.com/ru/companies/ruvds/articles/814501/

@database_design
Payments Modernization and the Role of the Operational Data Layer



Read: https://www.mongodb.com/blog/post/payments-modernization-role-of-operational-data-layer

@database_design
Как утилизировать цифровой мусор?

Хочу поделиться проблемой, которая меня давно волнует. С детства я привык к порядку и комфорту: начиная от своей комнаты и заканчивая ведением тетрадей. Когда всё на своих местах и нет ничего лишнего, мне легче работать и приятнее находиться в такой обстановке.

Это отношение я перенёс и в цифровой мир. Будучи разработчиком, я стараюсь поддерживать порядок и чистоту в коде и виртуальном окружении. Конечно, я далек от совершенства, но всё же прилагаю усилия к аккуратности. Я не требую того же от других, пока это не вредит окружающим (или мне).

Однако, когда избыточные данные, перегруженные базы данных и хаос в системе становятся нормой, это превращается в проблему не только для разработчика, который может игнорировать её, но и для всей компании и её пользователей. Это приводит к серьезным потерям: финансовым из-за затрат на содержание всех этих данных и операционным из-за повышенного энергопотребления и вычислительных расходов.

Сегодня объем новых данных растет с экспоненциальной скоростью, и так же увеличивается количество цифрового мусора. Этот термин относится к огромному количеству избыточных, устаревших или незначительных данных, которые накапливаются в наших информационных системах и захламляют их. Цифровой мусор затрагивает практически каждый аспект современного управления данными, от снижения операционной эффективности до усложнения соблюдения законов о защите данных. Кроме того, экологические издержки поддержания бесполезных данных огромны, что ведет к ненужной нагрузке на нашу природу.


Читать: https://habr.com/ru/articles/814667/

@database_design
Ceph: разбираем базовые операции в кластере на примере интеграции с Hashicorp Nomad

Привет! Я Владимир Иванов, системный администратор выделенных серверов в Selectel. Мы довольно часто экспериментируем с подходами, процессами и решениями. В одном из экспериментов добрались до Ceph: сделали тренажер, в котором можно «потыкать» основной функционал хранилища, проверить гипотезы, что-то сломать/починить, не собирая при этом железный кластер. В случае фейла этот тренажер можно развернуть заново в пару консольных команд.

Так и появилась идея написать эту статью. Я покажу, как подключить Ceph к оркестратору Nomad, чтобы получить постоянное хранилище для контейнеров. Если хотите поближе познакомиться с примерами эксплуатации и обслуживания Ceph, прошу под кат! А если уже знакомы — прошу в комментарии, поделитесь своим опытом.

Читать: https://habr.com/ru/companies/selectel/articles/814507/

@database_design
Postgres Pro Shardman: горизонтальное масштабирование реляционных СУБД

Последние несколько лет мы в Postgres Professional активно занимаемся разработкой своего решения для горизонтального масштабирования PostgreSQL. Пользователям нужен был простой способ увеличить производительность путем добавления узлов. Традиционно для веба в таких случаях просто брали NoSQL базы или шардировали вручную, позже появились распределенные SQL-решения с поддержкой ACID-транзакций. Тем не менее терялась часть возможностей и достоинств PostgreSQL. Корпоративный рынок тяжелых вертикальных решений также сильно ограничен как ценой, так и доступностью. Поэтому исследованиями в области распределенных СУБД в компании занимались еще с 2017 года, а в 2020 началась работа над коммерческим продуктом.

В этой статье я расскажу про технические детали реализации и почему был сделан такой выбор технологий. Опишу, какие направления нам показались преждевременными и их пришлось отложить, а также что мы ожидаем в будущем.


Читать: https://habr.com/ru/companies/postgrespro/articles/811041/

@database_design