Мультивселенная СУБД
181 subscribers
114 photos
1 video
4 files
256 links
Канал для тех, кто хочет стать супергероем этой мультивселенной
Download Telegram
📚Data integrity and complexity are seen as top challenge for DBAs

Компания Quest Software сделал аналитический отчет на тему: "The Database Management Market Landscape and the Evolving DBA" в вольном переводе, "Конъюнктура рынка управления базами данных и эволюция DBA".
Компании должны инвестировать в правильные инструменты и процессы, чтобы иметь возможность управлять всей экосистемой баз данных, состоящей из мультиплатформенных сред, с учётом требований к безопасности данных и приложений на основе ИИ

Прекрасный тезис на тему моего доклада на PG.Conf.2025. Бизнесу нужен серьезные Enterprise Manager, который сможет управлять всей инфраструктурой данных.
Полученные результаты указывают на растущий разрыв в ожиданиях, поскольку от администраторов баз данных ожидается, что они будут выполнять более стратегические функции, но многие из них по-прежнему сталкиваются с проблемами интеграции и неопределённостью в отношении влияния ИИ на их работу.

Из обычных ДБА пытаются сделать архитекторов данных. Причем первых никто не спросил. В добавок уже рутинная пугалка, что "ИИ всех заменит" явно не мотивирует людей его внедрять в компанию. "Я же сам себе не враг" (с)
Как финалочка статьи:
40 процентов администраторов баз данных изначально не были наняты на эту должность, что отражает растущий дефицит навыков в управлении базами данных и необходимость постоянного обучения и программ повышения квалификации.

На самом деле ситуация парадоксальная 😱. Даже сейчас на рынке вакансий можно найти 100500 заявок на DBA PostgreSQL, а на DBA MongoDB, Redis/Valkey, Tarantool, Neo4j или Cassandra нет почти ни одной . Может что-то и всплывёт, но не факт. Странно как-то. Однако, вакансий разработчиков под эти СУБД вагон и маленькая тележка. Складывается впечатление, что разработчики выполняют функции DBA. Бедняжки...😭
Когда выдаешь желаемое за действительно...

С пятницей

#mems
😁2
📚Выбор индексов в базах данных для highload-систем

Статья большая, и явно не для всех. Я стараюсь тему оптимизации обходить стороной, т.к. это очень узкая и холиварная тема. Сам обзор забавный, но уж очень общий. Как было сказано в комментах, может статью ИИ сгенерил, а автор чуток "причесал"?

Много теории и 0 практики. Если бы были какие-то пруфы (замеры скорости, сравнения), тогда еще ладно.

Короче, статья на заметку тем, кто хотел бы написать что-то своё.
📚 По разбираем прикольные статеечки с Хабра.
1️⃣ DWH: История поиска альтернативы PostgreSQL и Snowflake. Часть 1

Статья от OTUS. Этим всё сказано. Я понимаю, что это перевод, но по стилю очень близок ко всем публикациям Учебного Центра OTUS.

Мне очень нравится, что OTUS публикует материалы о СУБД, но почему-то они всегда какого-то низкого качества. Их даже нельзя назвать верхне уровневыми. Всё слишком поверхностно и с ошибками. Не понимаю причины этого. OTUS - имеет огромное количество курсов по СУБД и там работают хорошие специалисты. Не лучшие, но хорошие. Почему-то к своему блогу максимально посредственное отношение. Надеюсь, что цель статьи - побудь читателя гуглить понравившиеся названия СУБД или подходы.

2️⃣High Availability в Postgres Pro без головной боли -BiHA (Built-in High Availability)
Эта статья больше для меня. BiHA - это прокаченный аналог опенсорсного Patroni. Если Patroni уже чуть ли не принятый стандарт по обеспечению высокой доступности для PostgreSQL, то BiHA это относительно новый продукт. Он появился в 2023 году (если меня память не подводит). Главное его отличие от Patroni - отсутствие требований к установке Distributed Configuration System (DCS) в лице ETCD, Consul и т.п. Фактически PostgresPro вшили в Patroni протокол RAFT и всё. Однако, сами разработчики Patroni отказались от этой идеи. Почему? Не понимаю... Наверное это слишком трудозатратно что ли...

К чему это всё?! Я планирую как-то "пораскапывать "Patroni" в свободное время и написать несколько лекций и практических заданий по нему. Сейчас на рынке курсы и материал по Patroni откровенно говоря - плохой. Сам прошел курс от УЦ Форс по Patroni и был крайне ими не доволен. Отвратительно

3️⃣Почему сложно разработать OLAP-базу данных, если у тебя уже есть OLTP

Яндекс всё грезит своими HTAP вычислениями и HTAP СУБД. 2024 год прошел с рядом статей и выступлений от них, так и сейчас. Статья большая, но как всегда, всё самое интересное в комментариях. Один из комментаторов написал краткую выжимку из статьи.

Моё мнение - как R&D активность направление супер! Можно написать ряд кандидатских работ или может быть даже докторскую. Я не разработчик и не особо погружен в это, поэтому остаюсь лишь наблюдателем. Может быть как одна из тем НИР для студентов вполне подойдет.

4️⃣Firebird Conf 2025: до 13 апреля открыт прием заявок на выступление

Пойду на эту конференцию во второй раз. В целом, продукт Firebird и наш форк РедБазаДанных довольно интересны. Эту СУБД можно часто увидеть в колледжах и ВУЗах страны. Её рекламировали на банковских форумах. Однако, если мы говорим про ИТ-сектор, то про эту СУБД до сих пор почти никто не знает. Публичных специалистов нет. Выступлений нет. Тишина в DevRel активностях. Самое забавное, что ничего не меняется. Прошло уже три года после ввода санкций и...ничего. Будет конференция, узнаю состояние дел.
🎥 Spring Release: Redis 8

Коротенький видос о новых возможностях в весеннем релизе Redis 8 (вроде 1 мая , т.е сегодня). Обещают нативную поддержку 8 новых структур данных! Включая JSON, вероятностные структуры и векторный поиск. Теперь не надо дополнительно приседать с добавлением внешних модулей. Всё будет доступно из коробки.

Конечно же куча оптимизационных фич, которые частично были "перенесены" из форка опенсорсного Valkey.

Надеюсь Valkey и себе заберем фичу с поддержкой новых структур данных. Сейчас это кажется чуть ли не киллер-фичей нового релиза!
👍1
Картинка для размышлений...

С пятницей!

#mems
🤔2
🐣 Спустя месяц дошли руки поделиться впечатлениями по конференции PGConf.Russia 2025.

❗️Доклады доступны бесплатно для студентов и преподавателей❗️

Остальным будет доступ через год.

🏆Это мой первый спикерский опыт на подобного уровня конференции и конечно очень здорово! Мне понравилось, пойду еще 😜

Рекламировать какие-то доклады не буду, у кого есть желание посмотрите программу и выберите то, что вам по душе.

Расскажу немного о самой конфе:

❇️ Под конференцию было выделено 2 этажа. На первом этаже был гардероб, ресторан и стенды партнеров конференции. Среди них УЦ ФОРС, Selectel, YADRO, КиберБэкап и это почти все. Стенды маленькие и не особо интересные. Буквально за 30-40 минут можно всё обойти и со всеми поговорить.

Второй этаж полностью был выделен под продукты PostgresPro. И сам этаж огромный! Куча места и куча стендов! Сразу видно "кто здесь папка" (с) Можно было поговорить с любыми специалистами и узнать про каждый продукт. Я бы отметил
👉 ChatPPG - ИИ для работы с СУБД
👉 Postgres Pro Machine - это программно-аппаратный комплекс с PostgresPro или Shardman на борту. Компании Скала-Р приготовиться. Это явно их конкурент (хотя на конфе говорили обратное, но я так не считаю).
👉 PPEM - Enterprise Manager для Postgres. Я как раз делал доклад о нём.

Общение со всеми участниками и спикерами было очень продуктивным. Сформулирую тезисы, которые меня зацепили и думаю взять их на проработку:

👉 Greenmask - опенсорс проект моего бывшего студента по созданию аномизированного бэкапа Postgres. Можно поучаствовать в его развитии.

👉 Взять лицензию на продукт Shardman для МФТИ и внедрить его в курс.

👉 Расширить свой доклад про Enterprise Manager'ы на большее количество участников и сделать само исследование более качественным.

👉 Провести нагрузочное тестирование EM на 10/100/1000 экземпляров PostgreSQL с целью оценки потребляемых ресурсов.

👉 R&D по новым реалиями (вызовам) при проектировании схемы данных. Появились распределенные СУБД. Как меняется процесс проектирования схемы БД? Что нового добавляет распределенный SQL?

👉 Хранение данных в СУБД обычно либо построчное, либо поколоночное. Что если хранить данные по ячейкам? Каждая ячейка это объект в key-value хранилище (redis,valkey)? Как такой подход меняет OLTP и OLAP нагрузку?

👉 PostgresPro занимается обновление курсов DBA1,DBA2,DBA3,DEV1,DEV2 с PG13 на PG16. Это занимает уже больше года. Над каждым курсом трудится по 4 человека. Куча ресурсов потрачено на обновление курса! Это даже не разработка с нуля! Сколько я в мозгу эту ситуацию не обдумывал, но не могу даже представить, что объем работы настолько большой. Кажется это какой-то обман и вброс. Может так говорят, чтобы другие не пытались? 🧐

👉 PostgresPro оказывает поддержку ваннильной версии Postgres и по всей экосистеме, включая Patroni. Как я понял, конкуренция на этом рынке слабая. ⬇️

👉 PostgresPro настолько много денег, что они даже не думаю о выходе на рынок СНГ. РФ им достаточно.

Вкратце, это всё. Конфа супер! 😉
🎥 в качестве продолжения предыдущего поста расскажу про DevOpsConf 2025 (7-8 апреля 2025).

💥Это конференция от Онтико, а они съели не одну собаку на организации подобных мероприятий. К докладами и их качеству у меня претензий нет. К организации тоже.

Я посещаю эту конференцию уже второй раз и закрепляюсь во мнение, что это Mini-Highload++. Прям со всем мини. Площадка та же, но спонсоров и стендов раз в три меньше. Из-за этого конференция кажется пустой. И народу признаться тоже раза в 2-3 меньше.

Однако встретил своих бывших студентов с МФТИ. Кто-то были просто как участники, кто-то был спикером! 👍 Супер! 🔥 Пообщались от души. На второй день встретился со своим бывшим старшим товарищем из колледжа (МГКИТ тогда)😱. Очень интересно как народ 2005-06 годов выпуска устроился в жизни. Я даже подумываю организовать встречу выпускников, а-ля, 20 лет спустя. Посмотрим 👨🏻‍🦳👵🏻

Что касается самих спонсоров конференции... то были сплошные облачные провайдеры☁️🌧😶‍🌫️, форки кубера и платформа всего и вся от OrionSoft (Zvirt). Скучно 🥱. Мерча вообще толком не набрал. Билеты на секундочку стоят 105 000 рублей! 💰Довольно дорого.💸 С мерчем реально засада. Поэтому пришлось ходить на доклады...🧐

От меня хотят статьи в базу знаний, почему они ко мне пристали и зачем мне это? Анастасия Граф
Хоспади, очень крутая женщина! 💪 Моё почтение! 🎩Надавила на больную мозоль многих компаний. Создание и поддержка базы знаний в компании - колоссальная работа! Здорово, что руководство это понимает и создаёт отделы по контролю и управлению знаниями. Особенно круто, если это работает! Я тружусь уже более 16 лет в разных организациях и до сих не видел нигде адекватной системы контроля. Не могу найти 🙃

Компетенции и уровни развития инженера инфраструктуры. Системный взгляд, Тимур Батыршин
Сам доклад может и неплохой, но посыл отвратительный 😨. "Если ты хочешь развиваться, то бери больше ответственности" (с)
Ужасный тезис! Фууу! Эта фраза у всех компаний (где я работал и работаю) взято в абсолют. Чаще всего, кроме большей ответственности, тебе ничего не дают. Сам проходил и видел как коллеги корячатся. 🥶Брррр... Я до сих пор не знаю как лучше следует поступать, если ты хочешь продвигаться по карьерной лестнице внутри компании. Такое ощущение, что надо сразу ставить условия, рамки с руководителем и с руководителем повыше 🔲. Составлять план и заставить всех под ним подписаться. Наверное это утопично звучит, может у кого был иной опыт. Короче, очередная больная мозоль 🤯

Состояние инжиниринга на 2025 год, Игорь Курочкин
Супер доклад! 💪 В меру научный, глубоко аналитический и подан просто прекрасно. Мне было интересно слушать. И конечно же, это очередная боль многих людей. Работая в компании и "беря на себя дополнительную ответственность" ты не понимаешь кто ты? Что ты за специалист? 🤷‍♂️Если ты сейчас уволишься, то на какую вакансию ты пойдешь? У меня за мой карьерный путь до сих пор не сформировалось этого чувства. Какая вакансия мне идеально подойдёт? По факту я знаю очень много, но глубоко знаю не так много. Идти на вакансию в той области, где у меня максимум компетенций я не хочу. Перерос уже. ☹️

Короче, спикер попытался как-то поделить людей по категориям и дать им понимание кем они являются в идеологии DevOps. Очень круто. 😎 Послушал бы я подобный доклад лет 15 назад, то возможно карьера сложилась иначе 🍀

Что-то я тут много личных переживаний излил. Пора заканчивать. Конфа крутая, даже не точки зрения хард-скиллов, а точки зрения культуры, атмосферы и софт-скиллов. 🍻
🔥2
📚 Picodata — альтернатива и drop-in-замена Redis

Radix - специальный инструмент для замены Redis на Picodata.

Слышал об этом еще года 4 назад от товарищей их VK.Tarantool.

Идея в том, что есть некий кластер Redis. Допустим из 6 нод. Затем ты настраиваешь новою ноду на picodata. Одеваешь ей плагин Redix и затем меняешься добавляешь её в кластер с ролью реплики. Новая нода ведет себя как redis. Один-в-один. Затем одну из нод удаляешь из кластера.

Далее проварачиваешь этот фокус со всеми нодами кластера и по этого у тебя кластер redis превращается в кластер picodata.

Сама идея - супер! Я очень бы хотел сам это руками потрогать и провести несколько тестов! Странно, что в Picodata только сейчас его опубликовали. Мне казалось такой плагин у них всегда был. Оказывается нет.

Мне очень интересные бизнес-кейсы, когда почему заказчик решил пойти на такой шаг? Зачем менять Redis на Picodata? Это же явно несет доп.издержки. Надо будет обсудить эту тему в комьюнити и на конференциях.

Кстати, ближайшая конференция 23 и 24 июня 2025.
Saint HighLoad++ 2025. Поеду в Питер ради этого!
👍1
📚 Переход из Oracle в Postgres Pro: не просто смена СУБД, а сдвиг подхода. Интервью с Марком Ривкиным

Весьма интересное интервью с руководителем консалтинга PostgresPro Марком Ривкиным.

Попробую выбрать главное
👉Переход из Oracle в Postgres Pro. Сообщество Oracle огромное и контента по это СУБД очень много. По PostgreSQL всего в разы меньше или нет вообще. Команде Марка пришлось очень много разрабатывать самим.

Я соглашусь, книг, курсов, демо, вебинаров по OracleDB и экосистеме в целом - очень много. Контентмейкеры по PostgreSQL только начинают раскручиваться.

👉Разработка недостающих функций: Команда выявила отсутствие ряда привычных механизмов из Oracle, таких, как Resource Manager, Enterprise Manager, Real Application Cluster (RAC), Oracle Flashback и поддержка пакетов. Это побудило их активно взаимодействовать с разработчиками Postgres Pro для внедрения необходимых функций.

Макр очень много внимания уделяет RAC. Почему-то он считает, что PostgrePro с мультимастером всё-равно отстаёт с RAC. Если товарищи из PostgresPro будут разрабатывать своё железо и сделают аналог Oracle Exadata - это будет бомба!

👉 Взаимодействие с руководством и сообществом: Руководство Postgres Professional оказалось открытым к предложениям и критике, что позволило эффективно внедрять улучшения и адаптировать продукт под нужды корпоративных клиентов.

Тут конечно полностью согласен с тем, что компания Postgres Professional вложила огромный бюджет в макетинг и продвижение своих продуктов. За последние 2 года вышло куча книг по СУБД. Почему другие вендоры не выпускают книги, я не понимаю... Самому что ли написать?

👉Взгляд в будущее: В интервью также обсуждаются перспективы российских форков PostgreSQL, роль искусственного интеллекта в администрировании баз данных и размышления о том, как бы Марк Ривкин проектировал СУБД с нуля.

Полностью согласен с Марком. От себя хотел бы добавить, что очень не хватает популяризации наших отечественных СУБД. Почему-то всё очень скромно. Где книги? Открытые/закрытые курсы? Программы переподготовки для преподавателей?

У VK есть свой Education Lab, где можно поизучать Tarantool и на основе этого написать НИР. Но чтобы туда попасть, надо 3 этапа собеседований пройти. Жесть какая-то. Должно быть всё более доступно. Примерная такая же песня с YDB и даже с SoQoL.
📚Теорема CAP: почему нельзя иметь все сразу и как аналитик выбирает чем пожертвовать

100500 раз обсуждается CAP теорема. Буквально вчера был очередной скромный холи-вар в комментах на тему CAP. Тут наверное идея в том, чтобы народ не забывал. Как бы её не критиковали и не меняли название (теорема Брьюера, альтернативное название) она всё равно у всех на слуху. Вопросы на зачетах, экзаменах и даже собеседованиях часто звучат по ней.

👉 Что такое системы AP?
👉 Приведите пример систем CA.
👉 Можно ли назвать PostgreSQL системой CP? Обоснуйте свой ответ.
👉 Как в современных реалиях добиться CAP систем? Возможно ли это?

И это только начало бесконечных вопросов ♾️.

В общем, знать её надо, как не крути. Это фундамент распределенных систем. Так же как и ACID для баз данных.

Вдогонку реальный кейс от Т-Банка про актуальность CAP
Тестирование CAP-теоремы на примере MongoDB
Залипательное чтиво 🩹
🤔1
🎥 Postgres против MySQL: что решает выбор базы данных | Петр Зайцев

Глянул на днях очень крутое интервью Петра Зайцева, основателя компании Percona. У него еще есть ряд стартапов в области СУБД, но этом в другой раз.

Все таймкоды под видео, поэтому переписывать их не буду.

Отмечу ряд тезисов, которые вынес для себя:

👉 В начале Percona зарабатывала на консалтинге. Это было львиным процентом прибыли. Однако, консалтинг - вещь не постоянная.

❗️Сейчас Pecona - зарабатывает на поддержке.

💪 Если говорить точнее, то Percona предоставляет услугу ManageService. Всю заботу о СУБД компания берет на себя. Абсолютно все задачи.

👉ManageService где-то 80% прибыли компании. Консалтинг - 15%.

❗️Буквально недавно Percona запустили поддержку Valkey. Мой курс по Valkey c 9 июня

💰MySQL продался Sun -> Oracle купил Sun и получил MySQL в нагрузку.

😉СУБД - залипательные (с них тяжело слезать)

🤷‍♂️От Oracle почти нереально отказаться. Чтобы ты ни делал цена лицензии не уменьшается.

⚡️"Если ты туп, чтобы разобраться с PostgreSQL, то тебе не стоит копаться с СУБД" (с)

🤔Один из главных "тормозов" в развитии PostgreSQL - это котребьютеры, которые работают на коммерческих форках.
Поэтому никто не будет затаскивать изменения, которые оказывают слишком большое влияние на функционал.

😱По-настоящему серьезных катастроф в области ИТ еще не произошло. Падение ДатаЦентров - это цветочки.

😜Все хотят продавать подписку.

⚡️"Любая проблема может быть решена с помощью PostgreSQL. Если это не так, то это неправильная проблема" (с)

🤫Забавный парадокс. PostgreSQL - отличная и замечательная СУБД. Однако вендеры форков делают всё возможное, чтобы "обос*ать" её.
1
До встречи на зачетах, экзаменах и предзащитах 😉

С пятницей!

#mems
🔥6
📚Алгоритмы консенсуса Paxos, Raft и Zab в распределённых системах

Отличная статья про алгоритмы консенсуса 🧨! Мне зашла 😉

Всем, кто хочет подробнее прочитать про Paxos и Raft — вам точно сюда.

Немного странно видеть здесь Zab — какую-то "кастомную поделку" для ZooKeeper, но ладно 💃

К тому же приятно почитать и про etcd, ZooKeeper и Consul.
3👍1🔥1
📚 Не отходя от кассы еще одна статья: Распределённые транзакции в микросервисах: от SAGA до Two‑Phase Commit
Автор Timofei Ivankov @ivankov_timofei

Тимофей за месяц своей регистрации на Хабре написал аж 8 статей 💪! Довольно плодовитый автор 👍! И темы статей довольно интересные и материал качественный. Не идеальный конечно, но очень добротный! 😊

Я впервые узнал о SAGA около 4 лет назад на конференции ArchDays. Тогда же у меня появилась идея сравнить подходы ACID и SAGA при проектировании систем.

Обычно, если нужны транзакции, выбирают реляционную СУБД — и на этом всё заканчивается. Бывают решения на NoSQL, но только с обязательной поддержкой ACID. Но здесь речь о реализации транзакций на уровне приложения. БД — всего лишь хранилище данных, не более того 🗄.

На практике, как верно отметил автор, используются оба подхода. Всё зависит от контекста и компетенций команды: что кажется проще, то и выбирают 🐣.

Сейчас встречаются проекты, когда с помощью паттерна SAGA реализовывают распределенные транзакции между РСУБД. ACID внутри одной базы, но SAGA для работы с несколькими СУБД в рамках одного процесса в приложении 🧐

P.S. Жаль, что трёхфазный коммит остался лишь в академических проектах. Когда-то я всерьёз верил в него 😊
🤔1
⚡️1 мая 2025 года вышла обратно в opensource СУБД Redis 8⚡️

GIT

Конечно это огромное событие! 😱Наконец, сообщество "наныло" 🥹, и Redis снова стал OpenSource проектом! Но, под другой лицензией. Ранее была BSD, а теперь AGPLv3🤫.

Теперь наш ждет "битва двух якодзун"! 💪
Redis vs Valkey
Кто победит? 🤷‍♂️

Если смотреть исторический, то Redis победил всех своих форк-конкурентов. Чувствую, что следующий 365 дней будут очень интересными! 🤩

Основные нововведения (с моей точки зрения):
💥 Целых 8 новых типов данных! Больше не надо импортировать модули расширений!
⚰️Смерть Redis Stack (15 сентября конец поддержки)
☝️Разного рода оптимизации.

Минутка рекламы! Впервые на моём канале! 😏

Совместно с DevHands 9 июня стартует мой авторский курс "Redis и Valkey: от основ к хайлоаду". Разработать подобный курс с нуля - задача не из простых. В интернете хороших курсов по Redis найти крайне сложно. В основном они 4-х летнее давности или того старше 👨🏻‍🦳! Курса по Valkey вообще нет . В общем, это исключительно моё творчество с небольшим использованием ИИ-помощников 🤖! Да, порой они очень помогают.

ИИ делает предположение, а я должен его доказать или опровергнуть. Скажу честно, где-то 60-65% всех ИИ-гипотез были неверны 😢. Если говорить про диагностику ошибок - то тут ИИ мне очень помог!

Помнится я спрашивал ИИ про настройку прокси-сервера, а он такой:
ИИ: есть модуль, включаешь его и используешь.
Я: погоди, такого модуля нет.
ИИ: Да, вы правы. Значит вам нужно его разработать.

Занавес


Короче, курс классный! Приходите!

Основные темы:
❇️Модуль 1: Введение в Redis/Valkey
❇️Модуль 2: Структуры данных и паттерны применения
❇️Модуль 3: Репликация и отказоустойчивость с Valkey Sentinel
❇️Модуль 4: Valkey Cluster: кластеризация и шардинг
❇️Модуль 5: Масштабирование Valkey в высоконагруженных системах
❇️Модуль 6: Мониторинг и безопасность Valkey
🔥32👍2
🐬YDB — это замена кому?
Подкаст с Антоном Коваленко, руководитель проектного офиса YDB.

Основные темы:
👉Зачем нужна ещё одна СУБД – предпосылки появления YDB.
👉Что такое DisitributedSQL (DSQL)?
👉Что там под капотом?
👉YDB - это замена кому?

В целом — неплохой подкаст про распределённые SQL-СУБД. В последнее время всё чаще в инфополе звучит YDB: множество докладов на конференциях, есть ряд подкастов и даже видеоинтервью. С актуальной информацией можно ознакомиться, например, тут.

Однако в этом канале я про YDB почти ничего не публикую. Понимаете, я слушаю всех этих умных ребят — и не могу для себя понять, кому вообще нужна эта СУБД? Кто из компаний вне Яндекса отважится её использовать? Единицы. Несмотря на активную пиар-кампанию, создаётся ощущение, что YDB никому особо не нужна.

Да, ходит информация, что у «Лаборатории Касперского» есть инсталляция YDB. Ещё есть какие-то «засекреченные» потребители. Но это капля в море 💧.
Похожая история с продуктом Shardman от PostgresPro — реальных внедрений крайне мало.

Рынка сбыта почти нет. Хотя, возможно, он и есть — просто многие боятся использовать YDB. Причин для этого можно придумать массу.

Лично я воспринимаю YDB как исследовательский проект. Яндекс экспериментирует, пытается сделать HTAP-решение в виде распределённой СУБД, активно вносит изменения. Но по ощущениям — перед тобой скорее бета-версия, а то и альфа. Очень мало учебных курсов и ИТ-интеграторов, которые продвигают YDB.

Сюда ещё накладывается наш российский менталитет, который, честно говоря, тоже вставляет «палки в колёса». Общаясь с менеджерами и СТО, всё чаще слышу мнение: лучше вложиться в свою разработку, чем что-то покупать. Почему-то считается, что «собрать на коленке» — выгоднее, чем приобрести готовое решение от ведущих специалистов. Парадокс. Особенно это заметно в крупных компаниях…

Возвращаясь к докладам по YDB — они вроде полезные, но такие странные, что не возникает желания делиться. Всё какое-то воздушное 🎈.

Буду искать на конференциях людей, которые хотят или уже запустили пилот с YDB.
Проблема только в одном: а найду ли я их?
Скоро HighLoad++ в Питере — поищу там...
Учебный год подошел к концу 😉 Надеюсь, всем всё понравилось!

Хочу всем пожелать удачи и всего самого наилучшего! Пусть СУБД останутся с вами навсегда 💯

С пятницей!

#mems
17
📚Как освоить векторные базы данных

Начальная статья для тех, кто хочет познакомиться с миром векторных СУБД.

Кратенько пробежимся по основам...

Зачем использовать векторные базы данных?
👉 Эффективны при работе с многомерными данными
👉 Быстрый поиск приблизительных ближайших соседей (ANN): HNSW, Faiss
👉 Масштабируются "из коробки"
👉 Бесшовно интегрируются с ML/AI-пайплайнами

🔥 Популярные векторные базы данных
Milvus — база данных с открытым исходным кодом
Pinecone — облачная коммерческая СУБД
Weaviate — это векторная база данных с открытым исходным кодом, ориентированная на графы знаний.

Мне лично больше нравится Weaviate — исключительно из-за дизайна сайта, лейбла и прикольного YouTube-канала 😄
А вот в России гораздо чаще встречаются проекты на Milvus. СберТех, Авито (и наверняка Яндекс) уже активно работают с ней. Думаю, если не в этом году, то в следующем на конференциях мы услышим больше докладов по этой СУБД.

На хакатонах и буткемпах студенты тоже отдают предпочтение Milvus. Ждём-ждём больше новостей от отечественных компаний!

p.s. если говорить о встраивании в образовательный процесс векторных СУБД, то мне кажется пока рановато. Точно не в следующем году.
😱3
📚 К SQL или NoSQL: зачем что-то выбирать?
Hermann Baer (Oracle)
Это мой первый пост про статью за авторством специалиста из Oracle. Уж больно интересное название.

Если пропустить всю воду и подытожить, то автор заявляет, что благодаря добавлению в OracleDB поддержки JSON, а так же внедрению стандарта SQL:2016 - NoSQL (MongoDB, как пример) не нужны. Забудьте про Mongo, любите Oracle ❤️. Занавес 🕸️.

Если серьезно, то эта статья натолкнула меня на мысль изучить стандарт SQL:2016 и сравнить работу с JSON документом с помощью SQL и языка MongoDB Query Language (MQL). Может получиться интересная лекция и лабораторная работа.

p.s. на заметку на следующий учебный год
📚 30 лет MySQL, базе данных, которая изменила мир

До бешеной популярности PostgreSQL в последние 4 года, MySQL была самая популярная Open Source СУБД! Сейчас у неё почетное 2-ое место. Хотя, если верить рейтингу db-ranking, то там до сих пор 1-ое место.

Материал довольно интересный. Вообще, мне кажется в последнее время довольно часто попадаются статьи с ретроспективой. Мол, как развивался продукт и к чему мы пришли.

Основные тезисы:

👉 MySQL, названный в честь дочери одного из создателей, стал основой веб-инфраструктуры 2000-х благодаря простоте и открытости. Кстати, у MariaDB такая же история с именованием.

👉 В эпоху Web 2.0 MySQL вошла в LAMP-стек, обеспечив стартапам быстрое масштабирование без затрат на коммерческие СУБД.

👉 Конкуренция с PostgreSQL выявила её преимущества в репликации, но уступила по функциональности и популярности среди разработчиков.

👉 Технологии вроде Vitess (YouTube) и Heatwave (Oracle) адаптировали MySQL для распределённых систем и аналитики.

👉 Facebook использовал MySQL на ранних этапах и продолжает использовать её и сегодня.

👉 MySQL способствовала демократизации ИТ, сделав мощные СУБД доступными каждому.