DATABASE DESIGN
1.4K subscribers
2.11K photos
3 videos
5.36K links
Лучшие материалы по работе с хранилищами данных на русском и английском языке

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Другие наши проекты: https://tprg.ru/media
Download Telegram
WeLab Leads Tens of Millions of Users Toward a Future of Intelligent Finance With MongoDB and Alibaba Cloud

The article discusses how WeLab Group, a leading FinTech group, and iReader Technology, a digital reading platform, are using MongoDB and Alibaba Cloud to enhance their operations and meet the challenges of the financial and digital reading industries, respectively.

WeLab Group, which operates WeLab Bank and other online consumer financial services, faced regulatory challenges in the FinTech industry. To handle the rapid increase in data and maintain system efficiency, they replaced their traditional MySQL database with ApsaraDB for MongoDB. The upgrade resulted in improved efficiency, reduced risk, and better response to market and regulatory changes.

iReader Technology, a digital reading platform, needed a flexible database solution to handle large volumes of operation data and adapt to constantly changing data in multiple scenarios. They chose ApsaraDB for MongoDB for its document structure and support for bidirectional data queries. The migration to MongoDB improved service performance and operational efficiency for iReader.

Both WeLab Group and iReader Technology benefited from the capabilities of MongoDB and Alibaba Cloud in terms of data processing, stability, efficiency, and cost reduction. They were able to meet the demands of their respective industries and improve their business operations with the help of these technologies. This text discusses the importance of providing developers with flexible functionality through the platforms LangChain and LlamaIndex. It mentions that these platforms support various features such as vector search, chat recording, and document indexing. The company, MongoDB, is committed to helping developers empower the next generation of AI-enabled applications and will continue to release new features. They emphasize the importance of community feedback and their dedication to meeting developer needs. The text encourages developers to continue their development activities. It also mentions the possibilities of Atlas Vector Search and suggests consulting the documentation, whitepaper, and tutorials for more information. The text concludes with the date, January 31, 2024.

Read: https://www.mongodb.com/blog/post/welab-leads-tens-millions-users-toward-future-intelligent-finance-mongodb-alibaba
Forwarded from Веб-страница
​​​​Дорожная карта SQL: от новичка до мидла в 2024 году

Какой бы язык вы и осваивали, попутно рано или поздно предстоит выучить и SQL для обращения с базами данных.

Но вместо того, чтобы делать это хаотично и набивать непредсказуемые шишки, лучше делать это с умом. Специально для этого сделали дорожную карту по изучению SQL.

Там есть основные темы, краткая информация для каждого раздела и полезные ссылки для изучения: https://tproger.ru/articles/dorozhnaya-karta-obucheniya-sql-dlya-dostizheniya-urovnya-middle-

#sql #шпаргалки
1
Снова на те же грабли. Разбираемся с ошибками хранения ПДн и способами защиты медицинских данных

Привет, Хабр! Ловите новую подборку от beeline cloud — собрали практические истории по работе с персональными данными. Здесь и основные ошибки хранения ПДн, и советы, которые помогут навести порядок, и примеры защиты личных данных пациентов в виде кейса компании, которая проводит дистанционные медицинские осмотры.


Читать: https://habr.com/ru/companies/beeline_cloud/articles/790730/
Как мы не выбрали Airbyte

Привет, Хабр! Меня зовут Илья, я работаю инженером данных в компании Selectel. В отделе BI мы собираем информацию из внутренних и внешних источников и предоставляем аналитикам.

У нас достаточно большой набор внешних ресурсов, данные из которых нужно собирать и обрабатывать. Среди них — различные SMM-площадки вроде VK и Telegram, платформы лидогенерации, инструменты таргетированной рассылки писем, системы автоматизации и многое-многое другое.

Так как компания развивается, мы спрогнозировали, что число источников тоже будет только расти. И назрела мысль, что нам нужно подобрать специализированное ПО, которое будет отвечать за доставку данных из внешних ресурсов в DWH. Время прошло, идея воплощена: мы используем Airflow и самописные коннекторы на Python. Но могло сложиться все иначе — и мы бы использовали Airbyte, если бы не одно «но»…

Читать: https://habr.com/ru/companies/selectel/articles/788302/
Building AI With MongoDB: How Gradient Accelerator Blocks Take You From Zero To AI in Seconds

The text is about Gradient, a platform that enables businesses to create custom AI applications. Gradient's Accelerator Blocks are fully managed building blocks designed for AI use cases, reducing developer workload and helping businesses achieve their goals quickly. The newest Accelerator Block focuses on improving the performance and accuracy of AI models through retrieval augmented generation (RAG). It uses Gradient's LLMs and embeddings, MongoDB Atlas Vector Search, and LlamaIndex for data integration. With Gradient's platform, businesses can further customize and deploy AI solutions. Gradient provides industry-specific models in finance and healthcare, ensuring user privacy and data ownership. MongoDB Atlas is included as a core part of the Gradient platform. The text also introduces Atlas Vector Search, a feature integrated into MongoDB Atlas that allows users to query data based on the semantics rather than the data itself. It explains how vector search works and how it connects to MongoDB's platform. The text concludes by mentioning the company's commitment to supporting developers in building AI-enabled applications. This text discusses how WeLab Group, a leading FinTech group, has implemented MongoDB and Alibaba Cloud to improve their data processing capacity and meet regulatory requirements. WeLab replaced their traditional MySQL database with ApsaraDB for MongoDB, which provides advanced storage capabilities and better responds to market and regulatory changes. The upgrade has resulted in improved efficiency, reduced risk, and technical improvements, such as increased database write and query performance. With the support of Alibaba Cloud and MongoDB, WeLab has successfully built a new generation risk management system, WeDefend 3.0. Overall, ApsaraDB for MongoDB has met WeLab's data characteristics and technical requirements, resulting in a smooth system upgrade and lower operation and learning costs.

Read: https://www.mongodb.com/blog/post/how-gradient-accelerator-blocks-take-you-from-zero-to-ai-seconds
Как устроена страничная организация памяти x86_64

В этом посте я буду говорить о страничной организации только в контексте PML4 (Page Map Level 4), потому что на данный момент это доминирующая схема страничной организации x86_64 и, вероятно, останется таковой какое-то время.

Окружение

Это необязательно, но я рекомендую подготовить систему для отладки ядра Linux с QEMU + gdb. Если вы никогда этого не делали, то попробуйте такой репозиторий: easylkb (сам я им никогда не пользовался, но слышал о нём много хорошего), а если не хотите настраивать окружение самостоятельно, то подойдёт режим практики в любом из заданий по Kernel Security на pwn.college (вам нужно знать команды vm connect и vm debug).

Я рекомендую вам так поступить, потому что считаю, что самостоятельное выполнение команд вместе со мной и возможность просмотра страниц (page walk) на основании увиденного в gdb — хорошая проверка понимания.


Читать: https://habr.com/ru/articles/787502/
Building AI with MongoDB: How Patronus Automates LLM Evaluation to Boost Confidence in GenAI



Read: https://www.mongodb.com/blog/post/how-patronus-automates-llm-evaluation-boost-confidence-genai
Запуск и настройка Pentaho server с базой MSSQL

В этой статье описаны действия по установке MS SQL в качестве базы данных хоста для сервера Pentaho в архивной установке Pentaho.


Читать: https://habr.com/ru/articles/791198/
Тестирование менеджера транзакций

Привет, Хабр! Меня зовут Георгий Лебедев, я учусь на 4-м курсе ФРКТ МФТИ и работаю в команде разработки ядра Тарантула. В этой статье я хочу поделиться методикой тестирования менеджера транзакций, которая применяется в Тарантуле.


Читать: https://habr.com/ru/companies/vk/articles/790346/
Spotlight on Two Aussie Start-Ups Building AI Services on MongoDB Atlas



Read: https://www.mongodb.com/blog/post/spotlight-two-aussie-start-ups-building-ai-services-mongodb-atlas
Simplified Data Safe notifications improve data security visibility

We've simplified the process of creating notifications from Data Safe, making it easier for you to create and manage notifications about important events and status changes that impact your database's security posture

Read: https://blogs.oracle.com/database/post/data-safe-notifications
От перфокарт в облако. Где вы хранили файлы десятилетие назад?

В годы моей бурной юности в ходу были пятидюймовые дискеты. Их и вправду можно было назвать “floppy”, то есть, гибкими — футляр из плотного коленкора довольно легко сгибался, пробивался степлером и даже с некоторым усилием сворачивался в трубку. Перфокарты я тоже застал — родители иногда приносили их домой из вычислительного центра, в котором работали, и маленький я рисовал на этих забавных карточках с напечатанными типографским способом рядами цифр (и совой, сова с надписью «КАНГАС» почему-то накрепко засела в памяти) короткими фломастерами от плоттеров-графопостроителей, которые в ассортименте добывались там же, в ВЦ. Сейчас, используя многогигабайтовое облако, смешно вспоминать эту бумажную карточку емкостью 80 байт. Зато можно сказать, что эволюцию носителей информации от перфокарт к облаку я увидел собственными глазами.


Читать: https://habr.com/ru/companies/serverspace/articles/790800/
DocsGPT: Migrating One of the Industry’s Most Popular Open Source AI Assistants to Atlas Vector Search



Read: https://www.mongodb.com/blog/post/migrating-one-industrys-most-popular-open-source-ai-assistants-atlas-vector-search
MongoDB Enterprise Advanced in Google Distributed Cloud Hosted



Read: https://www.mongodb.com/blog/post/mongodb-enterprise-advanced-google-distributed-cloud-hosted
Подводные дата-центры и хранение информации в QR-кодах: новшества индустрии ЦОД

По данным TAdviser, в России зафиксирован небывалый «бум» строительства ЦОДов. Схожая картина наблюдается и в остальных странах: по итогам 2022 года общий объем данных в мире составил 97 зеттабайт, в 2023 году — 110-120 зеттабайт, а к 2025 году — прогноз вплоть до 180-ти. Всю эту информацию нужно где-то обрабатывать и хранить — потребность в дата-центрах растет ежемесячно. По данным «Коммерсанта», спрос на услуги дата-центров в значительной степени превышает предложение. Именно поэтому на сферу направлено сейчас пристальное внимание, а где внимание, там и высокие технологии.


Читать: https://habr.com/ru/companies/sberbank/articles/792072/
Building AI with MongoDB: How Flagler Health's AI-Powered Journey is Revolutionizing Patient Care



Read: https://www.mongodb.com/blog/post/building-ai-mongodb-how-flagler-healths-ai-powered-journey-revolutionizing-patient-care
MariaDB Community Server Q1 2024 maintenance releases

Read: https://mariadb.com/?p=38725
Хранение паролей: работа над ошибками

В предыдущей статье, я описал свой сетап хранения авторотационных данных (паролей). Многие эксперты изучили её и дали свои комментарии, - о том, где могут быть проблемы, о том, что можно упростить, и о том, что можно делать по другому.

Но начнём мы с небольшого объяснения, почему система такая сложная. Вспомним суть:

1) Для логина на "не значимые" сайты (например в аккаунт очередного AI-продукта) мы используем уникальный пароль, который храним в программе хранения паролей (парольном менеджере)

2) Для логина на "более важные ресурсы" (например в аккаунт на github), мы используем уникальный пароль, который храним в парольном менеджере, плюс одноразовый пароль (TOTP - Time-based One-Time Password) который нам покажет специальное приложение на телефоне.

Вот и всё. Это вся суть повседневного использования всей системы. Но почему она тогда казалась такой сложной? Вероятно из-за дополнительных слоёв защиты от самого себя или любых непредвиденных факторов.


Читать: https://habr.com/ru/articles/791914/
Как мы поменяли методику исследования «BI-круг Громова», чтобы результаты стали еще точнее

«Круги Громова» занимается сравнительными исследованиями ИТ-решений. Начинали мы с исследований именно BI-систем (системы бизнес-аналитики, business intelligence) и разбираемся в них, как считаем, весьма хорошо. По задумке наши исследования (кстати, ежегодные) должны быть чем-то вроде карты для ИТ-отделов и руководителей, чтобы помочь им разобраться в дебрях множества современных BI-решений. Одним из основных параметров, влияющих на объективность исследования, является его методика. Поэтому мы постоянно думаем над тем, как сделать нашу методику еще более точной, учитывающей еще больше факторов и позволяющей раскрыть максимум информации о решениях, которые попали к нам под микроскоп.


Читать: https://habr.com/ru/articles/792292/
Announcing MongoDB as a Founding Member of the NIST AI Safety Institute Consortium



Read: https://www.mongodb.com/blog/post/announcing-mongodb-as-founding-member-of-nist-ai-safety-institute-consortium
Maximizing Database High Availability with MariaDB MaxScale

Read: https://mariadb.com/?p=38727