Data Science. SQL hub
35.9K subscribers
911 photos
48 videos
37 files
969 links
По всем вопросам- @workakkk

@itchannels_telegram - 🔥лучшие ит-каналы

@ai_machinelearning_big_data - Machine learning

@pythonl - Python

@pythonlbooks- python книги📚

@datascienceiot - ml книги📚

РКН: https://vk.cc/cIi9vo
Download Telegram
💻Руководство по MySQL JOIN с примерами

JOIN в MySQL — это мощный оператор, позволяющий объединять данные из нескольких таблиц на основе соответствия критериям.
Именно об этом и идёт речь в туториале, параллельно разбирается ещё много полезных вещей, рекомендую

Оглавление
Различные типы соединений в MySQL
— INNER JOIN
— LEFT JOIN
— RIGHT JOIN
— FULL JOIN (не поддерживается напрямую MySQL)

Реальные сценарии использования соединений в веб-разработке
— Отображение профилей пользователей с заказами
— Фильтрация товаров по категориям и брендам
— Отображение отзывов с информацией о продукте

Советы по эффективным и оптимизированным соединениям в MySQL

📎 Руководство

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍124🥰2😢1
💻Диагностика производительности PostgreSQL

В этой статье рассмотрим методы диагностики производительности PostgreSQL, которая состоит из 3 шагов.

🟡Шаг 1: Оптимизировать кластер

Для улучшения работы вашей базы данных используйте следующие методы диагностики производительности PostgreSQL:
— примените вертикальное или горизонтальное масштабирование и затем проведите анализ запросов;
— настройте конфигурационные параметры развернутого кластера. Например, используйте онлайн генераторы конфигурационных параметров.

🟡Шаг 2: Анализ логов

Обратите внимание, что включение анализаторов запросов может потреблять около 10% ресурсов. Но после завершения процесса анализа и оптимизации запросов производительность может значительно вырасти.

Вы можете использовать встроенные инструменты для анализа производительности PostgreSQL, чтобы идентифицировать узкие места и медленные запросы:
pg_stat_statements
pg_stat_kcache
auto_explain
log_min_duration_statement

🟡Шаг 3: Анализ планов

Оптимизация запросов может быть сложной и часто представляет собой итеративный процесс. Вносите изменения постепенно и измеряйте влияние каждого изменения на производительность запросов. Также рекомендуем протестировать выполненные оптимизации в промежуточной среде, прежде чем применять их к рабочей базе данных. Убедитесь в отсутствии непредвиденных последствий.

План запроса PostgreSQL описывает выполнение SQL-запроса, включая сортировку и фильтрацию, а также использование ресурсов во время выполнения.

📎 Статья

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114🔥2👎1
💻Вопросы и ответы по SQL и по БД в целом

Держите, пригодится освежить самые основные моменты перед собеседованием.

Вот некоторые из затронутых здесь вопросов

🟡Вопросы по БД:
— Реляционные БД (SQL)
— Нереляционные БД (NoSQL): Key/Value, документные (документ-ориентированные), колоночные, графовые
— Что такое CAP-теорема (теорема Брюера)?
— Что такое свойство ACID в базе данных?

🟡Вопросы по SQL:
— Из каких подмножеств состоит SQL?
— Что подразумевается под таблицей и полем в SQL?
— В чем разница между операторами DELETE и TRUNCATE?
— Что такое соединения (JOIN) в SQL?
— В чем разница между типом данных CHAR и VARCHAR в SQL?
— Что такое первичный ключ (Primary key)?
— Что такое ограничения (Constraints)?
— Что такое уникальный ключ (Unique key)?
— Что такое внешний ключ (Foreign key)?
— Что подразумевается под целостностью данных?
— Какие уровни изолированности транзакций можешь назвать?
— Что вы подразумеваете под денормализацией?
— Напишите SQL-запрос для отображения текущей даты?

📎 Вопросы/ответы

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
👍176🔥4😢1
👣 Convex

Conve векторная бд, написанная в 200 тысяч строк Convex, "реактивной" базы данных, созданной с нуля на Rust.

Она включает в себя набор клиентских библиотек, которые интегрируются с интерфейсным кодом приложения, и обеспечивает кэширование данных и обновления в режиме реального времени.

git clone https://github.com/get-convex/convex-backend.git
cd convex-backend


Github
Docs

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
👍63🔥2🤯2
⭐️ Data Science разбор реальной задачи с собеседования. Прогнозирование оттока клиентов.

Смотреть
Данные
Ноутбук

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 DrawDB

Крутой инструмент для создания баз данных и генерации SQL запросов.

Создание диаграмм займет всего несколько секунд, вы сможете экспортировать готовые скрипты и настроить свой редактор без необходимости создания учётной записи.

GitHub

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24🔥87
💻 PostgreSQL — настройка Postgres экспортера

В этой статье настраиваем экспортера, для сбора метрик с базы на PostgreSQL

📎 Статья

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍83🔥3
💻 Настройка логической репликации PostgreSQL

Репликация PostgreSQL представляет из себя способ реализации отказоустойчивого кластера. Инструкция написана на примере PostgreSQL 14, но она также будет работать для PostgreSQL более ранних версий (до 10).

Логическая репликация добавлена в PostgreSQL с версии 10. Она позволяет:
🟡Объединить несколько баз в одну.

🟡Использовать особые условия для передачи данных подписчику.

🟡Дать доступ к реплицированным данным другим группам пользователей.

🟡Разделить данные из нескольких баз между несколькими другими базами данных.

🟡Передать инкрементальные изменения в одной или нескольких базах в момент редактирования информации.

🟡Упростить условия для настройки репликации: могут использоваться разные мажорные версии PostgreSQL, а также платформы операционных систем.

Используемые в данном руководстве команды, применимы для операционных систем Linux. Если PostgreSQL работает под Windows, данную инструкцию можно использовать как шпаргалку для настройки конфигурационных файлов СУБД.

📎 Перейти к настройке репликации

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍5🔥2
💻Промпт — в SQL-запрос при помощи Chat2DB

🟡Chat2DB — AI-инструмент, который позволяет преобразовывать промпты на естественном языке в SQL-запросы.
Позволяет легко манипулировать данными, создавать отчёты и проводить анализ без знания SQL.

🟡Для pro-версии есть нативное приложение, pro-версия поддерживает все популярные СУБД:
MySQL, PostgreSQL, H2, SQLite, MariaDB, ClickHouse, MongoDB, Redis, Snowflake и остальные

🖥 GitHub
🟡 Доки
🟡 Протестировать можно тут

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥74👍2😢1
Forwarded from Golang
👣 sqlc — генерирование типобезопасного кода из SQL

go install github.com/sqlc-dev/sqlc/cmd/sqlc@latest

sqlc позволяет создавать полностью безопасный для типов идиоматический Go-код из SQL.
Как это работает:
— пишем SQL-запрос
— запускаем sqlc для генерации Go-кода
— теперь можем вызывать методы, созданные sqlc, из другого приложения

🖥 GitHub
🟡 Доки
🟡 Демонстрация

@Golang_google
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥2
⚡️ Тинькофф разбор заданий на стажировку!

Видео
Задачи

@machinelearning_interview
👍95🔥3👎2
💻pgvector — расширение PostgreSQL для работы с векторами

Open-source решение для хранения и поиска векторов в Postgres.

Сами данные для векторов можно получить, например, из ML-модели и вставить в таблицу с колонкой типа vector.
Или данные можно создать в PostgreSQL как гистограмму определенных категорий. В этом случае можно значения в массивах real[], integer[] или double precision[], numeric[] привести к типу ::vector.

🖥 GitHub
🟡 Пример использования pgvector на Хабре

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
👍84🔥2
💻Установка PostgreSQL из исходников

Держите полезную статью о том, как собрать PostgreSQL 16 версии из исходников, инициализировать кластер и запустить его на сервере Debian 12

Причины по которым вам может понадобится собирать PostgreSQL из исходников:
для дистрибутива нет готового пакета;
нужно собрать PostgreSQL с нестандартными параметрами.

План статьи
├╼ Сборка и установка
├╼ Создание кластера
├╼ Запуск и остановка кластера
├╼ Установка расширений PostgreSQL
├╼ Создание и запуск второго кластера
╰╼ Создание службы SystemD для кластеров

📎 Статья

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍4🥰4🤯2