Data Science. SQL hub
35.9K subscribers
914 photos
49 videos
37 files
973 links
По всем вопросам- @workakkk

@itchannels_telegram - 🔥лучшие ит-каналы

@ai_machinelearning_big_data - Machine learning

@pythonl - Python

@pythonlbooks- python книги📚

@datascienceiot - ml книги📚

РКН: https://vk.cc/cIi9vo
Download Telegram
💻Infinity — современная база данных, по максимуму использующая возможности AI

sudo dpkg -i infinity-0.1.1-x86_64.deb
sudo systemctl start infinity


Infinity предоставляет широкий спектр возможностей поиска по таким типам данных, как векторы и структурированные данные. Она обеспечивает надежную поддержку таких приложений как AI-поисковики, рекомендательные системы, чатботы и приложения RAG.

🖥 GitHub
🟡 Доки

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
👍84🔥3
💻 ParadeDB — open-source альтернатива Elasticsearch, построенная на базе Postgres

В настоящий момент у пользователей Postgres, которым нужен механизм поиска и аналитики, есть два варианта: использовать внешние сервисы вроде Elasticsearch, которые мощны, но их сложно запускать, настраивать и синхронизировать, или использовать встроенный поиск и агрегацию Postgres, которым не хватает важных функций и которые плохо работают с большими массивами данных.

ParadeDB предоставляет удобный компромисс, предоставляя разработчикам привычный Postgres и производительность специализированной поисковой и аналитической базы данных.

Быстрый старт с помощью Docker:
docker run --name paradedb paradedb/paradedb

🖥 GitHub
🟡 Доки

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍43😁1🤔1
💻OrientDB — многомодельная СУБД

OrientDB — это open-source многомодельная СУБД NoSQL, которая объединяет возможности графов и документов в одну масштабируемую, высокопроизводительную базу данных.

OrientDB была разработана с нуля с упором на производительность, она быстро выполняет операции чтения и записи.
OrientDB эффективно использует оперативную память, позволяет делать обход частей или целых деревьев и графов за миллисекунды.
При этом скорость обхода не зависит от размера базы данных.

🖥 GitHub
🟡 Доки

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍124🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
💻 OctoSQL — работа с разными БД и файлами посредством единого интерфейса

brew install cube2222/octosql

OctoSQL — CLI-инструмент, который позволяет работать с множеством баз данных (и файлов) с помощью SQL через единый интерфейс и выполнять JOIN между ними.
Например, OctoSQL может помочь объединить JSON-файл с таблицей PostgreSQL.

В то же время OctoSQL — это легко расширяемый движок потока данных, и его можно использовать для добавления SQL-интерфейса в свои собственные приложения.

🖥 GitHub

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
👍144🔥2
💻 SirixDB — это open-source гибридная система баз данных, ориентированная на работу с дисками и памятью

SirixDB имеет облегченный буфер-менеджер, способный хранить ссылки на страницы in-memory.
SirixDB представляет собой структурированное хранилище временных документов и хранит истории всех ресурсов в компактной форме.
Процессор запросов поддерживает сложные запросы, связанные с разными временными диапазонами.

🖥 GitHub
🟡 Доки

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍2🔥2👎1
💻 pg_activity — инструмент командной строки для мониторинга активности сервера PostgreSQL

sudo apt install pg-activity

pg_activity сканирует представление pg_stat_activity с заданным временем обновления, от 0.5 до 5 секунд.

pg_activity работает как локально, так и удаленно. При локальном выполнении, чтобы получить достаточные права для отображения системной информации, системный пользователь, запускающий pg_activity, должен быть тем же пользователем, который запускает сервер postgresql (postgres по умолчанию), или иметь больше прав, например root.
Пользователь PostgreSQL, используемый для подключения к базе данных, должен быть суперпользователем, чтобы получить как можно больше данных. В противном случае pg_activity может работать хуже — например системная информация или данные временных файлов не будут отображаться.

🖥 GitHub

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥32
🖥 jSQL Injection — open-source приложение для автоматизации SQL-инъекций и тестирований на проникновение

java -jar jsql-injection-v0.98.jar

jSQL Injection входит во многие дистрибутивы, такие как Blackbuntu, Pentest Box, Parrot Security OS, Kali Linux, ArchStrike и BlackArch Linux.
Конечно же, исключительно в этичных целях

🖥 GitHub

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54🔥2
💻toyDB — распределенная БД SQL на Rust; написана в качестве обучающего проекта, который поможет разобраться в подобных БД

На самом высоком уровне toyDB состоит из кластера узлов, которые выполняют SQL-транзакции на реплицированной машине состояний. Клиенты могут подключаться к любому узлу кластера и отправлять SQL-запросы.
toyDB нацелена на обеспечение сильной согласованности и сериализуемости, но пока ещё немного не дотягивает до них.

В кластере toyDB используется алгоритм Raft, который допускает выход из строя любого узла, пока большинство узлов остаются доступными. Один узел избирается лидером и передает команды остальным, которые применяют их к локальным копиям машины состояний. Если лидер потерян, избирается новый лидер, и кластер продолжает работу.

toyDB поддерживает большинство распространенных функций SQL, включая объединения, агрегирующие функции и ACID.

🖥 GitHub
🟡 Доки

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍5🔥2
💻 Slick — современная библиотека запросов и доступа к БД для Scala

Slick (Scala Language Integrated Connection Kit) — это продвинутая библиотека для работы с БД для Scala с сильно типизированными, хорошо комбинируемыми API.

Slick позволяет работать с реляционными БД почти так же, как если бы вы использовали коллекции Scala, и в то же время дает вам полный контроль над тем, когда происходит обращение к базе данных и какой объем данных передается.
Можно писать запросы на Scala, при этом всегда можно перейти на SQL-запросы, когда это необходимо.

🖥 GitHub
🟡 Доки

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍3🔥1😁1
💻 RxDB — быстрая, локальная, реактивная БД для приложений JavaScript

npm install rxdb rxjs --save

RxDB (Reactive Database) — это локально-ориентированная NoSQL-база данных для JS-приложений, таких как сайты, прогрессивные веб-приложения, Deno- и Node.js-приложения.

Реактивность подразумевает, что вы можете не только запрашивать текущее состояние, но и подписываться на все изменения состояния, такие как результат запроса, например.
Что очень актуально для многих JS-приложений.

RxDB предоставляет простой в реализации протокол для репликации в реальном времени с помощью существующей инфраструктуры или одного из плагинов для HTTP, GraphQL, CouchDB, Websocket, WebRTC, Supabase, Firestore, NATS.

🖥 GitHub
🟡 Доки

@sqlhub
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥2👍1