Всем привет! 24 апреля в Москве в офисе Лемана Тех пройдет очередной митап по технологиям Trino и Apache Iceberg! Также будет доступна онлайн-трансляция.
В программе:
- Доклад от Лемана Тех про миграцию на Trino
- Доклад от Азбуки Вкуса про использование каталога Nessie
- Круглый стол про проблемы внедрения lakehouse с инженерами T-Банк, S7 Airlines, Лемана Тех и Кверифай Лабс
Регистрация по ссылке: https://cedrusdata.timepad.ru/event/3299844/
В программе:
- Доклад от Лемана Тех про миграцию на Trino
- Доклад от Азбуки Вкуса про использование каталога Nessie
- Круглый стол про проблемы внедрения lakehouse с инженерами T-Банк, S7 Airlines, Лемана Тех и Кверифай Лабс
Регистрация по ссылке: https://cedrusdata.timepad.ru/event/3299844/
cedrusdata.timepad.ru
Lakehouse Meetup #3: внедрение Trino в Лемана Тех, опыт работы с Nessie в Азбуке Вкуса, круглый стол о проблемах lakehouse / События…
Рассмотрим реальный опыт внедрения современных технологий анализа данных: реализация lakehouse на Trino в Лемана Тех, использование Nessie в Азбуке Вкуса. После этого обсудим за круглым столом насущные проблемы lakehouse с инженерами Лемана Тех, S7 Airlines…
🔥13👍1🤯1
Всем привет. Мы рады представить минорный релиз CedrusData 458-8, основной задачей которого было нарастить возможности pushdown некоторых востребованных функций в коннекторах ClickHouse и Greenplum. Изменения (совместно с предыдущей версией 458-7):
Общее:
- Увеличена версия Apache Parquet до 1.15.1 (предотвращение критической уязвимости CVE-2025-30065)
Коннектор ClickHouse:
- Добавлена возможность pushdown строковых функций
- Добавлена возможность pushdown строковых функций
- Добавлена возможность передачи статических ключей S3 в CedrusData Catalog через механизм extra credentials
Коннектор Kafka:
- Добавлена возможность разрешения конфликтов, когда ключ и сообщение топика имеют поля с одинаковыми именами
Release notes:
- CedrusData: https://docs.cedrusdata.ru/458-8/release/release-458-8.html
Общее:
- Увеличена версия Apache Parquet до 1.15.1 (предотвращение критической уязвимости CVE-2025-30065)
Коннектор ClickHouse:
- Добавлена возможность pushdown строковых функций
trim, ltrim, rtrim, strpos, position
Коннектор Greenplum:- Добавлена возможность pushdown строковых функций
trim, ltrim, rtrim, strpos, position, starts_with
- Добавлена возможность pushdown математических функций abs, sign, sqrt, cbrt, degrees, radians, exp, ln, log2, log10
Коннектор Iceberg:- Добавлена возможность передачи статических ключей S3 в CedrusData Catalog через механизм extra credentials
Коннектор Kafka:
- Добавлена возможность разрешения конфликтов, когда ключ и сообщение топика имеют поля с одинаковыми именами
Release notes:
- CedrusData: https://docs.cedrusdata.ru/458-8/release/release-458-8.html
🔥4👍2
Всем привет. Мы рады представить минорный релиз CedrusData 458-9: улучшения алгоритма планирования порядка Join, инфраструктура для table maintenance в Iceberg, авторизация в Apache Ranger через политики Hive, статистики ClickHouse, расширенный pushdown в Greenplum и ClickHouse.
Общее:
- Улучшен алгоритм планирования порядка Join. Теперь CedrusData выбирает предельный размер графа Join для cost-based планирования динамически на основе оценки сложности графа. Пользователи могут ожидать улучшение планов сложных запросов, которые до этого оптимизатору приходилось планировать путем разбиения на независимые подграфы
- Улучшен алгоритм упрощения
Коннекторы Hive и Iceberg:
- Добавлена возможность авторизации через политики Hive в Apache Ranger. Теперь вы можете переиспользовать существующие политики Hive в Apache Ranger для авторизации действий пользователей CedrusData без установки дополнительных плагинов в Apache Ranger
Коннектор ClickHouse:
- Добавлена поддержка статистик. Теперь оптимизатор может выбирать оптимальный порядок Join при выполнении федеративных запросов к ClickHouse
- Добавлена возможность pushdown строковых функций
- Добавлена возможность pushdown математических функций
- Подготовлена инфраструктура для автоматического maintenance таблиц Iceberg. В следующей версии мы опубликуем официальный API для maintenance
Release notes:
- CedrusData: https://docs.cedrusdata.ru/458-9/release/release-458-9.html
- CedrusData Catalog: https://docs.cedrusdata.ru/catalog/458-9/release/release-458-9.html
Общее:
- Улучшен алгоритм планирования порядка Join. Теперь CedrusData выбирает предельный размер графа Join для cost-based планирования динамически на основе оценки сложности графа. Пользователи могут ожидать улучшение планов сложных запросов, которые до этого оптимизатору приходилось планировать путем разбиения на независимые подграфы
- Улучшен алгоритм упрощения
OUTER JOIN. Теперь CedrusData заменяет FULL OUTER JOIN на LEFT/RIGHT OUTER JOIN и далее на INNER JOIN для более широкого спектра запросовКоннекторы Hive и Iceberg:
- Добавлена возможность авторизации через политики Hive в Apache Ranger. Теперь вы можете переиспользовать существующие политики Hive в Apache Ranger для авторизации действий пользователей CedrusData без установки дополнительных плагинов в Apache Ranger
Коннектор ClickHouse:
- Добавлена поддержка статистик. Теперь оптимизатор может выбирать оптимальный порядок Join при выполнении федеративных запросов к ClickHouse
- Добавлена возможность pushdown строковых функций
concat, length, reverse, replace, translate и lpad/rpad
- Добавлена возможность pushdown математических функций abs, sign, sqrt, cbrt, pow, degrees, radians, exp, ln, log2, log10, ceiling, floor, round и truncate
Коннектор Greenplum:- Добавлена возможность pushdown математических функций
ceiling, floor, round и truncate
CedrusData Catalog: - Подготовлена инфраструктура для автоматического maintenance таблиц Iceberg. В следующей версии мы опубликуем официальный API для maintenance
Release notes:
- CedrusData: https://docs.cedrusdata.ru/458-9/release/release-458-9.html
- CedrusData Catalog: https://docs.cedrusdata.ru/catalog/458-9/release/release-458-9.html
🔥12
Трансляция Lakehouse митапа в Лемана Про:
- YouTube: https://www.youtube.com/live/r70FGQWdEvc
- VK: https://vk.com/video-230133731_456239017
- YouTube: https://www.youtube.com/live/r70FGQWdEvc
- VK: https://vk.com/video-230133731_456239017
Youtube
- YouTube
Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.
🔥16
Всем привет. Мы рады представить релиз CedrusData 458-10: продвинутый time-travel в Iceberg, поддержка maintenance операций и разграничений доступа к объектам в CedrusData Catalog
Коннектор Iceberg:
- ❗️Добавлена поддержка продвинутого time travel при работе с CedrusData Catalog. Теперь вы можете задать единую метку времени в параметре сессии, которая будет использована всеми таблицами в запросе. Таким образом вы получаете возможность работы с предыдущими состояниями таблиц Iceberg без необходимости переписывания запросов и перезапуска продукта
- Добавлена поддержка Kerberos при авторизации через Apache Ranger
Коннектор Hive:
- Добавлена поддержка Kerberos при авторизации через Apache Ranger
CedrusData Catalog:
- ❗️Добавлена поддержка maintenance операций над таблицами Iceberg. Пользователи CedrusData Catalog теперь могут выполнять операции
- ❗️Добавлена поддержка продвинутого time travel. При работе из CedrusData, Apache Spark, Apache Flink и ряда других продуктов вы теперь можете задавать единую метку времени, которая будет использована для выбора целевого состояния таблиц и представлений Iceberg во всех запросах. Пользователи данных движков получают удобный способ работы с предыдущими состояниями объектов без необходимости переписывания запросов и задания меток времени для индивидуальных таблиц. В первой версии поддерживаются только операции
- Добавлена поддержка разграничений доступа к объектам на основе того, кто является их владельцем (aka DAC - Discretionary Access Control). Это финальный шаг перед внедрением промышленного RBAC, появление которого мы ожидаем в конце июня
Release notes:
- CedrusData: https://docs.cedrusdata.ru/458-10/release/release-458-10.html
- CedrusData Catalog: https://docs.cedrusdata.ru/catalog/458-10/release/release-458-10.html
Коннектор Iceberg:
- ❗️Добавлена поддержка продвинутого time travel при работе с CedrusData Catalog. Теперь вы можете задать единую метку времени в параметре сессии, которая будет использована всеми таблицами в запросе. Таким образом вы получаете возможность работы с предыдущими состояниями таблиц Iceberg без необходимости переписывания запросов и перезапуска продукта
- Добавлена поддержка Kerberos при авторизации через Apache Ranger
Коннектор Hive:
- Добавлена поддержка Kerberos при авторизации через Apache Ranger
CedrusData Catalog:
- ❗️Добавлена поддержка maintenance операций над таблицами Iceberg. Пользователи CedrusData Catalog теперь могут выполнять операции
expire-snapshots и remove-orphan-files над индивидуальными объектами или группами объектов. В следующей версии будет добавлена поддержка запуска maintenance операций по расписанию- ❗️Добавлена поддержка продвинутого time travel. При работе из CedrusData, Apache Spark, Apache Flink и ряда других продуктов вы теперь можете задавать единую метку времени, которая будет использована для выбора целевого состояния таблиц и представлений Iceberg во всех запросах. Пользователи данных движков получают удобный способ работы с предыдущими состояниями объектов без необходимости переписывания запросов и задания меток времени для индивидуальных таблиц. В первой версии поддерживаются только операции
SELECT, в июньской версии будет добавлена поддержка DML и DDL операций, что позволит заместить аналогичный функционал Nessie более легковесным и удобным решением- Добавлена поддержка разграничений доступа к объектам на основе того, кто является их владельцем (aka DAC - Discretionary Access Control). Это финальный шаг перед внедрением промышленного RBAC, появление которого мы ожидаем в конце июня
Release notes:
- CedrusData: https://docs.cedrusdata.ru/458-10/release/release-458-10.html
- CedrusData Catalog: https://docs.cedrusdata.ru/catalog/458-10/release/release-458-10.html
🔥7👍6
Всем привет. Коллеги из Лемана Тех опубликовали на Хабре статью по мотивам прошедшего lakehouse-митапа: https://habr.com/ru/companies/lemana_tech/articles/909542/
Хабр
Заметки и материалы по итогам Lakehouse Meetup #3
Lakehouse – это не просто модное слово. Это попытка объединить лучшее из data lake и data warehouse, дешевое хранение S3, гибкость open source и производительность DWH. На третьем митапе,...
👍5🔥4
Всем привет! В следующий четверг 26 июня мы проведем очередной онлайн-митап по lakehouse технологиям. В программе два доклада:
Trino в Авито спустя два года: от движка к аналитической экосистеме, Дмитрий Рейман, Авито
Как Авито построил lakehouse-платформу на основе Trino, которая обрабатывает до 1 ПБ данных в день и обслуживает 300 пользователей
CedrusData Catalog — Современный каталог для lakehouse-платформ, Владимир Озеров, Кверифай Лабс
Архитектура и возможности CedrusData Catalog — бесплатного каталога Iceberg для российского рынка. Ролевая модель доступа, обслуживание таблиц Iceberg, time-travel, ускорение аналитических запросов.
Регистрация: https://cedrusdata.timepad.ru/event/3426242/
Trino в Авито спустя два года: от движка к аналитической экосистеме, Дмитрий Рейман, Авито
Как Авито построил lakehouse-платформу на основе Trino, которая обрабатывает до 1 ПБ данных в день и обслуживает 300 пользователей
CedrusData Catalog — Современный каталог для lakehouse-платформ, Владимир Озеров, Кверифай Лабс
Архитектура и возможности CedrusData Catalog — бесплатного каталога Iceberg для российского рынка. Ролевая модель доступа, обслуживание таблиц Iceberg, time-travel, ускорение аналитических запросов.
Регистрация: https://cedrusdata.timepad.ru/event/3426242/
cedrusdata.timepad.ru
Lakehouse Meetup #4: аналитическая экосистема на основе Trino в Avito, архитектура и возможности CedrusData Catalog / События на…
Обсудим, как за последние два года Avito выстроил аналитическую экосистему вокруг Trino, и рассмотрим внутреннее устройство и возможности CedrusData Catalog — современного бесплатного каталога для lakehouse-платформ.
Митап организован компанией Querify Labs…
Митап организован компанией Querify Labs…
👍16
Всем привет. Мы рады представить релиз CedrusData 458-12. Последние два месяца мы были сосредотоены на новом функционале каталога: ролевая модель доступа к объектам Iceberg, запуск maintenance операций Iceberg по расписанию, web-интерфейс CedrusData Catalog
Iceberg:
- ❗️Добавлена ролевая модель доступа к объектам Iceberg. Пользователи CedrusData Catalog теперь могут задавать права доступа, которые будут универсально применены ко всем движкам, работающим с данными Iceberg. Решение позволяет избавиться от необходимости использования сторонних решений для управления доступом
- ❗️Добавлена поддержка запуска maintenance операций по расписанию. Теперь вы можете задать cron выражение, после чего CedrusData Catalog начнет периодически обслуживать объекты Iceberg без необходимости использования внешних оркестраторов
- ❗️CedrusData Catalog получил новый современный web-интерфейс
SQL Server:
- Добавлена поддержка pushdown типа данных UNIQUEIDENTIFIER
Release notes:
- CedrusData: https://docs.cedrusdata.ru/458-12/release/release-458-12.html
- CedrusData Catalog: https://docs.cedrusdata.ru/catalog/458-12/release/release-458-12.html
Iceberg:
- ❗️Добавлена ролевая модель доступа к объектам Iceberg. Пользователи CedrusData Catalog теперь могут задавать права доступа, которые будут универсально применены ко всем движкам, работающим с данными Iceberg. Решение позволяет избавиться от необходимости использования сторонних решений для управления доступом
- ❗️Добавлена поддержка запуска maintenance операций по расписанию. Теперь вы можете задать cron выражение, после чего CedrusData Catalog начнет периодически обслуживать объекты Iceberg без необходимости использования внешних оркестраторов
- ❗️CedrusData Catalog получил новый современный web-интерфейс
SQL Server:
- Добавлена поддержка pushdown типа данных UNIQUEIDENTIFIER
Release notes:
- CedrusData: https://docs.cedrusdata.ru/458-12/release/release-458-12.html
- CedrusData Catalog: https://docs.cedrusdata.ru/catalog/458-12/release/release-458-12.html
👍13👌1
Всем привет!👋
Делимся записью прошедшего Lakehouse Meetup, где эксперты из Авито и CedrusData обсудили, как Trino и Apache Iceberg масштабируются в российских компаниях.
🔹Рассказываем, как в Авито построили экосистему вокруг Trino, которая обрабатывает до 1 ПБ данных в день и обслуживает 300 пользователей.
🔹Представляем CedrusData Catalog — бесплатное решение для управления метаданными в Apache Iceberg, которое уже сейчас решает ключевые задачи и имеет грандиозные планы на развитие.
📣 Хотите поделиться своим опытом или кейсом? Расскажите о нем, заполнив форму докладчика. Давайте создавать крутые митапы вместе!
Делимся записью прошедшего Lakehouse Meetup, где эксперты из Авито и CedrusData обсудили, как Trino и Apache Iceberg масштабируются в российских компаниях.
🔹Рассказываем, как в Авито построили экосистему вокруг Trino, которая обрабатывает до 1 ПБ данных в день и обслуживает 300 пользователей.
🔹Представляем CedrusData Catalog — бесплатное решение для управления метаданными в Apache Iceberg, которое уже сейчас решает ключевые задачи и имеет грандиозные планы на развитие.
Please open Telegram to view this post
VIEW IN TELEGRAM
CedrusData | Российская lakehouse-платформа
Trino в Авито. Возможности CedrusData Catalog | Lakehouse Meetup
Митап о практическом опыте развития Lakehouse как системы, а также о кейсах внедрения Trino и Iceberg в России
❤4👍1
Новый митап по Lakehouse уже в работе!
Ищем тех, кто готов рассказать про свой опыт использования Trino и Iceberg. Напишите о своем кейсе здесь.
Кстати, поддержать развитие канала и чата могут подписчики с Telegram Premium, отдав свой голос за нас.
Ждем вашей поддержки 🙏
Ищем тех, кто готов рассказать про свой опыт использования Trino и Iceberg. Напишите о своем кейсе здесь.
Кстати, поддержать развитие канала и чата могут подписчики с Telegram Premium, отдав свой голос за нас.
Ждем вашей поддержки 🙏
Google Docs
Lakehouse Meetup: заявка на доклад
Рассматриваемые темы докладов:
Опыт использования и внедрения Apache Iceberg и его каталогов
Опыт использования и внедрения Trino и связанных технологий
Опыт использования и внедрения Apache Iceberg и его каталогов
Опыт использования и внедрения Trino и связанных технологий
🥰2
23 сентября в Москве пройдет Data Internals X 2025 — конференция, где создатели СУБД и движков обработки данных делятся опытом работы с реальными production-системами экстремального масштаба.
🤩 Приглашаем всех участников к нам на стенд!
✅ Обсудим архитектурные решения и поделиться опытом.
✅ Ответим на вопросы, которые не гуглятся.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤1🔥1
Будем рады встретиться на конференции Smart Data уже в это воскресенье!
Владимир Озеров расскажет о перспективах развития Apache Iceberg:
🔹Планы развития (v3, безопасность, материализованные представления, scan planning, статистики и т. п.).
🔹Изменение роли REST-каталогов в экосистеме Iceberg.
🔹Вызовы и конкурентный ландшафт (near-real time сценарии, конкуренция с Paimon/Delta/DuckLake и т. п.).
🔹Состояние сообщества и его влияние на скорость развития и долгосрочные перспективы Apache Iceberg.
А пока делимся записью его прошлого выступления
Владимир Озеров расскажет о перспективах развития Apache Iceberg:
🔹Планы развития (v3, безопасность, материализованные представления, scan planning, статистики и т. п.).
🔹Изменение роли REST-каталогов в экосистеме Iceberg.
🔹Вызовы и конкурентный ландшафт (near-real time сценарии, конкуренция с Paimon/Delta/DuckLake и т. п.).
🔹Состояние сообщества и его влияние на скорость развития и долгосрочные перспективы Apache Iceberg.
А пока делимся записью его прошлого выступления
CedrusData | Российская lakehouse-платформа
Обработка данных в Data Lake с помощью Trino | Запись выступления
Как ключевые оптимизации и локальные кэши обеспечивают высокую производительность Trino при работе с озерами данных. Сравнение эффективности с классическими хранилищами
🔥19
Октябрь встречаем на конференции по инженерии данных Smart Data!
Приходите к нам на стенд! Расскажем всё самое интересное о Trino и CedrusData, ответим на любые вопросы.
А еще 5 октября Владимир Озеров, генеральный директор CedrusData, расскажет о перспективах развития Apache Iceberg.
✅ Где? СПб
✅ Когда? 5-6 октября
Приходите к нам на стенд! Расскажем всё самое интересное о Trino и CedrusData, ответим на любые вопросы.
А еще 5 октября Владимир Озеров, генеральный директор CedrusData, расскажет о перспективах развития Apache Iceberg.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5🐳2👾1
Вы нас просили — мы сделали: настоящий бенчмарк lakehouse-движков!
Шесть конкурсантов:
клан Presto (CedrusData, Presto, Trino) против клана Impala (Doris, Impala, StarRocks).
DuckDB в качестве арбитра.
🏆Победит сильнейший, остальные отправятся на свалку истории! Правда, будет только один SQL-запрос, один узел и много database internals.
Шесть конкурсантов:
клан Presto (CedrusData, Presto, Trino) против клана Impala (Doris, Impala, StarRocks).
DuckDB в качестве арбитра.
🏆Победит сильнейший, остальные отправятся на свалку истории! Правда, будет только один SQL-запрос, один узел и много database internals.
Хабр
Бенчмарк lakehouse-движков, часть 1: StarRocks и Doris падают под нагрузкой, Presto аутсайдер, CedrusData быстрее всех
Clickbait-картинка В этой статье мы детально рассмотрим поведение аналитических движков при выполнении TPC-DS запроса Q1 на одном узле. Этот ограниченный тест даст нам столько информации к...
🔥31🤡19🤯7❤4⚡1
Обсудили тренд на Native Execution в Data Engineering инструментах и, в частности, потенциал C++ библиотеки Velox для ускорения Presto, Spark и других аналитических систем. Рассмотрели основные и наиболее зрелые на текущий момент интеграции этой библиотеки с существующими популярными OLAP-/ ML-системами.
CedrusData | Российская lakehouse-платформа
Выбрасываем Java и кратно ускоряем Spark/Trino… Или пока нет? | Запись выступления | CedrusData
Velox — высокопроизводительная C++ библиотека для ускорения Presto, Spark, аналитических СУБД. Обсуждаем архитектуру, преимущества и готовность к использованию
🔥7❤3👏2
Каждая компания сегодня живёт в зоопарке технологий: данные хранятся в десятках источников (от PostgreSQL до S3), а запросы приходится собирать из кусочков SQL, Python и R. Между ними — стена несовместимых диалектов, потерянных оптимизаций и бесконечных конекторов. Substrait предлагает элегантное решение — единый универсальный язык описания запросов, понятный и аналитическим DSL, и движкам исполнения.
Substrait превращает SQL-строки в переносимые планы, избавляя от боли диалектов и давая возможность свободно комбинировать системы — от DuckDB и Velox до Spark и DataFusion. Это шаг к экосистеме, где любой frontend может говорить с любым backend без потери смысла и производительности.
Substrait превращает SQL-строки в переносимые планы, избавляя от боли диалектов и давая возможность свободно комбинировать системы — от DuckDB и Velox до Spark и DataFusion. Это шаг к экосистеме, где любой frontend может говорить с любым backend без потери смысла и производительности.
Хабр
Substrait — lingua franca для баз данных
Substrait — это промежуточный формат (IR) для обмена планами запросов между системами. Он снимает боль диалектов SQL, позволяет делать pushdown в разные бэкенды и избавляет от повторного...
👍3🔥3💩3😁2💯2
Всем привет
9 декабря состоится десятый митап сообщества разработчиков СУБД Database Internals
В рамках мероприятия мы представим доклад, посвященный разработке акселератора запросов Trino на основе Rust, Apache Arrow и DataFusion.
Митап пройдет в рамках ежегодной конференции ИСП РАН на площадке кластера «Ломоносов». Также доступен онлайн формат.
Для участия необходимо зарегистрироваться на официальном сайте ИСП РАН до 6 декабря.
9 декабря состоится десятый митап сообщества разработчиков СУБД Database Internals
В рамках мероприятия мы представим доклад, посвященный разработке акселератора запросов Trino на основе Rust, Apache Arrow и DataFusion.
Митап пройдет в рамках ежегодной конференции ИСП РАН на площадке кластера «Ломоносов». Также доступен онлайн формат.
Для участия необходимо зарегистрироваться на официальном сайте ИСП РАН до 6 декабря.
🔥9👍3🥰2
В 16:00 начинаем доклад про переписывание ядра Trino на Rust.
Ссылки на трансляции доступны на странице Database Internals Meetup #10: https://databaseinternals.timepad.ru/event/3698395/
Ссылки на трансляции доступны на странице Database Internals Meetup #10: https://databaseinternals.timepad.ru/event/3698395/
databaseinternals.timepad.ru
Database Internals Meetup #10 (офлайн + онлайн): 5 докладов на конференции ISPRAS Open / События на TimePad.ru
Десятый митап российского сообщества разработчиков СУБД и распределенных систем. Программа в пять докладов про PostgreSQL, Data Fusion, графовые СУБД и применение JIT в компиляции запросов.
🔥12👍2
План на сегодня: гирлянды, мандарины и… миграция DWH 🍾
Пока мир делится итогами, мы нашли идеальный материал для последнего рабочего дня этого года. Статья Дмитрия Реймана из Авито «Есть ли жизнь после Vertica или миграция DWH в Lakehouse»
Пока мир делится итогами, мы нашли идеальный материал для последнего рабочего дня этого года. Статья Дмитрия Реймана из Авито «Есть ли жизнь после Vertica или миграция DWH в Lakehouse»
Хабр
Есть ли жизнь после Vertica или миграция DWH в Lakehouse
Всем привет! Меня зовут Дмитрий Рейман, я техлид аналитической платформы Авито. Последний раз мы подробно писали о нашей платформе почти четыре года назад – в статье «Эволюция хранилища данных в...
🔥11❤2
Мы переписали ядро Trino с Java на Rust!
В новой статье рассказываем, почему выбрали Rust и DataFusion в качестве основы решения, с какими сложностями столкнулись и какие очевидные (и неочевидные) преимущества получили в результате.
В новой статье рассказываем, почему выбрали Rust и DataFusion в качестве основы решения, с какими сложностями столкнулись и какие очевидные (и неочевидные) преимущества получили в результате.
Хабр
Как мы переписали ядро Trino на Rust
CedrusData Engine — это lakehouse-движок, основанный на Trino . На реальных пользовательских нагрузках наш продукт рутинно превосходит по производительности другие технологии (Trino, Doris, Dremio,...
🔥22❤3👍3😁2