Сочетание DuckDB и PyArrow позволяет эффективно обрабатывать на одной машине массивы данных, превышающие объем памяти.
В приведенном ниже коде запуск DuckDB на наборе данных
#PyArrow примерно в 2906 раз быстрее, чем запуск
#DuckDB на
#pandas DataFrame.
▪Pyarrow▪DuckDB#tips@sqlhub