#db #duckdb #columnar #featurestore
Что интересно, запросы слать в duckdb можно через psycopg, и используется PostgreSQL диалект. Ингест из файлов, судя по презенташке, очень быстрый. Поддерживает сжатие. Колоночная СУБД. Может читать в сессии питона напрямую из фреймов пандас и массивов нампай. Кандидат на featurestore?
https://www.youtube.com/watch?v=q_SKaOeRiOI
Что интересно, запросы слать в duckdb можно через psycopg, и используется PostgreSQL диалект. Ингест из файлов, судя по презенташке, очень быстрый. Поддерживает сжатие. Колоночная СУБД. Может читать в сессии питона напрямую из фреймов пандас и массивов нампай. Кандидат на featurestore?
https://www.youtube.com/watch?v=q_SKaOeRiOI
YouTube
Gábor Szárnyas - DuckDB: The Power of a Data Warehouse in your Python Process
Gábor Szárnyas, a Developer Relations Advocate and Technical Writer at DuckDB Labs, provides a talk on “DuckDB: The Power of a Data Warehouse in your Python Process.”
DuckDB is an in-process analytical database management system, a powerful data warehouse…
DuckDB is an in-process analytical database management system, a powerful data warehouse…
#duckdb #polars #performance
https://towardsdatascience.com/python-one-billion-row-challenge-from-10-minutes-to-4-seconds-0718662b303e
https://towardsdatascience.com/python-one-billion-row-challenge-from-10-minutes-to-4-seconds-0718662b303e
Towards Data Science
Python One Billion Row Challenge - From 10 Minutes to 4 Seconds | Towards Data Science
The one billion row challenge is exploding in popularity. How well does Python stack up?
#polars #pandas #duckdb
Надо переходить на поларс, похоже. Ну или на уткобазу )
Особенно интересны в поларсе абстрактные выражения, стриминговый режим, поддержка тензоров pytorch и (будущая) интеграция с rapids,чтоб он считал на GPU. Это будет вааще бомба.
https://www.youtube.com/watch?v=LXz69qQVy5U
Надо переходить на поларс, похоже. Ну или на уткобазу )
Особенно интересны в поларсе абстрактные выражения, стриминговый режим, поддержка тензоров pytorch и (будущая) интеграция с rapids,чтоб он считал на GPU. Это будет вааще бомба.
https://www.youtube.com/watch?v=LXz69qQVy5U
YouTube
Михаил Архипов, Павел Цветов | Сын маминой подруги: Может ли Polars заменить Pandas?
Спикеры: Михаил Архипов, Павел Цветов, Мир Plat.Form Data Scientist, занимаемся задачами прикладного анализа больших данных и ML-разработкой в команде Центра транзакционной аналитики НСПК
Тема доклада: в рамках доклада, мы расскажем как начали использовать…
Тема доклада: в рамках доклада, мы расскажем как начали использовать…
👍1
#dask #polars #duckdb
Что-то не верю я этим тестам. поларс медленнее даска? Да когда такое было? И как вдруг чудесным образом у даска заработал оптимизатор, если синтаксис вызовов не поменялся? У поларс то он возможен, потому что синтаксис операций на фрейме совсем другой.
https://www.youtube.com/watch?v=qyvLJ2LvKLc
Что-то не верю я этим тестам. поларс медленнее даска? Да когда такое было? И как вдруг чудесным образом у даска заработал оптимизатор, если синтаксис вызовов не поменялся? У поларс то он возможен, потому что синтаксис операций на фрейме совсем другой.
https://www.youtube.com/watch?v=qyvLJ2LvKLc
YouTube
Pandas + Dask DataFrame 2.0 - Comparison to Spark, DuckDB and Polars [PyCon DE & PyData Berlin 2024]
🔊 Recorded at PyCon DE & PyData Berlin 2024, 23.04.2024
https://2024.pycon.de/program/N9DEVW/
🎓 Watch how Dask DataFrame 2.0's improved performance and new features compare to Spark, DuckDB, and Polars, offering a faster and more robust system for big data…
https://2024.pycon.de/program/N9DEVW/
🎓 Watch how Dask DataFrame 2.0's improved performance and new features compare to Spark, DuckDB, and Polars, offering a faster and more robust system for big data…
#duckdb #coiled
Уткобазу ещё не пробовал в чём-то серьёзном.
https://www.youtube.com/watch?v=qSs5ALVbzTk
Уткобазу ещё не пробовал в чём-то серьёзном.
https://www.youtube.com/watch?v=qSs5ALVbzTk
YouTube
Adarsh Namala - Scaling Outside the Warehouse Using DuckDB and Python | PyData Global 2024
www.pydata.org
DuckDB is revolutionizing data processing by enabling in-memory OLAP SQL operations with a lightweight, dependency-free architecture. This talk explores how DuckDB can be leveraged to handle large-scale, massively parallel data processing…
DuckDB is revolutionizing data processing by enabling in-memory OLAP SQL operations with a lightweight, dependency-free architecture. This talk explores how DuckDB can be leveraged to handle large-scale, massively parallel data processing…