❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_128
🔠Что за формат данных Apache ORC ?
👉Ответ: Apache ORC (Optimized Row Columnar) — это формат хранения данных, разработанный Apache Software Foundation. Он предназначен для эффективного и компактного хранения структурированных данных, особенно для аналитических нагрузок.
ORC представляет собой гибридный формат, который использует преимущества как строкового, так и столбцового подходов к хранению данных. Данные в ORC-файлах организованы в столбцах, что позволяет эффективно сжимать и быстро обрабатывать отдельные столбцы. Это помогает улучшить производительность при выполнении запросов, так как обычно только несколько столбцов данных должны быть прочитаны для выполнения операции.
Кроме того, ORC поддерживает различные методы сжатия данных, включая Snappy, Zlib и LZO, что позволяет сократить размер файла и увеличить скорость чтения и записи.
😎Ссылка: https://habr.com/ru/companies/alfastrah/articles/458552/
#apache #orc #hadoop
🔠Что за формат данных Apache ORC ?
👉Ответ: Apache ORC (Optimized Row Columnar) — это формат хранения данных, разработанный Apache Software Foundation. Он предназначен для эффективного и компактного хранения структурированных данных, особенно для аналитических нагрузок.
ORC представляет собой гибридный формат, который использует преимущества как строкового, так и столбцового подходов к хранению данных. Данные в ORC-файлах организованы в столбцах, что позволяет эффективно сжимать и быстро обрабатывать отдельные столбцы. Это помогает улучшить производительность при выполнении запросов, так как обычно только несколько столбцов данных должны быть прочитаны для выполнения операции.
Кроме того, ORC поддерживает различные методы сжатия данных, включая Snappy, Zlib и LZO, что позволяет сократить размер файла и увеличить скорость чтения и записи.
😎Ссылка: https://habr.com/ru/companies/alfastrah/articles/458552/
#apache #orc #hadoop