DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_128

🔠Что за формат данных Apache ORC ?

👉Ответ: Apache ORC (Optimized Row Columnar) — это формат хранения данных, разработанный Apache Software Foundation. Он предназначен для эффективного и компактного хранения структурированных данных, особенно для аналитических нагрузок.

ORC представляет собой гибридный формат, который использует преимущества как строкового, так и столбцового подходов к хранению данных. Данные в ORC-файлах организованы в столбцах, что позволяет эффективно сжимать и быстро обрабатывать отдельные столбцы. Это помогает улучшить производительность при выполнении запросов, так как обычно только несколько столбцов данных должны быть прочитаны для выполнения операции.

Кроме того, ORC поддерживает различные методы сжатия данных, включая Snappy, Zlib и LZO, что позволяет сократить размер файла и увеличить скорость чтения и записи.

😎Ссылка: https://habr.com/ru/companies/alfastrah/articles/458552/

#apache #orc #hadoop