parquet

¿Cuáles son los pros y los contras del formato de parquet en comparación con otros formatos?

Las características de Apache Parquet son: Autodescripción Formato columnar Independiente del lenguaje En comparación ... cceso a los datos y el almacenamiento de datos en cada uno de estos formatos. Cómo parquet tiene una ventaja sobre el ¿otros?

Spark admite escaneos de columna verdaderos sobre archivos de parquet en S3?

Una de las grandes ventajas del formato de almacenamiento de datos de Parquet es que es columnar. Si tengo un conjunto de da ... ble con S3, pero hay una gran diferencia entre el soporte teórico y una implementación que explota adecuadamente ese soporte.