El formato de Flujo IPC (Inter-Process Communication) de Apache Arrow (.arrow) es un formato de archivo binario diseñado para la transferencia y el almacenamiento eficiente de datos, particularmente dentro del ecosistema de Apache Arrow. Es fundamentalmente un formato de memoria columnar (columnar memory format), lo que implica que los datos se organizan por columnas en lugar de filas. Esta estructura es extremadamente ventajosa para las cargas de trabajo analíticas (analytical workloads). Este formato facilita el intercambio de datos de 'copia cero' (zero-copy data sharing) entre procesos y sistemas, lo que reduce significativamente la sobrecarga (overhead) y mejora el rendimiento general. Los flujos IPC de Arrow se utilizan habitualmente para transferir grandes conjuntos de datos entre aplicaciones que admiten el formato Arrow, como motores de procesamiento de datos, bases de datos y frameworks de aprendizaje automático (machine learning frameworks). El formato incluye metadatos detallados que describen el esquema (schema) de los datos, permitiendo un intercambio de datos autodescriptivo. Está optimizado para una rápida serialización y deserialización, haciéndolo ideal para el procesamiento de datos en tiempo real y la computación de alto rendimiento (high-performance computing). El formato es agnóstico al lenguaje (language-agnostic), con implementaciones disponibles en lenguajes de programación populares como Python, Java, C++ y R. La extensión de archivo .arrow representa típicamente un flujo de datos Arrow, que puede ser un solo lote (batch) o una secuencia de lotes que representan un conjunto de datos más grande. El formato está diseñado para ser extensible y admite una amplia variedad de tipos de datos y codificaciones.