Apache Arrow IPC 스트림 형식(.arrow)은 특히 Apache Arrow 생태계 내에서 효율적인 데이터 전송 및 저장을 위해 설계된 바이너리 파일 형식입니다. 이는 열 기반 메모리 형식(columnar memory format)으로, 데이터가 행이 아닌 열별로 구성되어 분석 워크로드에 매우 유리합니다. 이 형식은 프로세스와 시스템 간의 제로 카피(zero-copy) 데이터 공유를 용이하게 하여 오버헤드를 크게 줄이고 성능을 향상시킵니다. Arrow IPC 스트림은 일반적으로 데이터 처리 엔진, 데이터베이스, 머신러닝 프레임워크와 같이 Arrow 형식을 지원하는 애플리케이션 간에 대용량 데이터 세트를 전송하는 데 사용됩니다. 이 형식에는 데이터의 스키마를 설명하는 메타데이터가 포함되어 있어 자체 설명(self-describing) 데이터 교환이 가능합니다. 빠른 직렬화 및 역직렬화에 최적화되어 실시간 데이터 처리 및 고성능 컴퓨팅에 이상적입니다. 이 형식은 언어에 구애받지 않으며(language-agnostic), Python, Java, C++, R을 포함한 다양한 프로그래밍 언어로 구현체가 제공됩니다. .arrow 파일 확장자는 일반적으로 단일 배치(batch)이거나 더 큰 데이터 세트를 나타내는 배치 시퀀스일 수 있는 Arrow 데이터 스트림을 나타냅니다. 이 형식은 확장 가능하도록 설계되었으며 다양한 데이터 유형 및 인코딩을 지원합니다.