O formato de Fluxo IPC Apache Arrow (.arrow) é um formato de arquivo binário projetado para transferência e armazenamento eficiente de dados, particularmente dentro do ecossistema Apache Arrow. É um formato de memória colunar, o que significa que os dados são organizados por colunas em vez de linhas, o que é altamente benéfico para cargas de trabalho analíticas. Este formato facilita o compartilhamento de dados sem cópia (zero-copy) entre processos e sistemas, reduzindo significativamente a sobrecarga e melhorando o desempenho. Os fluxos IPC Arrow são tipicamente usados para transferir grandes conjuntos de dados entre aplicações que suportam o formato Arrow, como motores de processamento de dados, bancos de dados e frameworks de aprendizado de máquina. O formato inclui metadados que descrevem o esquema dos dados, permitindo uma troca de dados auto-descritiva. É otimizado para serialização e desserialização rápidas, tornando-o ideal para processamento de dados em tempo real e computação de alto desempenho. O formato é agnóstico à linguagem, com implementações disponíveis em várias linguagens de programação, incluindo Python, Java, C++ e R. A extensão de arquivo .arrow tipicamente representa um fluxo de dados Arrow, que pode ser um único lote (batch) ou uma sequência de lotes representando um conjunto de dados maior. O formato é projetado para ser extensível e suporta vários tipos de dados e codificações.