Avro는 Apache Hadoop 프로젝트 내에서 개발된 데이터 직렬화 시스템입니다. 이는 풍부한 데이터 구조, 간결하고 빠른 바이너리 데이터 형식, 영구 데이터를 저장하기 위한 컨테이너 파일, 원격 프로시저 호출(RPC) 및 간단한 동적 언어 통합 기능을 제공합니다. Avro는 데이터 유형과 프로토콜을 정의하는 데 JSON을 사용하며, 데이터를 간결한 바이너리 형식으로 직렬화합니다. 주요 용도는 Hadoop에서 데이터 직렬화 및 데이터 교환 서비스에 사용되는 것입니다. Avro는 스키마를 데이터와 함께 저장하므로 스키마 진화가 필요한 애플리케이션에 특히 적합합니다. 이는 데이터가 작성된 이후 스키마가 변경되었더라도 리더가 데이터를 처리할 수 있도록 허용합니다. Avro의 스키마 진화 기능은 효율적인 바이너리 형식과 결합되어 빅 데이터 환경에서 데이터 저장 및 교환을 위한 인기 있는 선택이 되게 합니다. 복잡한 데이터 유형을 지원하며 데이터 읽기 및 쓰기 모두에서 높은 성능을 발휘하도록 설계되었습니다. Avro 파일은 분산 방식으로 대규모 데이터 세트를 저장하는 데 자주 사용됩니다.