O HDF5 (Hierarchical Data Format version 5) é um formato de arquivo versátil e de código aberto (open-source) projetado para armazenar e organizar grandes volumes de dados numéricos. É particularmente adequado para aplicações científicas e de engenharia, onde os conjuntos de dados (datasets) são frequentemente complexos, heterogêneos e exigem armazenamento e recuperação eficientes. Ao contrário de formatos mais simples, como CSV ou texto simples, o HDF5 permite o armazenamento de múltiplos conjuntos de dados dentro de um único arquivo, juntamente com metadados que descrevem a estrutura dos dados, unidades e outras informações relevantes. Essa estrutura hierárquica permite aos usuários organizar os dados de forma lógica, facilitando a navegação e o acesso a subconjuntos específicos de informações. O HDF5 suporta uma ampla gama de tipos de dados, incluindo números inteiros (integers), números de ponto flutuante (floating-point numbers), strings e arrays, e pode lidar com conjuntos de dados que são muito maiores do que a memória disponível. Sua natureza autodescritiva (self-describing) garante que os dados possam ser interpretados corretamente mesmo sem documentação externa. O formato também suporta compressão, o que pode reduzir significativamente o tamanho dos arquivos, e 'chunking' (divisão em blocos), que permite o acesso eficiente a subconjuntos de dados sem carregar o arquivo inteiro na memória. Devido à sua flexibilidade e desempenho, o HDF5 é amplamente utilizado em áreas como astronomia, ciência climática, imagens médicas e dinâmica de fluidos computacional.