O ARFF (Attribute-Relation File Format), ou Formato de Arquivo de Relação de Atributos, é um formato de arquivo de texto desenvolvido pelo Grupo de Aprendizado de Máquina (Machine Learning Group) da Universidade de Waikato. Este formato de categoria 'dados' é especificamente projetado para descrever conjuntos de dados (datasets) utilizados no campo de machine learning (aprendizado de máquina). O ARFF é predominantemente utilizado com o software WEKA (Waikato Environment for Knowledge Analysis), mas também é amplamente suportado por outras ferramentas de machine learning. Um arquivo ARFF é estruturado em duas partes principais: uma seção de cabeçalho (header) e uma seção de dados (data). A seção de cabeçalho define o nome da relação (o nome do conjunto de dados) e especifica os atributos, que correspondem às características (features) ou colunas dos dados. Cada atributo é declarado com seu nome e tipo de dado associado, como numérico, nominal, string ou data. A seção de dados contém as instâncias reais dos dados, onde cada instância é representada como uma lista de valores de atributos separada por vírgulas. Valores ausentes (missing values) são convencionalmente indicados por um ponto de interrogação (?). Os arquivos ARFF são valorizados por serem legíveis por humanos e facilmente processáveis por algoritmos de machine learning, o que os torna uma escolha popular para o armazenamento e intercâmbio de conjuntos de dados. O formato é versátil, suportando diversos tipos de dados e permitindo a representação tanto de dados numéricos quanto categóricos, adequando-se a uma vasta gama de tarefas de aprendizado de máquina.