El ARFF (Attribute-Relation File Format) es un formato de archivo de texto desarrollado por el Machine Learning Group de la Universidad de Waikato para describir conjuntos de datos utilizados en el aprendizaje automático (machine learning). Se utiliza principalmente con el software WEKA (Waikato Environment for Knowledge Analysis), aunque también es compatible con otras herramientas de minería de datos y aprendizaje automático. Un archivo ARFF consta de una sección de encabezado (header) y una sección de datos (data). El encabezado define el nombre de la relación (nombre del conjunto de datos) y los atributos (características o columnas) de los datos. Cada atributo se declara con su nombre y tipo de datos, como numérico (numeric), nominal, cadena (string) o fecha (date). La sección de datos contiene las instancias reales, donde cada una se representa como una lista de valores de atributos separados por comas. Los valores faltantes suelen representarse mediante un signo de interrogación (?). Los archivos ARFF están diseñados para ser legibles por humanos y fáciles de procesar por algoritmos de aprendizaje automático, lo que los convierte en una opción popular para almacenar e intercambiar conjuntos de datos en la comunidad científica. El formato admite diversos tipos de datos y permite la representación de datos tanto numéricos como categóricos, lo que le otorga una gran versatilidad para una amplia gama de tareas de análisis de datos.