L'ARFF (Attribute-Relation File Format) è un formato di file di testo sviluppato dal Machine Learning Group dell'Università di Waikato per descrivere i dataset utilizzati nell'apprendimento automatico (machine learning). È utilizzato principalmente con il software WEKA (Waikato Environment for Knowledge Analysis), ma è supportato anche da altri strumenti di machine learning. Un file ARFF è costituito da una sezione di intestazione (header section) e una sezione di dati (data section). La sezione di intestazione definisce il nome della relazione (dataset name) e gli attributi (feature o colonne) dei dati. Ciascun attributo è dichiarato con il suo nome e il tipo di dato (ad esempio, numerico, nominale, stringa, data). La sezione dati contiene le istanze di dati effettive, con ogni istanza rappresentata come un elenco separato da virgole dei valori degli attributi. I valori mancanti sono tipicamente rappresentati da un punto interrogativo (?). I file ARFF sono progettati per essere leggibili dall'uomo e facilmente analizzabili dagli algoritmi di machine learning, rendendoli una scelta popolare per l'archiviazione e lo scambio di dataset nella comunità del machine learning. Il formato supporta vari tipi di dati e consente la rappresentazione sia di dati numerici che categorici, rendendolo versatile per un'ampia gamma di compiti di machine learning.