ARFF (Attribute-Relation File Format) представляет собой текстовый формат файлов, разработанный группой машинного обучения Университета Уайкато (University of Waikato) для описания наборов данных, применяемых в задачах машинного обучения. В первую очередь он предназначен для использования с программным обеспечением WEKA (Waikato Environment for Knowledge Analysis), однако его также поддерживают многие другие инструменты анализа данных. Файл ARFF состоит из двух основных разделов: заголовка (header) и данных (data). В разделе заголовка определяются название отношения (имя набора данных) и его атрибуты, которые представляют собой признаки или столбцы данных. Каждый атрибут описывается своим именем и типом данных, таким как числовой (numeric), номинальный (nominal), строковый (string) или дата (date). Раздел данных содержит непосредственные записи, где каждый экземпляр представлен в виде списка значений атрибутов, разделенных запятыми. Пропущенные значения в этом формате обычно обозначаются вопросительным знаком (?). Файлы ARFF спроектированы так, чтобы быть удобными для чтения человеком и легко обрабатываться алгоритмами машинного обучения, что делает их популярным выбором для хранения и обмена датасетами в научном сообществе. Формат универсален, так как поддерживает различные типы данных и позволяет представлять как числовую, так и категориальную информацию для широкого спектра задач машинного обучения.