Weka (машинное обучение)


Waikato Environment for Knowledge Analysis ( Weka ), разработанная в Университете Вайкато , Новая Зеландия , представляет собой бесплатное программное обеспечение под лицензией GNU General Public License и сопутствующее программное обеспечение для книги «Интеллектуальный анализ данных: практические инструменты и методы машинного обучения». [1]

Weka содержит набор инструментов визуализации и алгоритмов для анализа данных и прогнозного моделирования вместе с графическими пользовательскими интерфейсами для легкого доступа к этим функциям. [1] Первоначальная не-Java версия Weka представляла собой интерфейс Tcl / Tk для (в основном сторонних) алгоритмов моделирования, реализованных на других языках программирования, плюс утилиты предварительной обработки данных на C и система на основе makefile для запуска машины . обучающие эксперименты. Эта первоначальная версия была в первую очередь разработана как инструмент для анализа данных из сельскохозяйственных доменов, [2] [3] , но более поздняя полностью Java-версия (Weka 3), разработка которой началась в 1997 году, в настоящее время используется во многих различных областях применения, в частности, в образовательных целях и исследованиях. Преимущества Weka включают в себя:

Weka поддерживает несколько стандартных задач интеллектуального анализа данных , в частности, предварительную обработку данных, кластеризацию , классификацию , регрессию , визуализацию и выбор признаков . Ожидается, что входные данные для Weka будут отформатированы в соответствии с форматом файла атрибутов и реляцией, а имя файла будет иметь расширение .arff. Все методы Weka основаны на предположении, что данные доступны в виде одного плоского файла или отношения, где каждая точка данных описывается фиксированным количеством атрибутов (обычно это числовые или номинальные атрибуты, но также поддерживаются некоторые другие типы атрибутов). . Weka предоставляет доступ к базам данных SQL с помощью Java Database Connectivity.и может обрабатывать результат, возвращаемый запросом к базе данных. Weka предоставляет доступ к глубокому обучению с помощью Deeplearning4j . [4] Он не способен к многореляционному анализу данных, но существует отдельное программное обеспечение для преобразования набора связанных таблиц базы данных в единую таблицу, пригодную для обработки с помощью Weka. [5] Другой важной областью, которая в настоящее время не охвачена алгоритмами, включенными в дистрибутив Weka, является моделирование последовательностей.

В версии 3.7.2 был добавлен менеджер пакетов, упрощающий установку пакетов расширений. [6] Некоторые функции, которые раньше были включены в Weka до этой версии, с тех пор были перенесены в такие пакеты расширений, но это изменение также упрощает для других внесение расширений в Weka и поддержку программного обеспечения, поскольку эта модульная архитектура позволяет самостоятельные обновления ядра Weka и отдельных расширений.